【CNMO 科技消息】CNMO 从外媒获悉,安全研究人员开发出一种新型攻击技术——通过篡改图片窃取用户敏感数据。该技术利用普遍集成的 AI 模型漏洞,由安全公司 Trail of Bits 的 Kikimora Morozova 和 Suha Sabi Hussain 提出,基于 2020 年布伦瑞克工业大学提出的 " 图像缩放攻击 " 概念。
该技术的核心原理在于 AI 系统为节省算力会自动缩小上传的图片,采用 " 最近邻插值 " 双线性 " 或 " 双三次 " 等重采样算法。这导致原始图中隐藏的特定图案在缩小后显现——人眼难以察觉,但语言模型可读取。实验中,研究人员通过暗色区域变红显现隐藏文本,诱使 AI 将其识别为合法指令。
攻击发生时用户毫无察觉,但系统后台可执行恶意命令。测试中,攻击者成功利用 "Gemini CLI" 工具将谷歌账户日历数据转发至第三方邮箱。
谷歌 Gemini
据悉,受影响平台包括谷歌 Gemini 系列(CLI/ 网页 /API/Vertex AI Studio)、安卓版 Google Assistant 及 Genspark 服务。为演示风险,研究人员开源了工具 "Anamorpher",可生成针对不同缩放算法的攻击图片。
那么,有哪些防御建议呢?限制上传图片尺寸、向用户展示缩放预览图、禁止自动执行安全敏感操作(尤其是图片文本提取)。研究人员强调,根本解决方案在于构建抗提示词注入攻击的鲁棒系统架构。
登录后才可以发布评论哦
打开小程序可以发布评论哦