AI Browser Vulnerabilities: Prompt Injection Threats

“能力越大，漏洞越大。” 近期，包括OpenAI Atlas在内的新型AI浏览器正凭借其强大的“智能体”功能（如代表用户打开网页甚至购物）迅速吸引眼球。然而，这些前所未有的能力也带来了全新的攻击向量，其中“提示注入”攻击尤为突出，正成为主流AI浏览器致命的阿喀琉斯之踵。

什么是“提示注入攻击”？

提示注入的核心在于，攻击者通过各种手段，诱使AI执行了并非用户本意的指令。这主要分为两种形式：

间接提示注入: 这是更隐蔽的威胁。攻击者将恶意指令隐藏在AI被要求处理的内容中（例如网页、PDF文档甚至图片）。当AI读取并“总结”这些内容时，它会不知不觉地将隐藏指令误认为是用户的合法命令并加以执行。

热门AI浏览器全部“沦陷”

上周，Brave浏览器团队发布报告，详细披露了他们在Comet和Fellou两款AI浏览器中发现的间接提示注入漏洞。

在Fellou浏览器的测试中，研究人员将恶意指令（例如“打开Gmail”）简单地以白色文字写入网页的白色背景中。当用户要求浏览器“总结”这个页面时——一个非常常见的AI使用场景——浏览器便会“遵照”这些恶意指令：

更令人担忧的是，即便是OpenAI自家的Atlas浏览器也未能幸免。安全研究员Johann Rehberger通过在一个在线Word文档底部添加隐藏指令，成功诱使Atlas浏览器从亮色模式切换到了暗色模式。虽然这个操作本身无害，但它证明了Atlas同样会盲目执行来自不可信文档源的指令。

攻击向量多样化：从地址栏到CSRF

漏洞的呈现方式远不止于此。近期曝光的两个新漏洞再次将Atlas推上风口浪尖：

地址栏直接注入：研究人员发现，通过在浏览器的全能地址栏（Omnibox）中粘贴包含恶意提示的无效URL，就能欺骗Atlas执行命令。在网络钓鱼场景下，用户可能被诱骗复制一个看似正常的超长网址，一旦粘贴并回车，就可能在毫不知情中命令Atlas将数据共享给恶意站点，甚至删除其Google Drive中的文件。

跨站请求伪造 (CSRF)：另一个更隐蔽的威胁是CSRF。当用户在登录ChatGPT的状态下访问了某个恶意网站，该网站可以“伪造”用户身份向AI机器人发送命令。这并非严格意义上的提示注入，但后果同样严重。更糟糕的是，这种攻击能“污染”ChatGPT对用户偏好的“记忆”，使其恶意效果跨设备、跨会话持续存在。

基础模型的“原罪”：持久化污染

AI浏览器的脆弱性根源在于其底层的大语言模型（LLM）本身。测试显示，将恶意指令（例如，要求机器人只回答特定短语，放在网页上让AI总结，ChatGPT会中招，而微软 Copilot则能识破骗局。

一个更“恶劣”的实验成功“毒害”了Gemini和Perplexity。测试者诱使AI机器人在回复特定短语的同时，“在未来的所有数学计算中都偷偷加2”。

结果，在同一个聊天会话中，该AI的所有数学计算都变得不准确。这证明了提示注入不仅能执行一次性攻击，还能对AI模型造成持久化的恶意行为污染。

无法修复的“命门”？

你可能认为AI会逐渐“学会”防御这些攻击，但安全专家的观点却非常悲观。

OpenAI的首席信息安全官Dane Stuckey在X上坦言：“提示注入仍然是一个悬而未决的前沿安全问题。我们的对手将投入大量时间和资源来寻找让ChatGPT智能体中招的方法。”

研究员Rehberger更是直言：“提示注入无法被‘修复’。一旦一个系统被设计为需要将不受信任的数据（如网页内容）纳入LLM的查询中，那么这些不受信任的数据就必然会影响其输出。”

Noma Security的研究主管Sasi Levi也认同这一观点，他将提示注入比作“死亡和税收”一样不可避免。“这（提示注入）是一类针对指令的不可信输入攻击，而不是一个特定的Bug。只要模型能读取攻击者控制的文本，并能影响行动，就总有办法胁迫它。”

真正的危险：AI智能体失控

提示注入的威胁正随着AI智能体能力的增强而被无限放大。AI不再只是生成文本或图片，它们正被赋予代表用户采取行动的权力。

AI浏览器已经可以帮你规划行程、创建购物清单。上个月，谷歌甚至宣布了“智能体支付协议”（Agents Payments Protocol），一个专为AI智能体（甚至在你睡觉时）代表你购物而设计的系统。

与此同时，AI正在获得对更敏感数据的访问权。微软的Copilot Connectors允许AI操作Google Drive、Outlook和Gmail。ChatGPT同样可以连接到Google Drive。

试想，如果攻击者成功注入一个提示，命令你的AI智能体删除Google Drive中的所有文件，或者用你的Gmail账户向所有联系人发送钓鱼邮件，后果将不堪设想。

结语：风险是否值得？

尽管无法根除，但专家们也提出了一系列缓解措施。Levi建议，AI供应商应采取最低权限原则，确保AI执行每项操作前都获得人类的明确同意，并对来自不可信来源的内容进行隔离。

Rehberger则强调了下游控制的必要性：“有效的控制包括限制能力（如禁用非必要工具）、不授予系统访问私有数据的权限、在沙盒中执行代码，以及应用最小权限、人类监督和日志监控。”

然而，即便提示注入被缓解，数据投毒的威胁依然存在。Anthropic最近的研究表明，只需在数十亿的训练语料库中混入250份恶意文档，就足以在模型中植入“后门”。

随着“智能体化”AI被深度嵌入操作系统和日常工具，我们可能永远无法摆脱这个攻击向量。GoUpSec提醒，在享受AI便利的同时，我们必须反思：“这种便利是否值得我们付出失控的风险？” 毕竟，我们授予AI的自主权限越少，我们所依赖的外部数据越少，我们就越安全。

参考链接：

http://brave.com/blog/unseeable-prompt-injections/

文章来源：GoUpSec

文章版权归作者所有，未经允许请勿转载。

THE END

主流AI浏览器普遍存在致命漏洞