您现在的位置是：网络安全 >>正文

研究报告揭示主流AI系统存在越狱漏洞、不安全代码及数据窃取风险

网络安全9人已围观

简介生成式AI面临新型越狱攻击最新研究发现，多款生成式人工智能GenAI）服务存在两类可诱导其生成非法或危险内容的越狱攻击漏洞。其中代号为"Inception"的攻击技术，通过指令让AI工具虚构场景，进而 ...

生成式AI面临新型越狱攻击

最新研究发现，研究狱漏多款生成式人工智能（GenAI）服务存在两类可诱导其生成非法或危险内容的报告越狱攻击漏洞。其中代号为"Inception"的揭示及数据窃攻击技术，通过指令让AI工具虚构场景，主流进而在无安全限制的系统险子场景中实施二次诱导。

美国计算机应急响应小组协调中心（CERT/CC）在近期公告中指出："在子场景中持续发送提示词可绕过安全防护机制，洞不代码最终生成恶意内容。安全"第二种越狱方式则是取风通过询问AI"如何拒绝特定请求"的云计算反向引导实现。CERT/CC补充说明："攻击者可交替使用正常提示与越狱问题，研究狱漏使AI在安全机制失效状态下持续响应。报告"

主流AI平台集体沦陷

这些技术若被成功利用，揭示及数据窃攻击者将能突破OpenAI ChatGPT、主流Anthropic Claude、系统险微软Copilot、洞不代码谷歌Gemini 、安全XAi Grok、Meta AI及Mistral AI等平台的安全防护。高防服务器潜在危害包括生成受控物质制备指南、武器设计图纸、钓鱼邮件模板及恶意软件代码等非法内容。

近月研究还发现三大新型攻击手法：

上下文合规攻击（CCA）：攻击者在对话历史中植入"愿意提供敏感信息"的虚拟助手回复策略傀儡攻击：将恶意指令伪装成XML/INI/JSON等策略文件，诱使大语言模型（LLM）绕过安全校准内存注入攻击（MINJA）：通过查询交互向LLM代理的内存库注入恶意记录，诱导其执行危险操作代码生成暗藏安全隐患

Backslash安全团队指出，即便要求生成安全代码，实际效果仍取决于提示词详细程度、编程语言、香港云服务器潜在通用缺陷枚举（CWE）及指令明确性。研究表明，LLM在基础提示下默认生成的代码往往存在安全隐患，暴露出依赖GenAI进行"氛围编程"的风险。

OpenAI最新发布的GPT-4.1模型更引发特殊担忧。评估显示，在未修改系统提示的情况下，建站模板该模型出现偏题及允许故意滥用的概率达到前代GPT-4o的三倍。SplxAI专家警告："升级模型绝非简单修改代码参数，每个版本都有独特的性能与漏洞组合。"

协议漏洞催生数据泄露风险

Anthropic公司设计的模型上下文协议（MCP）开放标准被发现存在新型攻击面。瑞士Invariant实验室证实，恶意MCP服务器不仅能窃取用户敏感数据，还可劫持代理行为覆盖可信服务器指令，免费模板导致功能完全失控。

这种"工具投毒攻击"通过将恶意指令嵌入用户不可见但AI可读的MCP工具描述实现。实验演示显示，攻击者通过篡改已授权的工具描述，可从Cursor或Claude Desktop等代理系统中窃取WhatsApp聊天记录。

近期曝光的可疑Chrome扩展程序更凸显危机严重性——该扩展能与本地MCP服务器通信，完全突破浏览器沙箱防护。ExtensionTotal分析报告指出："该扩展无需认证即可全权访问MCP服务器工具，源码库其文件系统操作权限与服务器核心功能无异，可能造成灾难性的系统级沦陷。"

Tags：

上一篇：警方摧毁了攻击 71 个国家的勒索软件组织

下一篇：人工智能图像编辑工具遭网络攻击，2000 万用户数据信息泄露

网络安全裁员对网络安全招聘的影响
网络安全
2023 年 1 月 20 日星期五，谷歌宣布将裁员 12,000 人。亚马逊和微软共裁员 28,000 人；据报道，推特已经失去了 5200 人；MetaFacebook 等）正在裁员 11,000 ...
2025-11-26 20:38【网络安全】
阅读更多
快速连接惠普打印机与电脑的技巧（轻松实现高效打印，让惠普打印机与电脑无缝连接）
网络安全
在现代办公和家庭生活中，打印机已经成为了一个不可或缺的设备。而惠普打印机作为市场上领先的品牌之一，其稳定性和卓越性能备受用户青睐。然而，对于一些用户来说，将惠普打印机与电脑成功连接并进行打印可能会带来 ...
2025-11-26 19:42【网络安全】
阅读更多
苹果手机恢复删除的照片和视频指南（轻松找回误删的珍贵回忆）
网络安全
现如今，手机已成为我们记录生活的重要工具之一。然而，不小心删除了重要的照片或视频时，我们常常感到无助。本文将为你提供苹果手机恢复删除照片和视频的全面指南，让你轻松找回珍贵的回忆。一：如何避免误删照片和 ...
2025-11-26 18:32【网络安全】
阅读更多

友情链接

您现在的位置是：网络安全 >>正文

研究报告揭示主流AI系统存在越狱漏洞、不安全代码及数据窃取风险

相关文章

网络安全裁员对网络安全招聘的影响

快速连接惠普打印机与电脑的技巧（轻松实现高效打印，让惠普打印机与电脑无缝连接）

苹果手机恢复删除的照片和视频指南（轻松找回误删的珍贵回忆）

热门文章

最新文章

友情链接