您现在的位置是:系统运维 >>正文
Grok-4 AI 上线 48 小时即遭新型组合越狱攻击攻破
系统运维78人已围观
简介大型语言模型Grok-4在推出仅两天后,就被研究人员通过结合"回声室(Echo Chamber)"和"渐强(Crescendo)"技术成功突破防御系统,暴露出AI安全机制存在重大缺陷。组合越狱技术突破 ...
大型语言模型Grok-4在推出仅两天后 ,上线就被研究人员通过结合"回声室(Echo Chamber)"和"渐强(Crescendo)"技术成功突破防御系统,小时新型暴露出AI安全机制存在重大缺陷。即遭

NeuralTrust研究团队在博客中披露,组合他们通过多轮对话诱导Grok-4降低了安全限制,越狱成功获取了制作武器的攻击攻破详细指导,全程未使用任何明显恶意输入。亿华云上线研究员Ahmad Alobaid表示 :"大型语言模型(LLM)越狱攻击不仅各自进化,小时新型还能组合使用以增强效果 。即遭"
这两种技术均属于多轮越狱手段 :
回声室技术:利用模型对跨对话一致性的组合信任,通过重复"回响"相同恶意概念来塑造模型内部语境渐强技术 :由微软发现并命名,越狱通过从无害提示逐步升级到恶意输出的攻击攻破对话策略绕过安全过滤器
攻击过程首先使用回声室技术建立信任基础 ,云计算当对话进展停滞时切换至渐强技术完成突破 。上线实验显示 ,小时新型仅需额外两轮对话,即遭这种组合攻击就能成功诱导目标响应。
该攻击利用Grok-4的上下文记忆特性 ,通过回馈模型自身先前的源码下载陈述 ,逐步引导其达成攻击目标而不触发警报 。测试数据显示:
制作武器的指导成功率高达67%毒素相关话题的成功率分别为50%和30%
由于攻击全程不依赖关键词触发或直接恶意提示,传统基于黑名单和显式恶意检测的防御机制完全失效。高防服务器Alobaid指出:"这暴露出关键漏洞——攻击可以通过利用更广泛的对话上下文来绕过基于意图或关键词的过滤系统 。"
随着AI助手和云端LLM在关键场景的应用普及,这类多轮"低语式"攻击暴露出严重的安全护栏缺陷 。模板下载此前微软的"骨架密钥(Skeleton Key)"越狱、"数学提示(MathPrompt)"绕过等技术也证实了类似风险 ,凸显出需要开发针对性的AI感知防火墙解决方案。
Tags:
转载:欢迎各位朋友分享到网络,但转载请说明文章出处“信息技术视野”。http://www.bziz.cn/news/177b399819.html
上一篇:智能家居设备侵犯个人隐私了吗?
下一篇:CTF中的普通SQL注入题分析
相关文章
通过开源、多平台代码签名扩展 Apple 生态系统访问权限
系统运维苹果系统运行着一些现有的最大和最赚钱的软件应用程序生态系统。理论上,要进入这些生态系统,传统上需要使用macOS,并加入苹果开发者计划(Apple Developer Program)。如果你想为 A ...
【系统运维】
阅读更多智能生态系统网络安全的重要性
系统运维随着数据数据泄露的消息越来越普遍,现在比以往任何时候都更重要的是,安全性已成为公寓业主的重中之重。一次数据泄露可能会对房东的声誉造成不可挽回的损害,使居民面临风险,并危及房产的成功运营。由于大流行使远 ...
【系统运维】
阅读更多容器安全优秀实践和常见威胁
系统运维本文我们将了解容器安全挑战并了解关键的容器安全优秀实践,例如保护镜像、harbor等。什么是容器?容器是一种操作系统级虚拟化方法,用于在单个受控制的主机上运行多个隔离的 Linux 系统容器),它允许 ...
【系统运维】
阅读更多