您现在的位置是:系统运维 >>正文
Grok-4 AI 上线 48 小时即遭新型组合越狱攻击攻破
系统运维891人已围观
简介大型语言模型Grok-4在推出仅两天后,就被研究人员通过结合"回声室(Echo Chamber)"和"渐强(Crescendo)"技术成功突破防御系统,暴露出AI安全机制存在重大缺陷。组合越狱技术突破 ...
大型语言模型Grok-4在推出仅两天后,上线就被研究人员通过结合"回声室(Echo Chamber)"和"渐强(Crescendo)"技术成功突破防御系统 ,小时新型暴露出AI安全机制存在重大缺陷 。即遭

NeuralTrust研究团队在博客中披露 ,组合他们通过多轮对话诱导Grok-4降低了安全限制 ,越狱成功获取了制作武器的攻击攻破详细指导,全程未使用任何明显恶意输入 。高防服务器上线研究员Ahmad Alobaid表示:"大型语言模型(LLM)越狱攻击不仅各自进化,小时新型还能组合使用以增强效果 。即遭"
这两种技术均属于多轮越狱手段 :
回声室技术 :利用模型对跨对话一致性的组合信任 ,通过重复"回响"相同恶意概念来塑造模型内部语境渐强技术 :由微软发现并命名 ,越狱通过从无害提示逐步升级到恶意输出的攻击攻破对话策略绕过安全过滤器
攻击过程首先使用回声室技术建立信任基础,服务器租用当对话进展停滞时切换至渐强技术完成突破。上线实验显示 ,小时新型仅需额外两轮对话 ,即遭这种组合攻击就能成功诱导目标响应。
该攻击利用Grok-4的上下文记忆特性,通过回馈模型自身先前的模板下载陈述,逐步引导其达成攻击目标而不触发警报。测试数据显示 :
制作武器的指导成功率高达67%毒素相关话题的成功率分别为50%和30%
由于攻击全程不依赖关键词触发或直接恶意提示 ,传统基于黑名单和显式恶意检测的防御机制完全失效。源码下载Alobaid指出 :"这暴露出关键漏洞——攻击可以通过利用更广泛的对话上下文来绕过基于意图或关键词的过滤系统。"
随着AI助手和云端LLM在关键场景的应用普及 ,这类多轮"低语式"攻击暴露出严重的安全护栏缺陷。云计算此前微软的"骨架密钥(Skeleton Key)"越狱、"数学提示(MathPrompt)"绕过等技术也证实了类似风险,凸显出需要开发针对性的AI感知防火墙解决方案 。
Tags:
转载:欢迎各位朋友分享到网络,但转载请说明文章出处“信息技术视野”。http://www.bziz.cn/html/177b399819.html
相关文章
新型网络钓鱼攻击甚至能绕过 Instagram 2FA 验证!
系统运维Bleeping Computer 网站消息,一种新型网络钓鱼活动伪装成 "版权侵权 "电子邮件,试图窃取 Instagram 用户的备份代码,以帮助威胁攻击者绕过账户上配置的双因素身份验证2FA)。 ...
【系统运维】
阅读更多见招拆招,三招教你如何确定攻击类型?
系统运维当设备遭受攻击时,通常伴随着如下现象:用户无法获取ARP;设备CPU占用率高;用户上线成功率较低;用户无法访问网络;严重时可能导致设备上所有用户都无法正常访问网络。当大量用户或固定某个端口下的所有用户 ...
【系统运维】
阅读更多Meta 关闭大规模俄罗斯欺诈新闻“网络”
系统运维Bleeping Computer 网站披露,Meta 近期捣毁一个由 Facebook 和 Instagram 账户组成的庞大俄罗斯网络,该网络用于在欧洲各地 60 多个冒充新闻机构的网站上发布虚假 ...
【系统运维】
阅读更多
热门文章
最新文章
友情链接
- Realtek 蓝牙安全连接配对漏洞可导致攻击者发起拒绝服务攻击
- 深度研究 | 如何利用可信数据空间赋能企业数据流通安全
- 出柜率、上架率、负载率,数据中心运营的三个重要指标,你知道吗?
- 戴尔数据泄露事件:测试实验室平台遭 World Leaks 黑客组织入侵
- 恶意 AI 模型正掀起网络犯罪新浪潮
- 运维工程师来活了,Linux 又报了两个超级漏洞(附解决方案)
- GitLab Duo AI 编程助手曝出提示注入漏洞 凸显AI助手的潜在风险
- 身份安全成焦点:Palo Alto Networks拟以250亿美元收购CyberArk
- 神舟战神笔记本电脑质量如何?(探索神舟战神笔记本电脑的品质与性能)
- 戴尔PowerEdge以高性能计算 为奥运健儿保驾护航 企业服务器源码库亿华云云服务器香港物理机b2b信息平台网站建设