关闭广告

澳大利亚国立大学发现:攻击AI视觉模型只需要操控20%的关键词汇

科技行者1639人阅读


这项由澳大利亚国立大学领导的国际研究团队发表于2025年12月26日的arXiv预印本论文(编号:2512.21815),揭示了一个令人担忧的发现:当今最先进的AI视觉语言模型存在一个严重的安全漏洞,攻击者只需要巧妙地操控20%的关键词汇,就能让这些本应安全可靠的AI系统产生有害内容。

考虑这样一个场景:你正在使用一个AI助手来描述图片内容,比如一张街头摩托车的照片。正常情况下,AI会告诉你"这是一个繁忙的城市街道,有几个人骑着摩托车,他们都戴着头盔"。然而,经过特殊设计的微小图像修改后,同一个AI可能会说出完全不同且危险的内容,声称图片中出现了暴力场景或其他有害内容。更令人担忧的是,这种攻击不需要修改整个AI系统,仅仅针对生成文本中20%的特定位置进行干预就足够了。

研究团队通过深入分析发现,这些AI模型在生成描述时,并非每个词汇都同样重要。就像一个故事中有些情节转折点特别关键一样,AI在生成文本时也有一些"决策点",这些点上的词汇选择会极大影响整个叙述的走向。这些关键位置被研究人员称为"高熵位置",类似于岔路口,选择不同的道路会通向完全不同的目的地。

更加令人不安

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

命名Peaq 斯柯达全新纯电七座SUV今年发布

车质网 浏览 1630

男子夜钓遭枪击 家属:行凶者把猎枪扔河里 警方找7天

扬子晚报 浏览 6666

"90后"王兴兴:小学时想当科学家 同学一句话启发了我

中国新闻周刊 浏览 7901

詹姆斯:湖人的投篮困境终会过去;这周对我来说有点像训练营

懂球帝 浏览 2177

上海AI实验室团队首创视频驱动交互网页重建基准

科技行者 浏览 2598

皇马TV显示,贝林厄姆将在国家德比中担任首发右边锋

懂球帝 浏览 2703

项立刚再批罗永浩!为搞流量煽动舆论,被封就是活该

雷科技 浏览 1904

女生晒春运"出国回家"攻略:连飞俄两地再坐船回黑龙江

上游新闻 浏览 21158

64岁男演员春节在景区打工,暴瘦引担忧!

扬子晚报 浏览 959

全红婵还没回国家队!大概率缺席冬训

草莓解说体育 浏览 1333

同游仍少年!精灵世界空降杭州

时尚COSMO 浏览 2218

坦克300Hi-T宁德时代版上市 售24.98万

车质网 浏览 1817

马斯克暗示 SpaceX明年IPO?

北京商报 浏览 2106

10000亿中芯国际,一剑封喉!

飞鲸投研 浏览 2374

特朗普称"美国拥有无人知晓的武器" 克宫回应

环球网资讯 浏览 1558

欧冠一夜4战!将有4队出线:头号黑马呼之欲出 2队晋级无忧

叶青足球世界 浏览 980

上海网友在日料店里吃出蛆虫 蛆虫还在炸鸡上蠕动

极目新闻 浏览 20595

斯基拉:尤文、罗马、国米都在关注热那亚中场弗伦德鲁普

懂球帝 浏览 2620

雷军在京喊话:共同抵制网络水军、黑公关

大象新闻 浏览 2786

武契奇称"无法保证不制裁俄罗斯" 俄方回应

参考消息网 浏览 7553

乌总统:美方28点计划已有所精简

每日经济新闻 浏览 2292
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1