关闭广告

澳大利亚国立大学发现:攻击AI视觉模型只需要操控20%的关键词汇

科技行者3319人阅读


这项由澳大利亚国立大学领导的国际研究团队发表于2025年12月26日的arXiv预印本论文(编号:2512.21815),揭示了一个令人担忧的发现:当今最先进的AI视觉语言模型存在一个严重的安全漏洞,攻击者只需要巧妙地操控20%的关键词汇,就能让这些本应安全可靠的AI系统产生有害内容。

考虑这样一个场景:你正在使用一个AI助手来描述图片内容,比如一张街头摩托车的照片。正常情况下,AI会告诉你"这是一个繁忙的城市街道,有几个人骑着摩托车,他们都戴着头盔"。然而,经过特殊设计的微小图像修改后,同一个AI可能会说出完全不同且危险的内容,声称图片中出现了暴力场景或其他有害内容。更令人担忧的是,这种攻击不需要修改整个AI系统,仅仅针对生成文本中20%的特定位置进行干预就足够了。

研究团队通过深入分析发现,这些AI模型在生成描述时,并非每个词汇都同样重要。就像一个故事中有些情节转折点特别关键一样,AI在生成文本时也有一些"决策点",这些点上的词汇选择会极大影响整个叙述的走向。这些关键位置被研究人员称为"高熵位置",类似于岔路口,选择不同的道路会通向完全不同的目的地。

更加令人不安

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

晚旗报:随着齐米卡斯留在罗马,罗伯逊不会在冬窗离开利物浦

懂球帝 浏览 3159

动物纹回潮,那很狂野了

时尚COSMO 浏览 3392

英国以“最高优先级”正式调查社交平台X

新华社 浏览 3457

该不该踢双前锋?哲科:我说多了教练要生气

懂球帝 浏览 4380

斯洛特:尽管我们取得四连胜,但球队的表现并不完美

懂球帝 浏览 3638

女生希望"慢慢相处" 男子以送早餐为名进酒店实施性侵

红星新闻 浏览 13658

特朗普提议俄乌"在当前战线停火" 克宫表态

环球网 浏览 4328

近7场1胜6负,河床近期战绩非常糟糕

懂球帝 浏览 4449

30岁男子如厕时猝死 妻子回忆事发前5天丈夫疼痛细节

红星新闻 浏览 7711

妙可蓝多创始人柴琇遭免职,并被提起仲裁

YOUNG财经 浏览 3296

托蒂:我们那一代水平太高,很难再同时出现如此多的优秀球员

懂球帝 浏览 4111

黄子韬婚礼险翻车!许艺洋喊错男朋友

林木体育解说 浏览 4515

没听说过1.6T光模块测试公司,Q1利润增速超500%! | 0421

虎嗅APP 浏览 1494

东方港湾董事长但斌:致敬白酒投资者,这两年其他的人都吃香的喝辣的

红星资本局 浏览 3648

赵丽颖直播太实诚,被问儿子暖还是羊绒暖,赵丽颖果断选择儿子

扒虾侃娱 浏览 4477

越南再爆地产大雷,股市重挫5%,创六个月来最大单日跌幅

华尔街见闻官方 浏览 4341

38岁尹正再破天花板,这一次,他让整个娱乐圈“沉默”了

温柔娱公子 浏览 3791

3岁男孩跌入炭堆全身烧伤85%尚未脱险 家人发声

封面新闻 浏览 9805

荣梓杉塌房太离谱!出轨家暴还反咬?

东方不败然多多 浏览 4500

倾家荡产120万上星光大道,她如今怎样了

青橘罐头 浏览 4579

老板电器的中年突围:业绩扛压、高分红、猛投 AI

博望财经 浏览 1086
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1