关闭广告

澳大利亚国立大学发现:攻击AI视觉模型只需要操控20%的关键词汇

科技行者3316人阅读


这项由澳大利亚国立大学领导的国际研究团队发表于2025年12月26日的arXiv预印本论文(编号:2512.21815),揭示了一个令人担忧的发现:当今最先进的AI视觉语言模型存在一个严重的安全漏洞,攻击者只需要巧妙地操控20%的关键词汇,就能让这些本应安全可靠的AI系统产生有害内容。

考虑这样一个场景:你正在使用一个AI助手来描述图片内容,比如一张街头摩托车的照片。正常情况下,AI会告诉你"这是一个繁忙的城市街道,有几个人骑着摩托车,他们都戴着头盔"。然而,经过特殊设计的微小图像修改后,同一个AI可能会说出完全不同且危险的内容,声称图片中出现了暴力场景或其他有害内容。更令人担忧的是,这种攻击不需要修改整个AI系统,仅仅针对生成文本中20%的特定位置进行干预就足够了。

研究团队通过深入分析发现,这些AI模型在生成描述时,并非每个词汇都同样重要。就像一个故事中有些情节转折点特别关键一样,AI在生成文本时也有一些"决策点",这些点上的词汇选择会极大影响整个叙述的走向。这些关键位置被研究人员称为"高熵位置",类似于岔路口,选择不同的道路会通向完全不同的目的地。

更加令人不安

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

何晴告别式现场,前夫许亚军疑似现身双眼泛红,大量群众自发悼念

萌神木木 浏览 3516

马斯克暗示 SpaceX明年IPO?

北京商报 浏览 3749

斯基拉:吉达联合正尝试续约38岁的本泽马,已开出两年新合同

懂球帝 浏览 3335

球迷态度:你觉得谁是本届全明星最大的遗珠?

懂球帝 浏览 3168

票房炸裂,口碑崩塌,《731》到底值不值得我们为它买单

最爱酷影视 浏览 5255

坎宁安:骑士想要偷走一场胜利,我们没让他们得逞

懂球帝 浏览 1248

日在野党提议自卫队改名国防军 中方回应

北京青年报-北京头条 浏览 4968

美政府部分“停摆”最早将于周二结束

国际金融报 浏览 3170

两架美军机相继在南海坠毁 中方回应

极目新闻 浏览 9041

特朗普突然"通知"中国:带3样东西来谈 否则后果自负

博览历史 浏览 12998

许家印出事前,只有他提前果断脱离恒大,至今毫发无损

壹只灰鸽子 浏览 4302

普通人秋天应该怎么穿衣?颜色选对、衣服穿对,简单又大方

静儿时尚达人 浏览 4079

超25亿港元南下抢筹!17家港股IPO获险资基石认购,泰康领衔重仓科技赛道

时代周报 浏览 567

大衣+阔腿裤:今年冬天最经典搭配,松弛又时髦!

LinkFashion 浏览 3689

规模创历史新高 2025浦江创新论坛共议科技未来

看看新闻Knews 浏览 5061

拜登为何卸任前如此“恶毒”?

浏览 27583

这家中国民企,破解了“迪拜之眼”难题,还拿下30多项“世界第一”!

国是直通车 浏览 4230

深夜,全线大跌!“超级风暴”突袭!

券商中国 浏览 2731

梦回2001!美股软件板块3天暴涨15%,特朗普“吹票”带火IBM

第一财经资讯 浏览 357

俄罗斯:西方派往乌克兰的士兵都是"合法打击目标"

看看新闻Knews 浏览 3398

媒体:高市涉台言论后又蹬鼻子上脸 野田佳彦在放鱼饵

新民周刊 浏览 18552
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1