关闭广告

让多图对话AI不再"搞混":首尔多所大学发现分隔符背后的秘密

科技行者3189人阅读


这项由首尔大学、韩国科学技术院(KAIST)和德国图宾根大学联合完成的研究发表于2026年的ICLR(International Conference on Learning Representations)会议,论文编号为arXiv:2602.01984v1。有兴趣深入了解的读者可以通过该编号查询完整论文。

当你同时向AI展示几张照片并提问时,是否发现它有时会把不同照片的内容混淆?比如你问"第一张图片里有没有自行车",它却回答了第二张图片的内容。这种现象就像一个健忘的朋友,明明你分别给他看了几张照片,他却总是把照片内容记混。

这个看似简单的问题背后,其实隐藏着现代AI系统的一个关键技术挑战。当前最先进的多模态大语言模型(就是那些能同时理解文字和图片的AI系统)在处理单张图片时表现卓越,但一旦面对多张图片,性能就会显著下降。这种现象被研究人员称为"跨图像信息泄露",就好比厨师在做菜时,明明准备了不同的食材放在不同的盘子里,但在烹饪过程中却总是搞混各种调料的归属。

为了解决这个问题,现有的AI系统都会在每张图片前后插入特殊的"分隔符",就像在文档中使用分页符一样

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

电影《寻秦记》双结局设定给观众一场美梦

TVB剧评社 浏览 3619

Altman放话:2028年,超级智能将超越人类

钛媒体APP 浏览 2917

委内瑞拉下令搜捕美国侵略支持者

澎湃新闻 浏览 3602

大兵压境时忽启谈判 特朗普“葫芦里卖的什么药”

看看新闻Knews 浏览 3333

京粤沪专家齐聚,2026“人工智能+”教育行动在深外举行

南方都市报 浏览 1491

“肉测”成都自动驾驶公交:提前免费预约,一人一座,一趟车有14个名额

红星新闻 浏览 3608

伊朗防长:美国"以武促和"实为强制屈服 各国不会接受

极目新闻 浏览 4735

当AI“和人一样好甚至更好"时,教育该做什么?上海市教委主任这么说

上观新闻 浏览 1724

同游仍少年!精灵世界空降杭州

时尚COSMO 浏览 3591

五一档票房超7亿,《给阿嬷的情书》开分9.0

澎湃新闻 浏览 1367

奥特曼的“印钞机”与“吞金兽”:OpenAI年化营收超200亿美元背后的豪赌

澎湃新闻 浏览 3487

34年来首次 普京下令起草恢复核武器试验提议

红星新闻 浏览 4235

追觅造车有新进度,相关3款车亮相CES,首款车还处概念车阶段

红星资本局 浏览 3455

美军突袭马杜罗的秘密武器 遭特朗普披露

环球时报国际 浏览 3358

每体:门德斯在巴塞罗那分别与亚马尔、德科进行了会谈

懂球帝 浏览 4783

最强Air!苹果全新iPad Air发布:M4芯片加持 4799元起

快科技 浏览 2890

岚图泰山X8大湾区登场!粤港澳迎来8系唯一四激光全地形SUV

网易汽车 浏览 625

小区居民被大型空调设备震得神经衰弱 多次报警仍无果

环球网资讯 浏览 7658

创三年新低 销量暴跌63% 超越特斯拉难不难?

正在说车 浏览 4210

美国会高层称对驻德美军撤出计划“深感担忧”

国际在线 浏览 1320

M3旅行版上市售94.39万元 告别平行进口

网易汽车 浏览 4290
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1