关闭广告

让多图对话AI不再"搞混":首尔多所大学发现分隔符背后的秘密

科技行者3022人阅读


这项由首尔大学、韩国科学技术院(KAIST)和德国图宾根大学联合完成的研究发表于2026年的ICLR(International Conference on Learning Representations)会议,论文编号为arXiv:2602.01984v1。有兴趣深入了解的读者可以通过该编号查询完整论文。

当你同时向AI展示几张照片并提问时,是否发现它有时会把不同照片的内容混淆?比如你问"第一张图片里有没有自行车",它却回答了第二张图片的内容。这种现象就像一个健忘的朋友,明明你分别给他看了几张照片,他却总是把照片内容记混。

这个看似简单的问题背后,其实隐藏着现代AI系统的一个关键技术挑战。当前最先进的多模态大语言模型(就是那些能同时理解文字和图片的AI系统)在处理单张图片时表现卓越,但一旦面对多张图片,性能就会显著下降。这种现象被研究人员称为"跨图像信息泄露",就好比厨师在做菜时,明明准备了不同的食材放在不同的盘子里,但在烹饪过程中却总是搞混各种调料的归属。

为了解决这个问题,现有的AI系统都会在每张图片前后插入特殊的"分隔符",就像在文档中使用分页符一样

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

五一档票房超7亿,《给阿嬷的情书》开分9.0

澎湃新闻 浏览 1215

调研 | 从陪伴“小巨人”企业A+H股上市,看宁波银行服务硬科技范式转变

券商中国 浏览 1249

环球:荷兰不要低估中方维护正当权益的决心与能力

环球网资讯 浏览 8494

赵露思:退圈72天,反转太快

Yuki女人故事 浏览 4196

官方:帕拉迪诺成为亚特兰大新主帅,签约至2027年6月

懂球帝 浏览 3994

李梓萌骗人真相大白,幕后黑手被揪

近史博览 浏览 4412

吴子嘉问"上任后如何收拾民进党" 郑丽文回应

海峡导报社 浏览 10474

推广中奖名单-更新至2025年12月19日推广

黎贝卡的异想世界 浏览 3423

俄朝站队怒批高市 特朗普迅速与日切割中方警告很罕见

现代小青青慕慕 浏览 48622

拉波尔塔:如无意外月底回归诺坎普;弗里克在巴萨很开心

懂球帝 浏览 4242

TA:世界杯美国队首战门票销量堪忧,甚至远不如同一场地伊朗的比赛

懂球帝 浏览 1603

AI快速生成抗体设计图,大卫·贝克最新研究或改变传染病应对模式

DeepTech深科技 浏览 4191

海南冯强再被通报:酒驾 工作时间沉迷打高尔夫球

极目新闻 浏览 9079

豪门离婚,窦骁能分到多少?

江湖人称艾掌门 浏览 4275

前10月规模以上高技术制造业利润同比增长8.0%

北京商报 浏览 3858

不尊重中国领土完整!巴萨遭批:中国特供不发外网 甩锅临时工

念洲 浏览 1537

单日6只大规模基金成立!主动权益基金四大指标,超去年全年

券商中国 浏览 512

凌晨4点,超3万人现场观看!太火爆……

环球网资讯 浏览 3318

复星医药14亿元押注停产药,其疗效问题饱受市场争议,公司回复监管函

红星资本局 浏览 3594

二次封后的宋佳凭什么狂妄?

无处不风景love 浏览 4169

“恐怖电影成真” 美国男子盗窃人骨公开售卖

澎湃新闻 浏览 8689
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1