关闭广告

浙江大学最新研究:让AI像人类一样"转头看"来回答问题

科技行者3585人阅读


当你要找钥匙时,你不会站在门口不动,而是会走来走去、弯腰低头、换个角度仔细观察。同样道理,当AI要理解一个三维场景并回答相关问题时,也应该能够主动调整视角,而不是被困在几张固定的照片中。这正是浙江大学ZIP实验室联合莫纳什大学和阿德莱德大学AIML实验室在2026年1月发表的最新研究要解决的核心问题。

这项发表在arXiv预印本服务器上的研究(论文编号:arXiv:2601.05172v1)提出了一种名为"视角链"(Chain-of-View,简称CoV)的创新框架。研究团队发现,现有的视觉语言模型在面对复杂的三维环境问题时,往往受限于固定的输入视角,就像一个人只能透过几个固定的窗户观察外面的世界一样。而他们的新方法让AI能够像真正的探索者一样,主动移动和转动"视线",从不同角度收集信息,最终给出更准确的答案。

这项研究的独特之处在于它完全不需要额外的训练,就能让现有的AI模型具备"主动观察"的能力。研究人员在OpenEQA、ScanQA和SQA3D等权威测试数据集上进行了大量实验,结果显示这种方法平均提升了11.56%的表现,最高提升幅度达到了13.62%。更令人兴奋的是,随着AI"观察步数"的增加,它的表

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

喜马拉雅烟花秀引争议 新华社、人民日报接连发声

21世纪经济报道 浏览 22589

女护士被同居男友杀害 家属:放弃赔偿希望判男方死刑

纵览新闻 浏览 15142

美联储理事沃勒:CEO们称AI将致大量裁员,3月利率决议取决于2月劳动力数据

华尔街见闻官方 浏览 2873

66岁倪萍身价过亿,26岁儿子却成她心头大患

手工制作阿歼 浏览 3675

Netflix砍掉手机投屏功能:官方称“提升体验”,用户骂声一片

IT之家 浏览 4101

老己,买点什么犒劳辛苦了一年的你?

时尚COSMO 浏览 3815

怒批赵睿破坏民族团结后,新疆官媒明着夸胡金秋 疑暗讽男篮队长

念洲 浏览 2910

FBI逮捕CIA高官:家中搜出303根金条 200万美元现金

红星新闻 浏览 22523

马克龙:有必要将伊朗停火协议扩展到黎巴嫩

上观新闻 浏览 1969

特斯拉进入平价棋局 不足4万美元的新车又是鲶鱼?

禾颜阅车 浏览 4593

张雪峰还是不服?

老斯基财经 浏览 4438

2025年首例被北交所暂缓审议的企业出炉 永大股份上市缘何待考?

叩叩财讯 浏览 4182

江一燕官宣离婚后首发声

扒虾侃娱 浏览 4403

“乔治·华盛顿”号航母进入南海 “尼米兹”号航母同日离开

环球网资讯 浏览 4140

福特烈马增程版申报信息曝光: 1.5T增程+弗迪电池

网易汽车 浏览 4676

一封AI邮件,竟让Go语言之父爆起粗口

机器之心Pro 浏览 3746

女子98万买新房交付前感觉被坑了:设计师都"惊呆"了

1818黄金眼 浏览 16371

TA:热刺想要加拉格尔已近三年,如今才终于签下他

懂球帝 浏览 3488

10套不重样出游穿搭,国庆照着穿又美又撩人!

Yuki女人故事 浏览 4993

曝李金铭怀孕待产!直播账号已停更近半年,曾卷入知三当三风波

萌神木木 浏览 3648

BBC两高管宣布辞职 特朗普:他们试图"介入总统选举"

红星新闻 浏览 9387
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1