关闭广告

浙江大学最新研究:让AI像人类一样"转头看"来回答问题

科技行者1696人阅读


当你要找钥匙时,你不会站在门口不动,而是会走来走去、弯腰低头、换个角度仔细观察。同样道理,当AI要理解一个三维场景并回答相关问题时,也应该能够主动调整视角,而不是被困在几张固定的照片中。这正是浙江大学ZIP实验室联合莫纳什大学和阿德莱德大学AIML实验室在2026年1月发表的最新研究要解决的核心问题。

这项发表在arXiv预印本服务器上的研究(论文编号:arXiv:2601.05172v1)提出了一种名为"视角链"(Chain-of-View,简称CoV)的创新框架。研究团队发现,现有的视觉语言模型在面对复杂的三维环境问题时,往往受限于固定的输入视角,就像一个人只能透过几个固定的窗户观察外面的世界一样。而他们的新方法让AI能够像真正的探索者一样,主动移动和转动"视线",从不同角度收集信息,最终给出更准确的答案。

这项研究的独特之处在于它完全不需要额外的训练,就能让现有的AI模型具备"主动观察"的能力。研究人员在OpenEQA、ScanQA和SQA3D等权威测试数据集上进行了大量实验,结果显示这种方法平均提升了11.56%的表现,最高提升幅度达到了13.62%。更令人兴奋的是,随着AI"观察步数"的增加,它的表

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

“一身白”越来越流行,冬天这样穿太高级了!

LinkFashion 浏览 2177

《唐诡3》将至,苏无名卢凌风兄弟反目,8大诡案一个比一个瘆得慌

最爱酷影视 浏览 3475

引援自救!内蒙古矿业富豪入局,贾国龙朋友圈托举西贝

时代财经 浏览 525

五角大楼完善两套对伊朗作战方案 攻击情景推演披露

红星新闻 浏览 18854

引力一号遥二运载火箭发射成功

环球网资讯 浏览 2805

为什么骑手的保障,“普惠”更重要?

财经无忌 浏览 2647

推广中奖名单-更新至2026年2月3日推广

黎贝卡的异想世界 浏览 965

"最快女护士"辞职后首战重马获国内第四 本人回应

封面新闻 浏览 5637

消费股大爆发,但背后另有玄机!

君临财富 浏览 2447

美媒公布美军打击委内瑞拉蒂乌纳堡基地后景象

环球网资讯 浏览 1769

以军先斩后奏空袭加沙多地 特朗普:以色列没做错

上观新闻 浏览 2131

315风波后续来了!鹿哈取消直播被追着维权

萌神木木 浏览 506

标配激光雷达 新款领克07EM-P限时13.98万起

网易汽车 浏览 3335

3-0!日本U23横扫亚洲:打爆阿联酋 2连胜8-0出线 队内8名大学生

风过乡 浏览 1692

乔治亚理工学院联手微软:让AI训练效率暴增21%的神奇新方法

科技行者 浏览 2426

联合国对达成加沙地带停火协议表示欢迎

极目新闻 浏览 2853

123-120!里夫斯44+11,詹姆斯连续上双纪录终结,湖人绝杀猛龙

全景体育V 浏览 2045

马斯克谈AI未来:五年后手机和APP将消失,人类文明在模拟世界的存亡

深蓝财经 浏览 2491

巴特勒18+10勇士轻取鹈鹕3连胜,库里9+5穆迪单节7三分比肩传奇

湖人崛起 浏览 2356

弱水时砂预热“锆势”旗舰 TWS 蓝牙入耳式耳机,9 月 25 日上市

IT之家 浏览 3453

岚图卢放:打破百年成见 重构豪华轿车价值标准

网易汽车 浏览 1962
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1