关闭广告

浙江大学最新研究:让AI像人类一样"转头看"来回答问题

科技行者3421人阅读


当你要找钥匙时,你不会站在门口不动,而是会走来走去、弯腰低头、换个角度仔细观察。同样道理,当AI要理解一个三维场景并回答相关问题时,也应该能够主动调整视角,而不是被困在几张固定的照片中。这正是浙江大学ZIP实验室联合莫纳什大学和阿德莱德大学AIML实验室在2026年1月发表的最新研究要解决的核心问题。

这项发表在arXiv预印本服务器上的研究(论文编号:arXiv:2601.05172v1)提出了一种名为"视角链"(Chain-of-View,简称CoV)的创新框架。研究团队发现,现有的视觉语言模型在面对复杂的三维环境问题时,往往受限于固定的输入视角,就像一个人只能透过几个固定的窗户观察外面的世界一样。而他们的新方法让AI能够像真正的探索者一样,主动移动和转动"视线",从不同角度收集信息,最终给出更准确的答案。

这项研究的独特之处在于它完全不需要额外的训练,就能让现有的AI模型具备"主动观察"的能力。研究人员在OpenEQA、ScanQA和SQA3D等权威测试数据集上进行了大量实验,结果显示这种方法平均提升了11.56%的表现,最高提升幅度达到了13.62%。更令人兴奋的是,随着AI"观察步数"的增加,它的表

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

上千网友帮女孩杀猪 主厨:这么多张嘴挂身上压力太大

极目新闻 浏览 13309

篮协官方:CBA总决赛新增两位国际篮联精英裁判来华执裁

懂球帝 浏览 548

太阳报:曼联17岁中场思韦茨随一线队训练,被比作佩德里

懂球帝 浏览 4589

懒懒陪王思聪低调过38岁生日,晒甜蜜日常

丁丁鲤史纪 浏览 3456

反转反转再反转!让片名耽误的杰作

电影最TOP 浏览 3283

落地为王:谁在用AI引领百亿价值跃迁?

虎嗅APP 浏览 3829

马斯克暗示 SpaceX明年IPO?

北京商报 浏览 3750

委内瑞拉向中俄伊寻求导弹 外交部回应

澎湃新闻 浏览 4210

集齐产业、PE/VC与央企国资!曦望披露近30亿元新融资细节

21世纪经济报道 浏览 3291

牛市中的“逆行者”:淳厚基金规模一年流失40%

一地基毛 浏览 1135

阿信演唱会摔下舞台,相信音乐发声报平安:结束后有专业人员检查

扒虾侃娱 浏览 3667

满屏爱张力,现偶活过来了!

吐槽电影院 浏览 3543

中央巡视后卸任七年的姜德果被查 曾任唐山市委书记

中国新闻周刊 浏览 24955

不在乎中国市场?全智贤方风波后仍未道歉,昔日傲慢模样全被扒

扒虾侃娱 浏览 4955

44岁LV"太子妃"怀上第6胎震动时尚圈 曾是俄罗斯贫民

新民周刊 浏览 54745

巩俐的前夫是圈外高级打工人,75岁在新加坡养老

白面书誏 浏览 4334

65岁钟楚红近况曝光!老公去世18年未再嫁

代军哥哥谈娱乐 浏览 3427

特朗普:对委军事行动使用了空中、陆地和海上力量

极目新闻 浏览 3496

岳云鹏八年划水终到头,观众不想再为春晚情怀买单,不看也不演了

肆季娱乐 浏览 3399

詹姆斯谈保罗退役:希望他能好好享受最后的赛季,他已无遗憾

懂球帝 浏览 3931

辽宁加时95-82江苏,赵继伟16+7+8,威尔斯21分

懂球帝 浏览 3151
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1