关闭广告

浙江大学最新研究:让AI像人类一样"转头看"来回答问题

科技行者3578人阅读


当你要找钥匙时,你不会站在门口不动,而是会走来走去、弯腰低头、换个角度仔细观察。同样道理,当AI要理解一个三维场景并回答相关问题时,也应该能够主动调整视角,而不是被困在几张固定的照片中。这正是浙江大学ZIP实验室联合莫纳什大学和阿德莱德大学AIML实验室在2026年1月发表的最新研究要解决的核心问题。

这项发表在arXiv预印本服务器上的研究(论文编号:arXiv:2601.05172v1)提出了一种名为"视角链"(Chain-of-View,简称CoV)的创新框架。研究团队发现,现有的视觉语言模型在面对复杂的三维环境问题时,往往受限于固定的输入视角,就像一个人只能透过几个固定的窗户观察外面的世界一样。而他们的新方法让AI能够像真正的探索者一样,主动移动和转动"视线",从不同角度收集信息,最终给出更准确的答案。

这项研究的独特之处在于它完全不需要额外的训练,就能让现有的AI模型具备"主动观察"的能力。研究人员在OpenEQA、ScanQA和SQA3D等权威测试数据集上进行了大量实验,结果显示这种方法平均提升了11.56%的表现,最高提升幅度达到了13.62%。更令人兴奋的是,随着AI"观察步数"的增加,它的表

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

2026年第一票房惨案诞生了

靠谱电影君 浏览 3634

内娱声明还有可信度吗?

韩小娱 浏览 4529

马斯克回应争议:没有见过任何由Grok生成的未成年人裸照

IT之家 浏览 3510

【观察】图多尔下课了,但尤文的混乱何时结束?

体坛周报 浏览 4386

何健麒公开无犯罪记录证明,回应前女友涉毒举报

韩小娱 浏览 3429

被网友质疑要两千万私了 遭老板性侵女高管爆粗回怼

极目新闻 浏览 6601

汪峰演唱会翻车唱不上去,葛荟婕精准补刀

吃瓜盟主 浏览 4325

离婚4年,42岁佟丽娅高调官宣喜讯

刘森森 浏览 4273

朱孝天回应阿信感谢,自曝没再收到邀约

萌神木木 浏览 3327

Here we go!罗马诺:安德莱赫特边锋尼尔松-安古洛加盟桑德兰

懂球帝 浏览 3334

限时9.67万起 吉利星越L/星瑞i-HEV智擎混动上市

网易汽车 浏览 1418

李小冉这种人最精了!

娱乐圈笔娱君 浏览 1707

演员任敏生理期南极跳海,回船喝酒

失宠的小野猪 浏览 3829

40+女人冬季穿衣,质感优先、简约配色、扬长避短,优雅高级

静儿时尚达人 浏览 3612

一战再战、王家卫、郑智化风波、杨振宁逝世、白百何等

电影最TOP 浏览 3619

法媒:阿什拉夫等伤员会前往慕尼黑,为队友加油助威

懂球帝 浏览 1350

大带宽+低时延!F5G如何撑起城域“毫秒用算”?

览富财经网 浏览 4673

今年秋冬最美的搭配:毛衣+裙子,减龄又气质!

LinkFashion 浏览 4474

微创、高效、直达大脑!我国科学家开辟脑卒中病灶给药新路径

环球网资讯 浏览 3505

最圆最近!年度超级月亮今晚登场

封面新闻 浏览 4404

存强制退市风险 *ST长药涉嫌财务造假遭立案

北京商报 浏览 4252
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1