关闭广告

浙江大学最新研究:让AI像人类一样"转头看"来回答问题

科技行者1699人阅读


当你要找钥匙时,你不会站在门口不动,而是会走来走去、弯腰低头、换个角度仔细观察。同样道理,当AI要理解一个三维场景并回答相关问题时,也应该能够主动调整视角,而不是被困在几张固定的照片中。这正是浙江大学ZIP实验室联合莫纳什大学和阿德莱德大学AIML实验室在2026年1月发表的最新研究要解决的核心问题。

这项发表在arXiv预印本服务器上的研究(论文编号:arXiv:2601.05172v1)提出了一种名为"视角链"(Chain-of-View,简称CoV)的创新框架。研究团队发现,现有的视觉语言模型在面对复杂的三维环境问题时,往往受限于固定的输入视角,就像一个人只能透过几个固定的窗户观察外面的世界一样。而他们的新方法让AI能够像真正的探索者一样,主动移动和转动"视线",从不同角度收集信息,最终给出更准确的答案。

这项研究的独特之处在于它完全不需要额外的训练,就能让现有的AI模型具备"主动观察"的能力。研究人员在OpenEQA、ScanQA和SQA3D等权威测试数据集上进行了大量实验,结果显示这种方法平均提升了11.56%的表现,最高提升幅度达到了13.62%。更令人兴奋的是,随着AI"观察步数"的增加,它的表

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

极摩客EVO - T2迷你主机亮相:本季度上市,配置强大

IT之家 浏览 1714

伊朗外长:伊朗给美国人"准备了许多惊喜"

界面新闻 浏览 653

朱孝天方回应被踢出F4,刚合体时就挺不合群,如今开公司当老板

萌神木木 浏览 2472

12306又上新功能:坐火车能领取积分 积分可以当钱花

大象新闻 浏览 7396

微软研究院突破:让AI真正读懂多种语言的文化密码

科技行者 浏览 2700

媒体:中方反制日自卫队前高官 令人想起"白团"终失败

新民周刊 浏览 17357

50岁女子当入殓师:有家属为抢房产要掀棺抬老人遗体

新京报 浏览 5794

价格是入门级X7两倍 宝马Alpina XB7新版本最新消息曝光

乐选爱车 浏览 534

背靠OpenAI的机器人初创1X亮相CES展示家务机器人,售价2万美元

华尔街见闻官方 浏览 1740

泡泡玛特股价连跌6天

YOUNG财经 浏览 2646

创新推出ACE SXFI蓝牙耳机,699元

IT之家 浏览 1497

看来看去还是这些穿搭舒适!深浅互补、多穿阔腿裤,简约自然

静儿时尚达人 浏览 2796

男子身穿"醋瓶子"跑马拉松成全场"显眼包" 本人回应

极目新闻 浏览 24865

俄大幅加税中国汽车出口骤降58% 有商家暂停对俄业务

每日经济新闻 浏览 6809

123-120!里夫斯44+11,詹姆斯连续上双纪录终结,湖人绝杀猛龙

全景体育V 浏览 2050

《御赐小仵作2》空降续集开播!最新口碑出炉,观众评价一针见血

娱乐圈笔娱君 浏览 1671

国内首个开放式机器人租赁平台在沪发布,已触达50个重点城市

澎湃新闻 浏览 1950

云南外援奥斯卡连续七场联赛参与进球,刷新个人中超最长纪录

懂球帝 浏览 2586

马克龙警告美国:侵犯格陵兰岛将引发"前所未有后果"

环球网资讯 浏览 13071

宇树科技更名!正在办理工商变更,已完成首期上市辅导

红星资本局 浏览 2636

菜可以预制,信任不可以预支

时尚COSMO 浏览 4517
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1