关闭广告

浙江大学最新研究:让AI像人类一样"转头看"来回答问题

科技行者3422人阅读


当你要找钥匙时,你不会站在门口不动,而是会走来走去、弯腰低头、换个角度仔细观察。同样道理,当AI要理解一个三维场景并回答相关问题时,也应该能够主动调整视角,而不是被困在几张固定的照片中。这正是浙江大学ZIP实验室联合莫纳什大学和阿德莱德大学AIML实验室在2026年1月发表的最新研究要解决的核心问题。

这项发表在arXiv预印本服务器上的研究(论文编号:arXiv:2601.05172v1)提出了一种名为"视角链"(Chain-of-View,简称CoV)的创新框架。研究团队发现,现有的视觉语言模型在面对复杂的三维环境问题时,往往受限于固定的输入视角,就像一个人只能透过几个固定的窗户观察外面的世界一样。而他们的新方法让AI能够像真正的探索者一样,主动移动和转动"视线",从不同角度收集信息,最终给出更准确的答案。

这项研究的独特之处在于它完全不需要额外的训练,就能让现有的AI模型具备"主动观察"的能力。研究人员在OpenEQA、ScanQA和SQA3D等权威测试数据集上进行了大量实验,结果显示这种方法平均提升了11.56%的表现,最高提升幅度达到了13.62%。更令人兴奋的是,随着AI"观察步数"的增加,它的表

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

兴业银行大连分行多人被罚,不久前才吃了470万元罚单

财通社 浏览 3167

马斯克摊上事了,旗下公司被多国调查封禁

21世纪经济报道 浏览 3468

每体:奥尔莫将因伤错过加泰德比,预计在西超杯期间伤愈复出

懂球帝 浏览 3567

赵樱子回应与张康乐绯闻:我提过人一个名字吗?

韩小娱 浏览 4263

朝鲜空军庆祝活动 现场2名女飞行员示范飞行

看看新闻Knews 浏览 3882

中国留学生潜水后失踪妻子4天后报警 仅找到一根胫骨

新民晚报 浏览 23632

马赛主席在从曼联签下梅森·格林伍德前询问了他的母亲

绿茵情报局 浏览 3229

红旗首款越野车征名送车

大象新闻 浏览 4425

粤浦科技韩毓祥:AI对传统资产有三方面价值

观察者网 浏览 451

洋河股份董事长顾宇首次交出季度成绩单:日均亏掉400万

财经众议院 浏览 4319

刚果(金)东北部遭武装组织袭击 至少36人死亡

国际在线 浏览 1116

AI数据中心太火,美商务部长被盯上了,民主党议员发函敦促调查利益冲突

华尔街见闻官方 浏览 3655

鸿蒙版微信一周年:从“能用”到“好用” 超2000万下载量背后的进化史

快科技 浏览 4458

宏碁正式推出Swift 16 AI旗舰轻薄本,至高酷睿Ultra X9 388H

IT之家 浏览 3467

许绍雄离世,她说,老豆我很想你!但我不会再哭

振华观史 浏览 4323

存在银行保管箱百万物品不翼而飞 银行:保管箱锁完好

上游新闻 浏览 21301

罗马诺:斯帕莱蒂已与尤文签约,随后将官宣

懂球帝 浏览 4216

俄告知美方将打击基辅 建议人员撤离

第一财经资讯 浏览 481

亚马逊AWS将部署英伟达Groq LPU与超百万块GPU

IT之家 浏览 2433

记者实测 多地办理电话卡需提供无犯罪证明和银行流水

澎湃新闻 浏览 10385

50岁阿姨也能穿得亮眼高级,这些搭配的技巧请收好,特别实用

静儿时尚达人 浏览 6840
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1