关闭广告

浙江大学最新研究:让AI像人类一样"转头看"来回答问题

科技行者3239人阅读


当你要找钥匙时,你不会站在门口不动,而是会走来走去、弯腰低头、换个角度仔细观察。同样道理,当AI要理解一个三维场景并回答相关问题时,也应该能够主动调整视角,而不是被困在几张固定的照片中。这正是浙江大学ZIP实验室联合莫纳什大学和阿德莱德大学AIML实验室在2026年1月发表的最新研究要解决的核心问题。

这项发表在arXiv预印本服务器上的研究(论文编号:arXiv:2601.05172v1)提出了一种名为"视角链"(Chain-of-View,简称CoV)的创新框架。研究团队发现,现有的视觉语言模型在面对复杂的三维环境问题时,往往受限于固定的输入视角,就像一个人只能透过几个固定的窗户观察外面的世界一样。而他们的新方法让AI能够像真正的探索者一样,主动移动和转动"视线",从不同角度收集信息,最终给出更准确的答案。

这项研究的独特之处在于它完全不需要额外的训练,就能让现有的AI模型具备"主动观察"的能力。研究人员在OpenEQA、ScanQA和SQA3D等权威测试数据集上进行了大量实验,结果显示这种方法平均提升了11.56%的表现,最高提升幅度达到了13.62%。更令人兴奋的是,随着AI"观察步数"的增加,它的表

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

礼来下调Zepbound减肥药现金价格,最低至每月299美元,股价下挫1%

华尔街见闻官方 浏览 3714

聚焦AI+畜牧,刘松柏攻破鸡味密码,打造终身学习广东样本

南方都市报 浏览 2523

老牌公募中邮基金换帅 张涛接替毕劲松面临权益短板挑战

Daily每日财报 浏览 3534

罗马诺:阿贾克斯即将与富安健洋签约半年,根据表现可能续约

懂球帝 浏览 3514

突破“手”的瓶颈,具身智能正加速迈向“实干”

上观新闻 浏览 3537

与美主持人激烈辨论后被闭麦 万斯怒了

环球网资讯 浏览 8304

和宋祖儿恋情谣言澄清后,刘宇宁口碑意外反转

喜欢历史的阿繁 浏览 1190

河北农村老人挨冻,取暖费为何贵上万

深蓝财经 浏览 2620

任泽平认为全球正在去美元化,黄金白银将成为终极货币,真的吗?

火星宏观 浏览 2943

大S雕像揭幕仪式曝光,S妈具俊晔雨中挽手同行,前夫汪小菲未露面

扒虾侃娱 浏览 3017

将于6月上市 上汽大众途观L ePro谍照曝光

车质网 浏览 3020

阿富汗称与巴基斯坦在伊斯坦布尔举行第三轮谈判

国际在线 浏览 3916

活塞31分狂胜尼克斯巩固东部第一 坎宁安29+13布伦森25分

醉卧浮生 浏览 3240

王健林限高措施已取消

YOUNG财经 浏览 4637

10套不重样出游穿搭,国庆照着穿又美又撩人!

Yuki女人故事 浏览 4678

第三届鸟巢数字体验节启幕:机器人嘉年华打造未来生活新场景

环球网资讯 浏览 4298

马斯克称赞:可能在5年内超越!

都市快报橙柿互动 浏览 4113

OpenAI确认旗下首款AI硬件今年发布,形态有望为“一支笔”

IT之家 浏览 3110

库克将正式卸任苹果CEO:创造4万亿帝国 访华达20次

澎湃新闻 浏览 30924

小米汽车直播间遭网暴,仅剩一家门店直播,雷军抖音账号半个月掉粉30万

红星资本局 浏览 4259

2027款AMG CLE63敞篷亮相 换装V8发动机

太平洋汽车 浏览 2590
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1