关闭广告

复旦大学等顶尖高校联手研发:AI模型学会像侦探一样使用工具

科技行者1472人阅读


这项由复旦大学、同济大学、新加坡国立大学、华盛顿大学、电子科技大学以及香港中文大学联合开展的研究发表于2026年1月,论文编号为arXiv:2601.18631v1,为多模态大语言模型的工具使用能力带来了重大突破。

现代人工智能模型就像是刚学会看图识字的学生,虽然能够理解图像内容,但在面对需要多步推理的复杂视觉任务时往往力不从心。比如让AI规划一条从起点到终点的安全路径,既要避开障碍物,又要找到最短路线,或者让AI完成拼图游戏,需要理解图像的整体结构和局部细节。这些任务对人类来说相对简单,但对AI来说却是巨大挑战。

正如人类在遇到超出自身能力的问题时会借助工具一样,研究团队提出了一个革命性的想法:让AI模型学会主动使用各种视觉工具来解决复杂问题。这就好比教会一个学生不仅要会做题,还要知道什么时候该用计算器,什么时候该用尺子,什么时候该用放大镜。

研究团队开发的AdaReasoner系统就像是培养了一位经验丰富的侦探。这位AI侦探不仅具备基本的观察能力,更重要的是,它学会了在破案过程中灵活运用各种侦查工具。当遇到需要精确定位的线索时,它会使用"放大镜工具";当需

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

50岁女性冬季穿衣指南:避开 2 大禁忌,这样得体又时髦

静儿时尚达人 浏览 2137

4400亿!中证A500指数基金一周年:总规模增近50%,近80家基金公司下场

券商中国 浏览 3443

彻底对标苹果?小米17 Air要来,可iPhone Air都凉了

雷科技 浏览 2620

从一秒起身的机器人到降本80%的数据,鹿明机器人破解具身机器人智能化困境

雷峰网 浏览 1731

美媒:乌克兰向美国提交对最新“和平计划”的回复

澎湃新闻 浏览 2020

英特尔CEO确认:18A工艺已进入大规模量产,为三代产品奠定基础

IT之家 浏览 2639

晚点独家丨千问 app,阿里要怎么做中国的 “ChatGPT”

晚点LatePost 浏览 2363

vivo TWS 5:一场耳机里的「音乐革命」

36氪 浏览 2173

啃下数百万骑手社保的“硬骨头”,美团花了五年

雪豹财经社 浏览 2509

前TVB男星回应拒演电影《寻秦记》传闻

TVB剧评社 浏览 1604

两场硬仗,一个拐点,蔚来穿越最长谷底

雪豹财经社 浏览 2671

极氪8X实车现身,大过宝马X5+5/6座可选,配1401马力+双腔空悬?

燕赵女司机 浏览 1642

特朗普称俄为"纸老虎" 普京回应

央视新闻客户端 浏览 2140

43岁张杰退出投票,粉丝和路人都点赞

眼界看视野 浏览 1449

宗馥莉将独立经营“娃小宗” 名下仍关联超200家企业

21世纪经济报道 浏览 2761

计划3年完成200个AI项目 川影联动人工智能协会打造“AI影视工业梦工厂”

封面新闻 浏览 2874

周华健回潮汕探亲祭祖

阿纂看事 浏览 2204

前总裁起诉申通快递,要求分得前妻名下2028万股股权

YOUNG财经 浏览 1548

这才是中年女人该有的打扮,不扮嫩、不穿花,简约大方还显贵

静儿时尚达人 浏览 1800

林允儿回应新剧争议,语带挑衅惹众怒,曝与韩方合作将全面收紧

扒虾侃娱 浏览 3536

23岁中国女导演在柬埔寨坠亡 头部与身体遭受严重撞击

红星新闻 浏览 5227
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1