关闭广告

复旦大学等顶尖高校联手研发:AI模型学会像侦探一样使用工具

科技行者3226人阅读


这项由复旦大学、同济大学、新加坡国立大学、华盛顿大学、电子科技大学以及香港中文大学联合开展的研究发表于2026年1月,论文编号为arXiv:2601.18631v1,为多模态大语言模型的工具使用能力带来了重大突破。

现代人工智能模型就像是刚学会看图识字的学生,虽然能够理解图像内容,但在面对需要多步推理的复杂视觉任务时往往力不从心。比如让AI规划一条从起点到终点的安全路径,既要避开障碍物,又要找到最短路线,或者让AI完成拼图游戏,需要理解图像的整体结构和局部细节。这些任务对人类来说相对简单,但对AI来说却是巨大挑战。

正如人类在遇到超出自身能力的问题时会借助工具一样,研究团队提出了一个革命性的想法:让AI模型学会主动使用各种视觉工具来解决复杂问题。这就好比教会一个学生不仅要会做题,还要知道什么时候该用计算器,什么时候该用尺子,什么时候该用放大镜。

研究团队开发的AdaReasoner系统就像是培养了一位经验丰富的侦探。这位AI侦探不仅具备基本的观察能力,更重要的是,它学会了在破案过程中灵活运用各种侦查工具。当遇到需要精确定位的线索时,它会使用"放大镜工具";当需

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

伊朗高级官员:已做好与美以长期作战的准备

央视新闻客户端 浏览 2501

一觉醒来霍尔木兹传大消息 伊被指启动通行管理新机制

中国基金报 浏览 14623

以军攻势升级 加沙两天内超4万人流离失所

澎湃新闻 浏览 5213

4月21日上市 2026款乐道L90官图发布

车质网 浏览 1681

小米SU7凌晨突发撞击事故 车辆爆燃施救人员未打开车门

网易汽车 浏览 4542

中加领导人时隔8年首次会晤 外交部回应

外交部网站 浏览 9791

强化AI编程能力迎战谷歌!OpenAI发布GPT-5.2-Codex,软件工程和网安一把抓

华尔街见闻官方 浏览 3758

传祺向往S9上市,四驱+华为全家桶+宁德电池

SUV大百科 浏览 5058

“食安AI博士”智能体首秀进博会!

文汇报 浏览 4228

鸿蒙智行"9系"扩容 首款MPV智界V9来了

网易汽车 浏览 3800

乌总统:美方28点计划已有所精简

每日经济新闻 浏览 3961

比亚迪元PLUS迎来史诗级升级,续航或超650km!

刘哥谈体育 浏览 4218

芒米Pocket Max掌机:模块化设计、大容量电池与强芯片的结合

IT之家 浏览 3381

上海老人落水获救 4名老人花4天完成"不打扰"的致谢

大风新闻 浏览 8960

钟楚曦合影风波升级!站C位评论区沦陷,杨幂刘亦菲差点没挤进去

萌神木木 浏览 4374

抓走马杜罗的美军三角洲部队 曾两次大败而归

扬子晚报 浏览 10256

“这件羽绒服”今年冬天又火了,怎么搭都时髦保暖!

LinkFashion 浏览 3728

姚晨:自然予我

时尚COSMO 浏览 6577

撒贝宁去加拿大探望丈人,带着老婆孩子逛街

甜柠聊史 浏览 4624

汪涵老婆带82岁母亲拍照,透露从芒果离职原因

心静物娱 浏览 3828

孙红雷和妻子王骏迪逛街,比老婆矮显娇小

八怪娱 浏览 3490
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1