关闭广告

复旦大学等顶尖高校联手研发:AI模型学会像侦探一样使用工具

科技行者3222人阅读


这项由复旦大学、同济大学、新加坡国立大学、华盛顿大学、电子科技大学以及香港中文大学联合开展的研究发表于2026年1月,论文编号为arXiv:2601.18631v1,为多模态大语言模型的工具使用能力带来了重大突破。

现代人工智能模型就像是刚学会看图识字的学生,虽然能够理解图像内容,但在面对需要多步推理的复杂视觉任务时往往力不从心。比如让AI规划一条从起点到终点的安全路径,既要避开障碍物,又要找到最短路线,或者让AI完成拼图游戏,需要理解图像的整体结构和局部细节。这些任务对人类来说相对简单,但对AI来说却是巨大挑战。

正如人类在遇到超出自身能力的问题时会借助工具一样,研究团队提出了一个革命性的想法:让AI模型学会主动使用各种视觉工具来解决复杂问题。这就好比教会一个学生不仅要会做题,还要知道什么时候该用计算器,什么时候该用尺子,什么时候该用放大镜。

研究团队开发的AdaReasoner系统就像是培养了一位经验丰富的侦探。这位AI侦探不仅具备基本的观察能力,更重要的是,它学会了在破案过程中灵活运用各种侦查工具。当遇到需要精确定位的线索时,它会使用"放大镜工具";当需

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

可变焦激光雷达 传祺向往S7 PRO+上市售15.98万起

网易汽车 浏览 4972

特朗普提出将美国军费提升至1.5万亿美元

澎湃新闻 浏览 3445

入职要姓“鼠”?三只松鼠工作人员回应

第一财经资讯 浏览 3964

北约或取消峰会 避免与特朗普冲突出现"戏剧性场面"

环球网资讯 浏览 34489

范乔丹:小卡刚来猛龙就说会走 感谢他让我赚大钱

体坛周报 浏览 3775

小鹏将推出长途增程混合动力X9,单次续航1600公里

MOTO 浏览 5276

抖音&LV-NUS开源多模态新模,以小博大刷新SOTA,8B推理比肩GPT4o

量子位 浏览 4504

山东城商行“王者之战”戏剧性落幕

财经众议院 浏览 2731

这是陈妍希?新剧开播后居然长这样

Yuki女人故事 浏览 3674

是否以入选英格兰队为目标?勒温:努力训练,顺其自然

懂球帝 浏览 3635

别克至境L7:新能源赛道,没有人能靠旧身份活下去

AutoBusiness 浏览 5290

为财政刺激计划融资,日本拟增发逾11.5万亿日元新债

华尔街见闻官方 浏览 3924

蒋凡重启阿里:一场AI重构内核的千亿实验

博望财经 浏览 4441

46岁董璇被曝怀二胎,本人现身机场脱外套辟谣,小腹平坦状态超好

扒虾侃娱 浏览 4358

拉斯帕多里:意大利拥有成功所需的一切;我对加盟马竞很满意

懂球帝 浏览 3877

今年春天最流行的6件风衣!

LinkFashion 浏览 2723

日本派大学生+以小打大仍5-0叙利亚 黄健翔惊叹 :夺世界杯非玩笑

我爱英超 浏览 3445

纵横外卖江湖十三载!美团做对了什么?

互联网那些事 浏览 2696

首艘、首颗、首飞!连续实现重大突破 中国制造硬核实力再出圈

环球网资讯 浏览 4291

创维抄袭格力,为何低级得如此赤裸裸?

正经社 浏览 3338

中国平安这张“卫星牌”,打得太“牛”了

野马财经 浏览 1159
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1