关闭广告

复旦大学等顶尖高校联手研发:AI模型学会像侦探一样使用工具

科技行者3358人阅读


这项由复旦大学、同济大学、新加坡国立大学、华盛顿大学、电子科技大学以及香港中文大学联合开展的研究发表于2026年1月,论文编号为arXiv:2601.18631v1,为多模态大语言模型的工具使用能力带来了重大突破。

现代人工智能模型就像是刚学会看图识字的学生,虽然能够理解图像内容,但在面对需要多步推理的复杂视觉任务时往往力不从心。比如让AI规划一条从起点到终点的安全路径,既要避开障碍物,又要找到最短路线,或者让AI完成拼图游戏,需要理解图像的整体结构和局部细节。这些任务对人类来说相对简单,但对AI来说却是巨大挑战。

正如人类在遇到超出自身能力的问题时会借助工具一样,研究团队提出了一个革命性的想法:让AI模型学会主动使用各种视觉工具来解决复杂问题。这就好比教会一个学生不仅要会做题,还要知道什么时候该用计算器,什么时候该用尺子,什么时候该用放大镜。

研究团队开发的AdaReasoner系统就像是培养了一位经验丰富的侦探。这位AI侦探不仅具备基本的观察能力,更重要的是,它学会了在破案过程中灵活运用各种侦查工具。当遇到需要精确定位的线索时,它会使用"放大镜工具";当需

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

独一无二,世界巨星蒂尔达·斯文顿卓越之作!

幕味儿 浏览 4590

71岁上海爷叔网恋"小姑娘"转30万 约会遭对方持刀勒索

上观新闻 浏览 18144

岚图泰山将于11月上市 4颗激光雷达加持/还有后轮转向

网易汽车 浏览 4650

贵州省能源局局长陈华接任茅台集团董事长

网易财经 浏览 4361

吉林延边州珲春市发生5.5级地震 震源深度560千米

界面新闻 浏览 9721

初秋衣服不必准备太多,这几件单品提前买好,简单百搭不挑人

静儿时尚达人 浏览 6645

世体:梅西在进入诺坎普前没联系巴萨的任何人请求许可

懂球帝 浏览 4328

阿里咬住字节,为卖Token拼了

中国企业家杂志 浏览 754

丘库埃梅卡:欧冠进球对我而言是巨大动力;本赛季想拿个冠军

懂球帝 浏览 4440

逃离5A景区的中年人,正在涌向“差评最多”的小店

她刊 浏览 1226

英媒:热刺希望能在冬窗签下马尔穆什,维拉也对他感兴趣

懂球帝 浏览 3549

《逍遥》大结局:纪严下线订单终于到达,最终还是领导了结了他!

肆季娱乐 浏览 3691

孙俪、罗晋53集都市职场剧,阵容强大,值得一看

楠鱼 浏览 5265

乌代表团赴美谈判 俄乌互相袭击

新华社 浏览 3915

插混加持 新款捷途旅行者C-DM本月17日上市

车质网 浏览 4422

500亿能源巨头独董失联,公司:原因不明

红星资本局 浏览 4528

福建舰入列在即 8万吨排水量成世界最大常规动力航母

极目新闻 浏览 10640

法尔克:水晶宫确实非常难对付,如果能保持零封就更完美了

懂球帝 浏览 3935

关婷娜十大惊艳片段,成熟女人的魅力

喜欢历史的阿繁 浏览 5284

租电版本售15.79万 乐道L60紫罗兰限定版上市

网易汽车 浏览 3835

聚酯纤维都没嫌老实人穷

老斯基财经 浏览 3792
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1