关闭广告

上海AI实验室推出ATLAS:让AI在科学推理中"败下阵来"的超级考场

科技行者3212人阅读


这项由上海AI实验室领导的研究于2024年11月发表在arXiv预印本平台,论文编号为2511.14366。有兴趣深入了解的读者可以通过该编号查询完整论文。研究团队包括来自复旦大学、北京大学、上海交通大学等25所知名院校的专家学者,他们共同开发了一个名为ATLAS的科学推理评测平台。

当人工智能在各种考试中频频刷新高分记录时,一个有趣的现象出现了:那些曾经被视为"金标准"的测试题目,如今对顶级AI模型来说似乎变得过于简单。就像一个天赋异禀的学生轻松通过了小学考试,但我们却不知道他是否真正具备了解决复杂现实问题的能力。

正是在这样的背景下,上海AI实验室的研究团队决定为AI模型打造一个真正的"地狱级考场"。他们开发的ATLAS平台就像是一个专门设计来让AI"败下阵来"的超级测试场,专门检验AI在科学推理方面的真实能力。这个名字本身就很有意味——ATLAS意为"AGI导向的科学逻辑应用测试平台",寓意着要像古希腊神话中扛起天空的巨人一样,承担起衡量AI真实科学推理能力的重任。

想象一下,如果把现有的AI测试比作小学数学题,那么ATLAS就像是博士入学考试。它不满足于简单的

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

双十一购物不烧脑!看AI全能搭子荣耀Magic8如何重塑消费体验

新熵 浏览 4171

恩里克:我的球员今天表现得很出色,不过在结果上略有遗憾

懂球帝 浏览 3635

赵磊:一个把粉丝当ATM,最后和私生锁死的男人

八卦三缺一 浏览 3487

可惜了,这世界第一美少年

独立鱼 浏览 4171

泽连斯基:若不能及时获得资金 将大幅削减无人机生产

每日经济新闻 浏览 14121

大洗牌开启?医药代表管理办法出台,客情回扣模式或将终结

时代周报 浏览 884

美军损失11架"死神"无人机 特朗普为卖它曾欲改其分类

红星新闻 浏览 29547

比亚迪连续4个季度超越特斯拉

大象新闻 浏览 4182

海澜之家:衣柜变大,增长变小

斑马消费 浏览 124

47岁余皑磊演戏多年无人问,一演特务众人知

可乐谈情感 浏览 4306

泰柬冲突急转直下,世界三个没想到

牛弹琴 浏览 3368

蔚来年底盈利:超越短期目标,重塑自己的竞争力

百姓评车 浏览 4293

搭载地平线征程6E 全新MG4 530将于10月底开启交付

网易汽车 浏览 4164

张艺兴单依纯都在跳,“技能五子棋”是什么?

黔乡小姊妹 浏览 4537

王中磊夫妇转战短视频,影视一哥到底怎么了?

BT财经 浏览 3001

曼联连续5场英超不败,为阿莫林治下最长不败纪录

懂球帝 浏览 4071

43岁香港著名星二代和外籍男友已未婚生了孩子

阿废冷眼观察所 浏览 2720

4岁走失女童找到 参与救援的派出所所长在孩子旁边哭

极目新闻 浏览 10102

2026时髦风向:穿出氛围感才高级!

LinkFashion 浏览 3066

日本官宣美将在日部署中导系统

极目新闻 浏览 252

全系标配激光雷达 东风奕派eπ007+预售14.99万起

网易汽车 浏览 4065
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1