关闭广告

上海AI实验室推出ATLAS:让AI在科学推理中"败下阵来"的超级考场

科技行者3541人阅读


这项由上海AI实验室领导的研究于2024年11月发表在arXiv预印本平台,论文编号为2511.14366。有兴趣深入了解的读者可以通过该编号查询完整论文。研究团队包括来自复旦大学、北京大学、上海交通大学等25所知名院校的专家学者,他们共同开发了一个名为ATLAS的科学推理评测平台。

当人工智能在各种考试中频频刷新高分记录时,一个有趣的现象出现了:那些曾经被视为"金标准"的测试题目,如今对顶级AI模型来说似乎变得过于简单。就像一个天赋异禀的学生轻松通过了小学考试,但我们却不知道他是否真正具备了解决复杂现实问题的能力。

正是在这样的背景下,上海AI实验室的研究团队决定为AI模型打造一个真正的"地狱级考场"。他们开发的ATLAS平台就像是一个专门设计来让AI"败下阵来"的超级测试场,专门检验AI在科学推理方面的真实能力。这个名字本身就很有意味——ATLAS意为"AGI导向的科学逻辑应用测试平台",寓意着要像古希腊神话中扛起天空的巨人一样,承担起衡量AI真实科学推理能力的重任。

想象一下,如果把现有的AI测试比作小学数学题,那么ATLAS就像是博士入学考试。它不满足于简单的

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

特朗普向60国发出邀请之际 多国正商量怎么对付美国

新民周刊 浏览 8067

44岁前TVB花旦有望跟前未婚夫复合

探长影视解说 浏览 3716

广东佛山路边停车为收费出"奇招" 车主吐槽:吃相难看

中国新闻周刊 浏览 7783

多名美高官将参与监督在委事务 特朗普:最终由我负责

每日经济新闻 浏览 9925

剑南春丨曼联1-1利兹联,阿伦森破门,齐尔克泽助攻库尼亚扳平

懂球帝 浏览 3646

ACEMAGIC阿迈奇预告M1A PRO+迷你主机,搭载锐龙AI Max+ 395

IT之家 浏览 4035

泽连斯基:任何形式的领土交换都“不可接受”

每日经济新闻 浏览 8038

西甲:皇家贝蒂斯2比0奥萨苏纳

体坛周报 浏览 4966

男团奋勇剑指卫冕!王楚钦抢五过关 林诗栋完胜 梁靖崑完全觉醒

颜小白的篮球梦 浏览 1325

三年打入越南Top 5,这家纸巾厂的出海秘诀是什么?

虎嗅APP 浏览 4616

全球1~8月电池装机量,韩系继续败退

汽车公社 浏览 4691

德国一公司研发无贵金属电极技术让绿氢生产又快又便宜,明年试产

IT之家 浏览 3487

活塞121-90狂胜送尼克斯四连败,坎宁安29分13助,布伦森25分

懂球帝 浏览 3547

秋季的穿衣难度并不高,选择基础款、配色不沉闷,舒适又减龄

静儿时尚达人 浏览 4671

拉科布声明未来2年所有人将在一起 这意味着勇士不引援了?

仰卧撑FTUer 浏览 4548

泰国达叻府5县实施宵禁

新京报 浏览 3829

杭州一公园白鹤"大战"无人机 现场市民看得心惊肉跳

都市快报橙柿互动 浏览 32847

初三男生杀害女同学前检索会担什么责 出庭时变胖变白

红星新闻 浏览 8393

61岁华西女教授创业冲刺港股IPO,估值超34亿元,腾讯、启明等参股

红星资本局 浏览 3466

乐道L80续航短了些,有90%选择baas,58%选择黑外观

正在说车 浏览 775

叔叔宗泽后再发声:娃哈哈不是宗家的 水军害了宗馥莉

第一财经资讯 浏览 4591
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1