关闭广告

上海AI实验室推出ATLAS:让AI在科学推理中"败下阵来"的超级考场

科技行者3380人阅读


这项由上海AI实验室领导的研究于2024年11月发表在arXiv预印本平台,论文编号为2511.14366。有兴趣深入了解的读者可以通过该编号查询完整论文。研究团队包括来自复旦大学、北京大学、上海交通大学等25所知名院校的专家学者,他们共同开发了一个名为ATLAS的科学推理评测平台。

当人工智能在各种考试中频频刷新高分记录时,一个有趣的现象出现了:那些曾经被视为"金标准"的测试题目,如今对顶级AI模型来说似乎变得过于简单。就像一个天赋异禀的学生轻松通过了小学考试,但我们却不知道他是否真正具备了解决复杂现实问题的能力。

正是在这样的背景下,上海AI实验室的研究团队决定为AI模型打造一个真正的"地狱级考场"。他们开发的ATLAS平台就像是一个专门设计来让AI"败下阵来"的超级测试场,专门检验AI在科学推理方面的真实能力。这个名字本身就很有意味——ATLAS意为"AGI导向的科学逻辑应用测试平台",寓意着要像古希腊神话中扛起天空的巨人一样,承担起衡量AI真实科学推理能力的重任。

想象一下,如果把现有的AI测试比作小学数学题,那么ATLAS就像是博士入学考试。它不满足于简单的

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

锦州银行落幕引发渠道整合,超1600只基金上演“代销大迁徙”

券商中国 浏览 4162

真爱大牌返场|| 每次分享都秒没!真不愧是我爱了十年的牌子

黎贝卡的异想世界 浏览 6475

邮报:未来几战将决定波特去留,他若下课西汉姆已在考虑比利奇

直播吧 浏览 5143

宁波网友投诉到理发店理发被诱导消费:1次花了6万元

潇湘晨报 浏览 8552

郝蕾说金敏喜是自己在亚洲的唯一对手

芊手若 浏览 4122

女人过了60岁也别放弃变美!冬季看看这些穿搭,得体又大方

静儿时尚达人 浏览 3808

闹大了!荣梓杉被女友控诉出轨家暴,回应否认,评论区沦陷了

娱乐圈笔娱君 浏览 4296

前男友转身花5亿娶闺蜜,徐梵溪的选择耐人寻味

失宠的小野猪 浏览 3611

今年冬天最流行的4双鞋,配阔腿裤时髦又高级!

LinkFashion 浏览 3103

海盗船发布《使命召唤:黑色行动 7》联名外设,含键盘等多款产品

IT之家 浏览 4030

消失4年后,主持人程雷官宣一则喜讯

除夕烟火灿烂 浏览 3827

没补贴、收购置税,新能源车好日子到头了?现实会打服“恨电派”

小李车评李建红 浏览 5036

卢拉称和特朗普见面像"一见钟情" 上个月刚大骂特朗普

极目新闻 浏览 95696

苏州大学突破:8B模型实现长文理解媲美GPT-4o

科技行者 浏览 4164

张雨绮被抵制成功!辽视春晚已将她除名

萌神木木 浏览 3239

刚刚,马云现身阿里千问工区

网易智能 浏览 3141

卷首语 | 在动物园散步才是正经事

时尚COSMO 浏览 6480

特朗普:已开始从委石油资源中赚钱

环球时报国际 浏览 3413

以军空袭加沙多地致至少28人死亡

环球网资讯 浏览 3131

台北袭击案行凶者被造谣是"大陆籍" 蒋万安驳斥

看看新闻Knews 浏览 14884

两人涉嫌切割小区23部电梯钢绳被拘 原物管称被迫退场

红星新闻 浏览 7578
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1