关闭广告

Claude Opus 4.5来了!单次生成打造《我的世界》,还破解高难度Agent测评

智东西2288人阅读

智东西
作者 陈骏达
编辑 李水青

智东西11月25日报道,今天,Anthropic发布了自家的旗舰编程模型Claude Opus 4.5。Anthropic称,这是全球范围内在编程、agents和计算机使用方面最强大的模型。

在真实世界软件工程测试SWE-bench Verified中,Claude Opus 4.5成为首款得分超过80%的AI模型,不仅领先于自家的Claude Sonnet 4.5,还超过了上周发布的Gemini 3 Pro和GPT-5.1 Codex-Max。


Anthropic还把该公司面试人类工程师的高难度居

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

沙特主帅:对伊拉克的比赛将是我人生中最重要的一战

懂球帝 浏览 2764

国防部长董军出席第十二届北京香山论坛并作主旨发言

政知新媒体 浏览 3518

最火的赛道,独角兽撑不下去了?

中国新闻周刊 浏览 1886

腾势汽车12月销售18139辆 全年累计157134辆

网易汽车 浏览 1744

内讧了,郭昊文&赵柏清刚开场就激情对喷,随后双双被DNP

懂球帝 浏览 540

赛季末巴黎频造新大师,这次小黑能一黑到底吗?

网球之家 浏览 2583

蔚来公司12月交付新车48,135台 同比增长54.6%

网易汽车 浏览 1767

戳破马拉松泡沫经济

诗与星空 浏览 2686

极氪启动跨代智驾众筹 24款老车主可低价直升Thor-U

网易汽车 浏览 2233

美国电动汽车遭遇“断崖式”下跌

电动知家 浏览 2524

委内瑞拉:逮捕一批"掌握美情报机构直接信息"的雇佣兵

红星新闻 浏览 11998

连刷6集,这部新剧太刺激了

来看美剧 浏览 1313

红旗首款越野车征名送车

大象新闻 浏览 2784

每月抽查5%商家 外卖平台“新国标”落地

北京商报 浏览 2135

北京105-74大胜广东 球员评价:3人满分,7人及格,2人低迷

篮球资讯达人 浏览 1870

被控与电诈集团有关,泰国财政部副部长辞职

环球网资讯 浏览 2647

300135前三季度由盈转亏!池州国资入主后大动作,沥青龙头跨界投资半导体

时代周报 浏览 2742

陈伟霆无预警官宣结婚生子,与何穗相恋6年终圆满,众星发声祝福

扒虾侃娱 浏览 2663

航拍画面披露:日本被指昼夜赶建军事基地

环球网资讯 浏览 2127

威少:梦想打橄榄球的我从未想过能有如今成就,希望我能激励到其他人

懂球帝 浏览 1901

未来智能完成亿元级A轮融资,蚂蚁集团领投、启明创投超额跟投

雷科技 浏览 2822
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1