关闭广告

Claude Opus 4.5来了!单次生成打造《我的世界》,还破解高难度Agent测评

智东西3792人阅读

智东西
作者 陈骏达
编辑 李水青

智东西11月25日报道,今天,Anthropic发布了自家的旗舰编程模型Claude Opus 4.5。Anthropic称,这是全球范围内在编程、agents和计算机使用方面最强大的模型。

在真实世界软件工程测试SWE-bench Verified中,Claude Opus 4.5成为首款得分超过80%的AI模型,不仅领先于自家的Claude Sonnet 4.5,还超过了上周发布的Gemini 3 Pro和GPT-5.1 Codex-Max。


Anthropic还把该公司面试人类工程师的高难度居

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

里沙利松:踢日本要展现出与踢韩国一样的强度

懂球帝 浏览 4326

阿Sa大方认爱健身教练!为什么女明星容易陷入“教练情缘”?

仙女事件簿 浏览 2633

卡位AI算力基建狂潮,鸿辉光通加快实现向光器件隐形龙头的蜕变

第一财经资讯 浏览 4828

世体:拉波尔塔率队访问布鲁日,参加接待仪式并漫步市中心

懂球帝 浏览 3988

日媒:如何就美国突袭委内瑞拉表态 高市陷入两难

参考消息 浏览 10808

阿尔特塔:英超是欧冠决赛的预演?我不认为球员会这么想

懂球帝 浏览 906

光伏“卖铲人”去年净利腰斩

网易财经 浏览 2658

U16国足4-1复仇朝鲜!终结热身2连败 15岁红星大四喜+一条龙爆射

我爱英超 浏览 4312

一个手机壳卖200,这家深圳公司靠什么掏空老外钱包?

花朵财经 浏览 3080

特朗普:以色列与哈马斯签署"20点计划"第一阶段协议

央视新闻客户端 浏览 3551

欧洲8国集体反击特朗普 英国首相:将与美国政府交涉

极目新闻 浏览 7320

35岁男子自称婚内出轨女大学生 妻子还有40多天生产

上观新闻 浏览 9216

卡塔尔正式投诉以色列:公然侵犯主权 违反国际公约

上观新闻 浏览 4789

我玩我的,管你是谁!亏近50%鑫元消费甄选值得“点赞”!

一地基毛 浏览 4039

进苏超决赛,泰州主帅:队伍分工明确,三个臭皮匠顶个诸葛亮

懂球帝 浏览 4107

塞纳河“上岸”不易:20年合约、赔350万成为失信人、抑郁症也要赔钱…小偶像们那些年打过的官司

仙女事件簿 浏览 3553

E句话| 姐有新恋情啦?

仙女事件簿 浏览 3352

郝蕾风波升级!被扒曾参演《狂野时代》闹掰,辛芷蕾发声打脸她

萌神木木 浏览 4006

特朗普专机着陆区附近发现"狩猎架" FBI证实介入调查

红星新闻 浏览 9651

王菲没想到女儿窦靖童,会以头秃理由嫌弃亲爹

千言娱乐记 浏览 4075

40岁童瑶与42岁蒋欣:气质对比很明显

大眼妹妹 浏览 4072
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1