关闭广告

Claude Opus 4.5来了!单次生成打造《我的世界》,还破解高难度Agent测评

智东西4013人阅读

智东西
作者 陈骏达
编辑 李水青

智东西11月25日报道,今天,Anthropic发布了自家的旗舰编程模型Claude Opus 4.5。Anthropic称,这是全球范围内在编程、agents和计算机使用方面最强大的模型。

在真实世界软件工程测试SWE-bench Verified中,Claude Opus 4.5成为首款得分超过80%的AI模型,不仅领先于自家的Claude Sonnet 4.5,还超过了上周发布的Gemini 3 Pro和GPT-5.1 Codex-Max。


Anthropic还把该公司面试人类工程师的高难度居

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

董忠云:保持战略定力,增强必胜信心,A股有望恢复震荡上行趋势

首席经济学家论坛 浏览 4210

美联储主席最热人选哈塞特:CPI报告好得令人震惊,美联储有很大空间可以降息

华尔街见闻官方 浏览 3841

国庆出游,就要这么“出彩”!

Yuki女人故事 浏览 4826

深度丨怡园酒业连涨9倍:杨陵江的F2B2C酒饮商业操作系统开启裂变

财经无忌 浏览 3293

中国电动汽车出口欧洲通道打通,谁最受益?

电动汽车观察家 浏览 3430

中超第27轮传球成功率榜:国安第一

体坛周报 浏览 4299

运营商保险动作分化:中国移动线下开卖保险,电信旗下两张中介牌照相继摆上货架

蓝鲸新闻 浏览 3197

350亿vs25000亿!国产模型正打破美国AI编程垄断

无相商业趋势 浏览 3212

王家卫凉凉!开会支持《繁花》副导演精日言论,网友让他滚出中国

萌神木木 浏览 4306

美总统威胁对尼日利亚动武 尼方回应

环球网资讯 浏览 4320

AI学会玩游戏,还能像人类一样思考因果关系

科技行者 浏览 3365

不去掉这一点,贾国龙就赢不了罗永浩

振华观史 浏览 4212

柴麒敏:绿色低碳产业将释放约30万亿元新增投资

中国企业家杂志 浏览 3278

光伏巨头通威、隆基预亏近百亿,行业深度调整未见拐点

华尔街见闻官方 浏览 3368

全新一代问界M9上市,用140项技术创新回答何为“中国式豪华”

环球网资讯 浏览 529

韩安冉回应五婚,称暂时不会结烦了,与宋浩然离婚后仍每天见面

扒虾侃娱 浏览 4353

上海业主十一出游后推开家门懵了 精装房成"化粪池"

环球网资讯 浏览 4423

美无人机出现在委内瑞拉近海

北青网-北京青年报 浏览 3699

零件细节曝光 新款奔驰S级将于2026年推出

车质网 浏览 3314

内塔尼亚胡:加沙非军事化前 不会允许重建

新京报 浏览 3201

任泽平发声回应但斌“认错”:理性讨论比对错更重要

财视传播 浏览 3333
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1