关闭广告

Claude Opus 4.5来了!单次生成打造《我的世界》,还破解高难度Agent测评

智东西4017人阅读

智东西
作者 陈骏达
编辑 李水青

智东西11月25日报道,今天,Anthropic发布了自家的旗舰编程模型Claude Opus 4.5。Anthropic称,这是全球范围内在编程、agents和计算机使用方面最强大的模型。

在真实世界软件工程测试SWE-bench Verified中,Claude Opus 4.5成为首款得分超过80%的AI模型,不仅领先于自家的Claude Sonnet 4.5,还超过了上周发布的Gemini 3 Pro和GPT-5.1 Codex-Max。


Anthropic还把该公司面试人类工程师的高难度居

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

惠若琪拟任新职!父母没生儿子被轻视

东方不败然多多 浏览 3675

美军对伊朗实施新的打击 伊朗南部连续传出爆炸声

每日经济新闻 浏览 23240

特朗普回应前助理被起诉:这是个卑鄙的家伙

参考消息 浏览 9372

三星Galaxy Ring 2智能戒指爆料:续航突破9天、佩戴更舒适

IT之家 浏览 1199

售13.98万起 吉利新能源皮卡四驱山地版/高寒版同步上市

网易汽车 浏览 3646

新研究发现 AI 的最大破绽:不是不够聪明,而是不会“骂人”

IT之家 浏览 4096

新增激光雷达 2026款比亚迪夏官图发布

车质网 浏览 3459

中国留学生到杨振宁在美办公室献花:晚安教授

极目新闻 浏览 7907

何小鹏“扒皮”验真身 国产人形机器人“摊牌了”

汽势传媒 浏览 4186

杭州一公园白鹤"大战"无人机 现场市民看得心惊肉跳

都市快报橙柿互动 浏览 32691

中网女单第三轮利斯挑落莱巴金娜

体坛周报 浏览 5053

斯帕莱蒂为跑轰尤文注入灵魂,奥彭达被重新“救活”

体坛周报 浏览 3711

我们给有毒染料找了个“替身”,而且它真的能吃…

中国科普博览 浏览 3640

詹姆斯:湖人的投篮困境终会过去;这周对我来说有点像训练营

懂球帝 浏览 3871

半导体设备龙头突感寒意,盛美上海“旺季不旺”,增长成色面临大考

时代周报 浏览 2690

米体:普利希奇将接受医疗检查,阿莱格里和米兰对美国队不满

懂球帝 浏览 4501

荷媒:阿贾克斯希望租借津琴科,已与阿森纳基本达成一致

懂球帝 浏览 3354

50岁女性冬季穿衣指南:避开 2 大禁忌,这样得体又时髦

静儿时尚达人 浏览 3813

从“土三轮”到“全球潮品”,徐州丰县的“三蹦子”何以“闯世界”

澎湃新闻 浏览 4421

王暖暖花6年才离掉婚 男方母亲曾带女子探监和他相亲

新京报 浏览 4588

俄官宣“末日鱼雷”完成核动力试验

环球网资讯 浏览 4285
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1