关闭广告

DeepSeek连发两篇论文背后,原来藏着一场学术接力

机器之心Pro3413人阅读



编辑|张倩、陈陈

2026 年 1 月过半,我们依然没有等来 DeepSeek V4,但它的模样已经愈发清晰。

最近,DeepSeek 连发了两篇论文,一篇解决信息如何稳定流动,另一篇聚焦知识如何高效检索。

第一篇论文(mHC)出来的时候,打开论文的人都表示很懵,直呼看不懂,让 AI 助手用各种方式讲给自己听。我们也翻了翻网友的讨论,发现理解起来比较透彻的办法其实还是要回到研究脉络,看看这些年研究者们是怎么接力的。要理解第二篇论文(Conditional Memory)也是如此。

于是,我们就去翻各路研究者的分析。这个时候,我们发现了一个有意思的现象:DeepSeek 和字节 Seed 团队的很多工作其实是存在「接力」的 ——mHC 在字节 Seed 团队 HC(Hyper-Connections)的基础上进行了重大改进;Conditional Memory 则引用了字节 Seed 的 OverEncoding、UltraMem 等多项工作。

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

美联储年内“三连降”,2026年利率走向何方?

中新经纬 浏览 3855

留几手为闫学晶叫屈?称网友自卑敏感

小徐讲八卦 浏览 3450

外观设计风格独特 本田0 α原型车发布

车质网 浏览 3735

沙特大幅下调旗舰原油溢价至五年低点,全球供应过剩压力显现

华尔街见闻官方 浏览 3858

将于12月5日上市 别克至境世家广州车展发布

网易汽车 浏览 4080

纯电汉兰达?丰田发布新款SUV预告,向新时代低头?

正在说车 浏览 3266

伊姐周六热推:《长安二十四计》;电视剧《唐诡奇谭》......

伊周潮流 浏览 3044

闪电快讯|2026款比亚迪宋Pro DM-i上市,纯电续航提升至220km

电厂 浏览 3475

中国驻英国使馆发言人就英方制裁中国实体问题答记者问

网易财经 浏览 4431

马杜罗紧急求助普京:委内瑞拉需要导弹、雷达和飞机

上观新闻 浏览 4152

数十农民工被拖欠百万工钱 劳务公司:争取春节前兑付

大风新闻 浏览 6594

图片报:多特有意巴萨小将吉列,球员合同2027年到期

懂球帝 浏览 4460

入秋包包合集!这12个有质感还不撞款!

Yuki女人故事 浏览 4515

独家|接盘露笑弃子藏暗雷?美克家居豪赌AI算力,标的实控人控股企业被曝欠税4205万元

时代周报 浏览 3411

重庆:对企业面向工业领域研发垂类大模型、智能体 给予最高200万元奖励

证券时报 浏览 3075

杜兰特至少降薪4000万美元?高管建议火箭最多2年8000万与他续约

罗说NBA 浏览 3675

周末利好刷屏!中美元首通话、国常会重磅,下周一重磅发布会

看财经show 浏览 5085

eSIM来了,但还在来的路上

北京商报 浏览 4399

不少老人宁愿挨冻也不敢开暖气,让人痛心!河北农村取暖问题,不能再耽搁了

每日经济新闻 浏览 3367

金九银十冲刺期:中国车企最新销量与目标完成率同步披露

汽车族杂志 浏览 4632

沃尔沃中国未来姓沃还是姓吉?

禾颜阅车 浏览 4579
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1