关闭广告

DeepSeek连发两篇论文背后,原来藏着一场学术接力

机器之心Pro3581人阅读



编辑|张倩、陈陈

2026 年 1 月过半,我们依然没有等来 DeepSeek V4,但它的模样已经愈发清晰。

最近,DeepSeek 连发了两篇论文,一篇解决信息如何稳定流动,另一篇聚焦知识如何高效检索。

第一篇论文(mHC)出来的时候,打开论文的人都表示很懵,直呼看不懂,让 AI 助手用各种方式讲给自己听。我们也翻了翻网友的讨论,发现理解起来比较透彻的办法其实还是要回到研究脉络,看看这些年研究者们是怎么接力的。要理解第二篇论文(Conditional Memory)也是如此。

于是,我们就去翻各路研究者的分析。这个时候,我们发现了一个有意思的现象:DeepSeek 和字节 Seed 团队的很多工作其实是存在「接力」的 ——mHC 在字节 Seed 团队 HC(Hyper-Connections)的基础上进行了重大改进;Conditional Memory 则引用了字节 Seed 的 OverEncoding、UltraMem 等多项工作。

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

马伊琍新年第一天晒全家福!和大女儿合影好温馨

隔壁灵妹妹 浏览 3645

俄白“西方-2025”联合军演结束

环球网资讯 浏览 5418

三件外套拍出17万美元天价!为什么时装精都想买她的同款?

黎贝卡的异想世界 浏览 2925

英伟达GTC大会利好兑现?CPO板块大跌

财闻 浏览 2470

马斯克3小时高能量访谈,信息量大到爆炸

深蓝财经 浏览 3605

年销破28万辆!一汽解放斥资百亿元买理财,商用车龙头变“投资大户”?

时代周报 浏览 3378

阿根廷3-0阿尔及利亚!梅西世界杯首次戴帽创纪录 16球升历史第1

我爱英超 浏览 106

你喝的奶茶上黑名单了吗?教你在家就能做的神仙饮品

Yuki女人故事 浏览 4504

帅炸了!华为Pura 90 Pro Max首发光感无界主题:长按锁屏手机秒变透明

快科技 浏览 1779

1万亿订单再加3500-5000亿美元!OpenAI“停不下来”,“当你欠每家数千亿美元,钱的问题自己会解决”?

华尔街见闻官方 浏览 4756

向华强说娱乐圈明星美女他看不上眼:极致宠溺背后的事业共生学

互联观察联盟 浏览 3437

初秋衣服不必准备太多,这几件单品提前买好,简单百搭不挑人

静儿时尚达人 浏览 6641

河北农村老人挨冻,取暖费为何贵上万

深蓝财经 浏览 2959

老己,买点什么犒劳辛苦了一年的你?

时尚COSMO 浏览 3812

女人会不会穿衣区别很大,记住这“三要三不”原则,得体大方

静儿时尚达人 浏览 1356

AI改变金融系统,周小川、肖远企发声

中国基金报 浏览 4393

日本前首相石破茂再批"日本拥核"言论

界面新闻 浏览 3837

特朗普,重仓了!

中国基金报 浏览 4186

双剑合璧:科创板、创业板的重大改革与长期投资价值

尺度商业 浏览 4315

纳斯达克称申请将工作日交易时长延长至23小时

财联社 浏览 3786

19人徒步被困河南辉县南太行山悬崖 1人突发疾病遇难

红星新闻 浏览 9770
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1