关闭广告

DeepSeek连发两篇论文背后,原来藏着一场学术接力

机器之心Pro3414人阅读



编辑|张倩、陈陈

2026 年 1 月过半,我们依然没有等来 DeepSeek V4,但它的模样已经愈发清晰。

最近,DeepSeek 连发了两篇论文,一篇解决信息如何稳定流动,另一篇聚焦知识如何高效检索。

第一篇论文(mHC)出来的时候,打开论文的人都表示很懵,直呼看不懂,让 AI 助手用各种方式讲给自己听。我们也翻了翻网友的讨论,发现理解起来比较透彻的办法其实还是要回到研究脉络,看看这些年研究者们是怎么接力的。要理解第二篇论文(Conditional Memory)也是如此。

于是,我们就去翻各路研究者的分析。这个时候,我们发现了一个有意思的现象:DeepSeek 和字节 Seed 团队的很多工作其实是存在「接力」的 ——mHC 在字节 Seed 团队 HC(Hyper-Connections)的基础上进行了重大改进;Conditional Memory 则引用了字节 Seed 的 OverEncoding、UltraMem 等多项工作。

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

ED网红病,正在掏空年轻女性

她刊 浏览 1715

‍♂️吧友们抓紧了!国足主帅报名将于明天截止

直播吧 浏览 4273

英伟达开始在美国生产GPU,台积电加速布局

半导体行业观察 浏览 4341

卢浮宫抢劫案两嫌疑人均30多岁 一人试图登机离境被抓

极目新闻 浏览 9297

托蒂:我们那一代水平太高,很难再同时出现如此多的优秀球员

懂球帝 浏览 4112

年度焦点!这是你从没见过的独特电影创作

幕味儿 浏览 3720

StereoAdapter:北大首提自监督,适配水下双目深度估计

新智元 浏览 4427

“一身白”越来越流行,冬天这样穿太高级了!

LinkFashion 浏览 3870

马杜罗纽约"首秀"神态轻松 比"V字剪刀手"遭多方解读

红星新闻 浏览 9231

一家4口爬山妻子坠亡 警方排除他杀可能:属于高空坠亡

极目新闻 浏览 42609

50、60岁的女人就要这么穿!自然老去,不扮嫩反而更美了

静儿时尚达人 浏览 4461

官方:湖人裁掉RJ-戴维斯、安东-沃特森等4人

懂球帝 浏览 4503

媒体:特朗普"急踩刹车"与伊朗停火 以方声明流露不满

新民晚报 浏览 58519

89天交付3万!蔚来新ES8单骑救主

科技丛林 浏览 3552

高管“换血”,股东内斗落幕!200亿淳厚基金迎国资入主

独角金融 浏览 3392

消息称三星Galaxy S27 Ultra将搭载更安全的Polar ID面部识别技术

IT之家 浏览 3216

初秋衣服不必准备太多,这几件单品提前买好,简单百搭不挑人

静儿时尚达人 浏览 6440

李在镕的抉择:撤离家电、加码存储,三星中国市场大“调仓”

华夏时报 浏览 1130

巴基斯坦官员称中方说服伊朗加入停火谈判 外交部回应

每日经济新闻 浏览 51702

反趋势?理想汽车盈转亏!MEGA召回烧没11亿元?

道哥说车 浏览 4050

利智输了?李连杰终是没放下一直亏欠的“她”

顾史 浏览 3307
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1