关闭广告

DeepSeek连发两篇论文背后,原来藏着一场学术接力

机器之心Pro3584人阅读



编辑|张倩、陈陈

2026 年 1 月过半,我们依然没有等来 DeepSeek V4,但它的模样已经愈发清晰。

最近,DeepSeek 连发了两篇论文,一篇解决信息如何稳定流动,另一篇聚焦知识如何高效检索。

第一篇论文(mHC)出来的时候,打开论文的人都表示很懵,直呼看不懂,让 AI 助手用各种方式讲给自己听。我们也翻了翻网友的讨论,发现理解起来比较透彻的办法其实还是要回到研究脉络,看看这些年研究者们是怎么接力的。要理解第二篇论文(Conditional Memory)也是如此。

于是,我们就去翻各路研究者的分析。这个时候,我们发现了一个有意思的现象:DeepSeek 和字节 Seed 团队的很多工作其实是存在「接力」的 ——mHC 在字节 Seed 团队 HC(Hyper-Connections)的基础上进行了重大改进;Conditional Memory 则引用了字节 Seed 的 OverEncoding、UltraMem 等多项工作。

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

哈马斯高层在多哈遇袭后首次现身

政知新媒体 浏览 5114

中国机器人出海新篇章!伽利略系统进入马来西亚社保康复体系

观察者网 浏览 126

萧美琴在欧洲议会大楼参加会议并讲话 外交部回应

澎湃新闻 浏览 9864

美迪西子公司遭客户索赔1.59亿元,因新药项目安评报告交付滞后

红星资本局 浏览 5398

已获海港等队邀约,茹子楠表态站好梅州这班岗:拼到最后一秒

懂球帝 浏览 4185

报道:哈塞特势头不稳,特朗普一些亲信推举沃什当美联储主席

华尔街见闻官方 浏览 3884

打破场景界限,波司登与Kim Jones的合作让冬天更体面

时尚COSMO 浏览 3567

芦哲:降准降息利好哪些权益资产?

首席经济学家论坛 浏览 4551

遭美政府和科技企业联合施压 欧盟扛不住了又打算屈服

澎湃新闻 浏览 8416

豆瓣逆天9.6,世间再无如此大师云集的神作!

幕味儿 浏览 3767

英国安德鲁王子放弃王室头衔 被指与未成年人发生关系

CCTV国际时讯 浏览 10509

闪充加持 新款方程豹豹8申报信息曝光

车质网 浏览 2702

11国做出选择后特朗普喊话"中国将服软" 高市处境堪忧

胥言 浏览 9122

A股总市值接近109万亿元,2026年开启全面牛市需要具备哪些条件?

郭施亮 浏览 3425

SpaceX提示风险:太空AI技术未经验证,未必能商业化

财联社 浏览 1685

百亿私募一站式出海!招商证券打造跨境服务生态

券商中国 浏览 3795

英法空袭叙利亚中部地区 宣称打击极端组织"伊斯兰国"

环球网资讯 浏览 3499

律师谈吃娃娃菜中毒夫妻被抓:最高判刑十年以上

大象新闻 浏览 5680

美前驻华大使不装了:凭啥和中国组G2划"势力范围"

观察者网 浏览 4709

《营救汪星人》成毅正在透支自己的观众缘

娱乐圈笔娱君 浏览 3328

微软OneDrive AI人脸识别功能引争议:每年仅允许用户关闭三次

IT之家 浏览 4684
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1