关闭广告

DeepSeek连发两篇论文背后,原来藏着一场学术接力

机器之心Pro1670人阅读



编辑|张倩、陈陈

2026 年 1 月过半,我们依然没有等来 DeepSeek V4,但它的模样已经愈发清晰。

最近,DeepSeek 连发了两篇论文,一篇解决信息如何稳定流动,另一篇聚焦知识如何高效检索。

第一篇论文(mHC)出来的时候,打开论文的人都表示很懵,直呼看不懂,让 AI 助手用各种方式讲给自己听。我们也翻了翻网友的讨论,发现理解起来比较透彻的办法其实还是要回到研究脉络,看看这些年研究者们是怎么接力的。要理解第二篇论文(Conditional Memory)也是如此。

于是,我们就去翻各路研究者的分析。这个时候,我们发现了一个有意思的现象:DeepSeek 和字节 Seed 团队的很多工作其实是存在「接力」的 ——mHC 在字节 Seed 团队 HC(Hyper-Connections)的基础上进行了重大改进;Conditional Memory 则引用了字节 Seed 的 OverEncoding、UltraMem 等多项工作。

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

baby近照撞脸刘嘉玲,苹果肌下垂脸变僵,没了事业心近乎退圈

萌神木木 浏览 2188

隐形大佬入主3年后,紫光集团怎样了?

华商韬略 浏览 2893

雷克萨斯NX绝色限定版上市 售价30.96万起

车质网 浏览 1900

影视大佬吴敦离世,贾静雯林志颖发文悼念

素素娱乐 浏览 1438

卫星互联网低轨 12 组卫星发射成功,长征系列火箭 600 次里程碑

IT之家 浏览 2896

为什么她们穿粉色很好看?

Yuki女人故事 浏览 1771

你看到的不是奔驰纯电CLA,而是汽车的下一个20年

1号车盟 浏览 2274

打破场景界限,波司登与Kim Jones的合作让冬天更体面

时尚COSMO 浏览 2137

东方财富实控人其实的妻子和父亲近期套现约93亿

YOUNG财经 浏览 2856

28亿次播放:她这段感情,后劲越来越猛

Yuki女人故事 浏览 1498

天津联通与华为合作:5G-A宽上行样板点峰值速率突破1Gbps

IT之家 浏览 1403

暴涨23%!诺基亚获得英伟达投资,AI原生6G通信要来了!

雷科技 浏览 2441

中国移动成出海“赋能者”,聚星计划覆盖5000+伙伴

雷科技 浏览 2767

太好看了!!!「镖人」把我看激动了!

吐槽电影院 浏览 929

OPPO AI战略曝光!全场景、全链路,要把 AI 做成系统?

雷科技 浏览 2893

记录最近收获很大的一次深度链接

黎贝卡的异想世界 浏览 961

重庆飞三亚航班紧急返航 乘客:听到广播才知出故障

封面新闻 浏览 16924

特朗普开价10亿美元招募 被指试图用新机构替代联合国

极目新闻 浏览 5921

东风DH项目启动品牌征名活动

大象新闻 浏览 2736

车长超5米 比亚迪海狮08/海豹08配高阶智驾

网易汽车 浏览 1702

航拍画面披露:日本被指昼夜赶建军事基地

环球网资讯 浏览 2128
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1