关闭广告

10倍压缩率,97%解码精度!DeepSeek开源新模型,为何赢得海内外关注

澎湃新闻4429人阅读

DeepSeek开源新模型:用视觉模式实现上下文压缩。

10月20日,DeepSeek宣布开源最新大模型DeepSeek-OCR。所谓的OCR,据DeepSeek在论文中解释称,是通过光学2D映射压缩长上下文可行性的初步研究。DeepSeek-OCR由两部分组成:DeepEncoder和作为解码器的DeepSeek3B-MoE-A570M。DeepEncoder作为核心引擎,设计为在高分辨率输入下保持低激活,同时实现高压缩比,以确保视觉tokens数量优化且可管理。

通俗而言,这是一种视觉-文本压缩范式,通过用少量的视觉token来表示原本需要大量文本token的内容,以此降低大模型的计算开销。

据公布的论文名单显示,该项目由DeepSeek三位研究员Haoran Wei、Yaofeng Sun、Yukun Li共同完成,但这三位核心作者都颇为低调,其中一作作者Haoran Wei曾在阶跃星辰工作过,曾主导开发旨在实现“第二代 OCR”的GOT-OCR2.0系统。


DeepSeek-OCR的架构分为两部分。一是DeepEnco

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

“受够了女装就是男装XXS版”,不想再交粉红税的她们被「时尚户外风」哄好了

Vista氢商业 浏览 4261

吴千语施伯雄逛街被偶遇,勾肩同行幸福甜蜜,有说有笑松弛感拉满

扒虾侃娱 浏览 4253

林子烨:被粉丝捧成“小张凌赫”,一场活动就塌房?

八卦三缺一 浏览 1343

NeurIPS 2025放榜:阿里Qwen门控注意力获最佳论文

量子位 浏览 3685

日媒:中国U23仿佛在球场筑起万里长城,完成了数据上不可能的奇迹

懂球帝 浏览 3044

售35.98万元起 第二代腾势D9正式上市

网易汽车 浏览 1173

今年冬天最火的靴子,越“皱”越时髦!

LinkFashion 浏览 3590

印度商人:有中国就不怕美国加税 中印本应并肩作战

澎湃新闻 浏览 9073

‍曼联向韦伯投诉裁判误判!曝阿莫林将用442,赛季成败在此一举

罗米的曼联博客 浏览 3633

卫星图像显示伊朗恰巴哈尔港附近海域现多艘油轮

财联社 浏览 33545

鲁内眼中,那个让他敬畏的辛纳是如何炼成的

网球之家 浏览 3210

这些才是适合普通人的穿搭!秋天多穿蓝色单品和风衣,好耐看

静儿时尚达人 浏览 4080

米体:尤文希望在冬窗引进新后卫,目标包括什克和金玟哉

懂球帝 浏览 4249

越级空间 长安启源A06上市售10.99万元起

网易汽车 浏览 3930

欧洲多国向格陵兰岛派遣军事人员 白宫回应

大象新闻 浏览 3054

果园8.8元"偷橘子":一晚卖几百斤 抓人的狗都累瘫了

红星新闻 浏览 16718

为什么没什么人争论该买油车还是买电车了

路咖汽车 浏览 2617

至高6000元购车红包 长安启源推限时购车福利

网易汽车 浏览 2535

比利亚雷亚尔vs阿拉维斯:阿约塞-佩雷斯、帕雷霍首发,阿莱尼亚、洪尼-奥托出战

懂球帝 浏览 3226

自动驾驶激战CES:黄仁勋硬刚马斯克,中国军团已默默量产破局

电车通 浏览 3144

上了年纪的女人秋天选“外套”,记住这3上关键点,时髦显瘦

静儿时尚达人 浏览 6146
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1