关闭广告

10倍压缩率,97%解码精度!DeepSeek开源新模型,为何赢得海内外关注

澎湃新闻967人阅读

DeepSeek开源新模型:用视觉模式实现上下文压缩。

10月20日,DeepSeek宣布开源最新大模型DeepSeek-OCR。所谓的OCR,据DeepSeek在论文中解释称,是通过光学2D映射压缩长上下文可行性的初步研究。DeepSeek-OCR由两部分组成:DeepEncoder和作为解码器的DeepSeek3B-MoE-A570M。DeepEncoder作为核心引擎,设计为在高分辨率输入下保持低激活,同时实现高压缩比,以确保视觉tokens数量优化且可管理。

通俗而言,这是一种视觉-文本压缩范式,通过用少量的视觉token来表示原本需要大量文本token的内容,以此降低大模型的计算开销。

据公布的论文名单显示,该项目由DeepSeek三位研究员Haoran Wei、Yaofeng Sun、Yukun Li共同完成,但这三位核心作者都颇为低调,其中一作作者Haoran Wei曾在阶跃星辰工作过,曾主导开发旨在实现“第二代 OCR”的GOT-OCR2.0系统。


DeepSeek-OCR的架构分为两部分。一是DeepEnco

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

星际彗星 3I / ATLAS 亮度异常激增,科学家困惑不解

IT之家 浏览 729

张柏芝自曝被大儿子管很凶,教子有方连谢霆锋妈妈都称赞

扒虾侃娱 浏览 894

张雨绮秀性感 马伊琍瘦成纸片人 审美差距来了

不八卦会死星人 浏览 13079

【中超】恩里克2球迪力穆拉提世界波 梅州1比4玉昆

体坛周报 浏览 857

最脏时刻!美媒打趣:踢裆、肘头、垫脚+皮尔斯王者归来

直播吧 浏览 10644

向佐出手了!抓到模仿向太的网红 送麻袋石头吓人

我是晚伯伯 浏览 13743

网飞开年第一部限制级,爽翻了

独立鱼 浏览 12765

羽绒服,我把“波司登”换成“鸭鸭”后,有些话不吐不快,太真实

潮人志Fashion 浏览 13625

加拿大留学7年,95后小伙回杭开奔驰摆摊卖盒饭!“大家都只活一次,重要的就是体验生活”

都市快报橙柿互动 浏览 386

美股三大股指高开 纳指盘初涨0.87%

证券时报 浏览 872

数据显示苹果已俘获美国 Z 世代,市场份额持续扩大

IT之家 浏览 19937

快船109:112憾负爵士,系列赛0:1暂时落后

趣看热点 浏览 26112

詹姆斯谈保罗退役:希望他能好好享受最后的赛季,他已无遗憾

懂球帝 浏览 415

著名音乐人何厚华英年早逝:终生未婚

历来纵横 浏览 1495

传祺向往M8宗师上市 补贴价24.99万元起

网易汽车 浏览 1032

气质女人春季最值得准备的三款单品,时尚又百搭,过了40岁也能穿

Yuki时尚酱 浏览 12831

4天3赛干了129分钟!阿努诺比:不知道我顶不顶得住……

直播吧 浏览 12550

新鹏城豪取两连胜!7分领先保级在望,中超首胜三镇,连破4魔咒

奥拜尔 浏览 904

AI教育机器人首秀广交会!西班牙客商:科技水平太惊艳了

南方都市报 浏览 952

信用卡汇兑“省一步” 多银行结算币种从美元切换至人民币

21世纪经济报道 浏览 1596

连升三级,董宇辉要休长假了

市界 浏览 13110
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1