关闭广告

10倍压缩率,97%解码精度!DeepSeek开源新模型,为何赢得海内外关注

澎湃新闻2883人阅读

DeepSeek开源新模型:用视觉模式实现上下文压缩。

10月20日,DeepSeek宣布开源最新大模型DeepSeek-OCR。所谓的OCR,据DeepSeek在论文中解释称,是通过光学2D映射压缩长上下文可行性的初步研究。DeepSeek-OCR由两部分组成:DeepEncoder和作为解码器的DeepSeek3B-MoE-A570M。DeepEncoder作为核心引擎,设计为在高分辨率输入下保持低激活,同时实现高压缩比,以确保视觉tokens数量优化且可管理。

通俗而言,这是一种视觉-文本压缩范式,通过用少量的视觉token来表示原本需要大量文本token的内容,以此降低大模型的计算开销。

据公布的论文名单显示,该项目由DeepSeek三位研究员Haoran Wei、Yaofeng Sun、Yukun Li共同完成,但这三位核心作者都颇为低调,其中一作作者Haoran Wei曾在阶跃星辰工作过,曾主导开发旨在实现“第二代 OCR”的GOT-OCR2.0系统。


DeepSeek-OCR的架构分为两部分。一是DeepEnco

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

朱孝天回应阿信感谢,自曝没再收到邀约

萌神木木 浏览 1676

小S久违晒自拍美照,容光焕发状态超好

扒虾侃娱 浏览 638

30岁后越来越美的女人,只穿滋养自己的衣服

LinkFashion 浏览 3520

提供两种动力 日产NX8有望于3-4月上市

车质网 浏览 1552

蔡依林演唱会被举报"搞邪教仪式" 30米机械蛇等引争议

扬子晚报 浏览 11631

苹果被曝开发类ChatGPT应用!专为训练新Siri打造

智东西 浏览 3233

告别巨舰,轻舟竞发:EXO成员的单飞远征时代

仙女事件簿 浏览 2029

吉比特狂赚5.69亿!创始人卢竑岩分红独揽1.28亿!

包不同 浏览 2206

世体:霍安-加西亚恢复顺利,不排除入选本周末联赛大名单

懂球帝 浏览 2558

安以恩:邦本宜裕是很“高级”的球员,我们能秒懂彼此的意图

懂球帝 浏览 2242

现场:马竞绝杀国米6连胜!甘当替补的格子同样出色

体坛周报 浏览 2335

美以袭击伊朗 中东军事冲突持续升级

国际在线 浏览 807

港股智谱与MiniMax大涨能给A股带来什么变化?| 0223

虎嗅APP 浏览 1028

到了秋天才知道,年纪大的女人要告别“小脚裤”,这样穿显瘦

静儿时尚达人 浏览 2723

别管怎么质疑《寻秦记》,只要古天乐、林峯在,再烂我都会买单

最爱酷影视 浏览 2025

间谍入住海景民宿拍军港敏感画面 被民宿店主识破上报

央视新闻客户端 浏览 8990

懂王已疯,美国已乱,北约已散

识局 浏览 1721

普京公开重要情报:全国人民都该了解

环球时报新闻 浏览 2419

50+姐姐冬季穿搭别“作妖”,4个法则穿得简约高级,时髦极了

静儿时尚达人 浏览 2068

浙江助教:尽全力去拿下胜利;对王钰栋和张瑷晖的缺阵有预案

懂球帝 浏览 2600

主力车增配降价,丰田销量明显上涨,能带动日系车反攻吗?

路咖汽车 浏览 3313
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1