关闭广告

10倍压缩率,97%解码精度!DeepSeek开源新模型,为何赢得海内外关注

澎湃新闻4625人阅读

DeepSeek开源新模型:用视觉模式实现上下文压缩。

10月20日,DeepSeek宣布开源最新大模型DeepSeek-OCR。所谓的OCR,据DeepSeek在论文中解释称,是通过光学2D映射压缩长上下文可行性的初步研究。DeepSeek-OCR由两部分组成:DeepEncoder和作为解码器的DeepSeek3B-MoE-A570M。DeepEncoder作为核心引擎,设计为在高分辨率输入下保持低激活,同时实现高压缩比,以确保视觉tokens数量优化且可管理。

通俗而言,这是一种视觉-文本压缩范式,通过用少量的视觉token来表示原本需要大量文本token的内容,以此降低大模型的计算开销。

据公布的论文名单显示,该项目由DeepSeek三位研究员Haoran Wei、Yaofeng Sun、Yukun Li共同完成,但这三位核心作者都颇为低调,其中一作作者Haoran Wei曾在阶跃星辰工作过,曾主导开发旨在实现“第二代 OCR”的GOT-OCR2.0系统。


DeepSeek-OCR的架构分为两部分。一是DeepEnco

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

特朗普威胁对欧洲8国加税:直到美"彻底购买格陵兰岛"

红星新闻 浏览 7451

德外长:欧洲和北约议题已从美28点新计划中移除

界面新闻 浏览 3924

120公里时速L3破局:广汽昊铂A800引领智能驾驶新赛道

澎湃新闻 浏览 3830

目标:推迟不可避免的悲剧——奥维耶多希望周日在塔蒂耶雷球场避免降级

绿茵情报局 浏览 1237

香港知名女星惹同性绯闻,和朋友关系举止亲密

你约电影 浏览 3327

RT-Thread熊谱翔:开源是国产操作系统构建生态的最佳路径

观察者网 浏览 3397

激烈攻防暴露美军中东反导漏洞

环球网资讯 浏览 2301

特斯拉宣布接入Carplay,历史的车轮倒退了?

少数派报告Report 浏览 2449

为什么骑手的保障,“普惠”更重要?

财经无忌 浏览 4312

勇士不敌湖人!波杰统领攻守,替补2将齐爆,库明加格林失误多!

篮球资讯达人 浏览 4497

许利民:曾凡博确实非常优秀,祝贺他回归首秀奉献如此精彩表现

懂球帝 浏览 3520

智能设备迭代更新 酒泉将精准“跟拍”神舟回家影像

环球网资讯 浏览 518

发现4种春季很衬肤色的办法,照着穿

Yuki女人故事 浏览 2586

今年最时髦的穿法:长外套+长裤,太高级了!

LinkFashion 浏览 2852

今日热点:迪士尼OpenAI合作;JENNIE和DEX将出演新综艺……

伊周潮流 浏览 3615

赞比亚总统:没在北京反美也没在华盛顿反华 求别脱钩

澎湃新闻 浏览 18253

华为跟广汽搞了个启境,它跟界字辈有啥区别?

差评XPIN 浏览 4574

鲁比奥确认对伊朗“史诗怒火”军事行动已结束

财联社 浏览 1051

北京一副局长送外卖:没想到骑手张口就是"别罚我款"

第一财经资讯 浏览 15022

最新!这家险资巨头,透露康养生态布局进展

券商中国 浏览 3593

推广|| 春天第一双鞋!暴走不累、搭遍好看小裙子

黎贝卡的异想世界 浏览 2561
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1