关闭广告

10倍压缩率,97%解码精度!DeepSeek开源新模型,为何赢得海内外关注

澎湃新闻4629人阅读

DeepSeek开源新模型:用视觉模式实现上下文压缩。

10月20日,DeepSeek宣布开源最新大模型DeepSeek-OCR。所谓的OCR,据DeepSeek在论文中解释称,是通过光学2D映射压缩长上下文可行性的初步研究。DeepSeek-OCR由两部分组成:DeepEncoder和作为解码器的DeepSeek3B-MoE-A570M。DeepEncoder作为核心引擎,设计为在高分辨率输入下保持低激活,同时实现高压缩比,以确保视觉tokens数量优化且可管理。

通俗而言,这是一种视觉-文本压缩范式,通过用少量的视觉token来表示原本需要大量文本token的内容,以此降低大模型的计算开销。

据公布的论文名单显示,该项目由DeepSeek三位研究员Haoran Wei、Yaofeng Sun、Yukun Li共同完成,但这三位核心作者都颇为低调,其中一作作者Haoran Wei曾在阶跃星辰工作过,曾主导开发旨在实现“第二代 OCR”的GOT-OCR2.0系统。


DeepSeek-OCR的架构分为两部分。一是DeepEnco

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

美台讨论共同研发武器 国防部回应

央视军事 浏览 10802

先锋来袭 丰田卡罗拉概念车新车图解

车质网 浏览 2681

坦克300Hi-T宁德时代版上市 售24.98万

车质网 浏览 3218

尼克斯129-101送黄蜂7连败,布伦森33分,哈特22+8+7

懂球帝 浏览 4010

通过民间借贷获取大额回报,利用职务便利低买高卖房产......农行冯建龙被开除党籍

财通社 浏览 3197

39岁工人公司外猝死家属帮申请工伤 公司:已下班几小时

红星新闻 浏览 90336

东部战区:军演是对"台独"和外部干涉势力的严重警告

央视新闻客户端 浏览 25414

12岁女孩手脚遭绑关厕所17天被虐亡 继母二审维持死刑

大风新闻 浏览 32634

檀健次孟子义横扫奖项背后,95后已全面接管内娱

爆米花放映员 浏览 3667

周杰的负面标签到底哪些是真的?

说历史的老牢 浏览 3928

AI浪潮已至,重磅嘉宾云集,乌镇再启新汽车之问

AutoBusiness 浏览 4179

两中国游客穿泳衣失联 失联女生对父母说是与发小出游

红星新闻 浏览 20759

大爆冷!北京末节被轰30-13崩盘负天津 赵睿复出13分杰曼8中1

醉卧浮生 浏览 3280

支持家乡球队,网球球员吴易昺来黄龙体育场观战浙江vs山东

懂球帝 浏览 4413

地球出现特大地磁暴

第一财经资讯 浏览 3238

国庆可提车 吉利银河星耀6先享预售价7.98万元起

网易汽车 浏览 5066

全球铜市神经紧绷:摩科瑞被曝大举提货 LME库存近被掏空

财联社 浏览 3765

凑齐“56789”!问界独占鸿蒙智行7成销量,“5界”如何共扛百万辆目标?

时代周报 浏览 3181

“霸凌”周迅的奚美娟,现在付出代价了?

除夕烟火灿烂 浏览 3799

时隔25年,上一个时代的“英伟达”终于涨回来了

华尔街见闻官方 浏览 3658

浙媒:体育局负责人介绍,浙江FC改名一事并未提上日程

懂球帝 浏览 3203
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1