关闭广告

10倍压缩率,97%解码精度!DeepSeek开源新模型,为何赢得海内外关注

澎湃新闻4623人阅读

DeepSeek开源新模型:用视觉模式实现上下文压缩。

10月20日,DeepSeek宣布开源最新大模型DeepSeek-OCR。所谓的OCR,据DeepSeek在论文中解释称,是通过光学2D映射压缩长上下文可行性的初步研究。DeepSeek-OCR由两部分组成:DeepEncoder和作为解码器的DeepSeek3B-MoE-A570M。DeepEncoder作为核心引擎,设计为在高分辨率输入下保持低激活,同时实现高压缩比,以确保视觉tokens数量优化且可管理。

通俗而言,这是一种视觉-文本压缩范式,通过用少量的视觉token来表示原本需要大量文本token的内容,以此降低大模型的计算开销。

据公布的论文名单显示,该项目由DeepSeek三位研究员Haoran Wei、Yaofeng Sun、Yukun Li共同完成,但这三位核心作者都颇为低调,其中一作作者Haoran Wei曾在阶跃星辰工作过,曾主导开发旨在实现“第二代 OCR”的GOT-OCR2.0系统。


DeepSeek-OCR的架构分为两部分。一是DeepEnco

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

一心为女儿铺路的李湘,竟被撕下体面?

输在感情刀 浏览 2945

拍完被雪藏3年,小沈阳新片观众不买账,成本超1亿,预售仅6万

靠谱电影君 浏览 4279

何超琼近况曝光,生图皮包骨大小眼,西装裤松垮

张发林 浏览 4846

推3款车型 吉利银河V900将于1月20日上市

车质网 浏览 3268

技术路线图3.0,中国汽车2040年这么干

帮宁工作室 浏览 4228

中国人民大学的研究突破:让AI思考过程更快更省的神奇方法

科技行者 浏览 3128

法国队史第3次闯入U20世界杯半决赛,此前一次夺冠一次第4

懂球帝 浏览 4522

躲在流量后面的人,被监管点名了

钛媒体APP 浏览 3792

美总统威胁对尼日利亚动武 尼方回应

环球网资讯 浏览 4321

联合国特使就也门问题与胡塞武装及阿曼官员会谈

国际在线 浏览 3395

靠老婆出圈,成名后过河拆桥,这4位实在绝情!

丹妮观 浏览 4414

摩根大通一线调研:微软领先所有人至少10光年,生态整合能力非常强大!

华尔街见闻官方 浏览 3381

郑爽新账号遭封禁,晒自拍一个细节被人认出,疑似穿男友衣服出镜

萌神木木 浏览 3376

飞象老师爆火背后:AI进课堂,先要过教师这一关

学申论的谈妹 浏览 568

eSIM来了,但还在来的路上

北京商报 浏览 4398

以军称对黎巴嫩真主党目标发动新一轮空袭

上观新闻 浏览 5186

2-0!申花扬眉吐气,掀翻韩国劲旅获首胜,亚冠排名超蓉城进前八

侃球熊弟 浏览 4350

今秋这件“瘦瘦衫”必穿!巨in巨洋气,上身瘦十斤!

Yuki女人故事 浏览 5054

媒体:马杜罗大难临头仍相信"不至于" 但美却赶尽杀绝

文汇报 浏览 9400

时光相册| 一生逐梦蓝天,缅怀顾诵芬院士

新华社 浏览 404

电讯报:西汉姆考虑任命一位短期主帅,接替波特

直播吧 浏览 5200
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1