关闭广告

10倍压缩率,97%解码精度!DeepSeek开源新模型,为何赢得海内外关注

澎湃新闻4783人阅读

DeepSeek开源新模型:用视觉模式实现上下文压缩。

10月20日,DeepSeek宣布开源最新大模型DeepSeek-OCR。所谓的OCR,据DeepSeek在论文中解释称,是通过光学2D映射压缩长上下文可行性的初步研究。DeepSeek-OCR由两部分组成:DeepEncoder和作为解码器的DeepSeek3B-MoE-A570M。DeepEncoder作为核心引擎,设计为在高分辨率输入下保持低激活,同时实现高压缩比,以确保视觉tokens数量优化且可管理。

通俗而言,这是一种视觉-文本压缩范式,通过用少量的视觉token来表示原本需要大量文本token的内容,以此降低大模型的计算开销。

据公布的论文名单显示,该项目由DeepSeek三位研究员Haoran Wei、Yaofeng Sun、Yukun Li共同完成,但这三位核心作者都颇为低调,其中一作作者Haoran Wei曾在阶跃星辰工作过,曾主导开发旨在实现“第二代 OCR”的GOT-OCR2.0系统。


DeepSeek-OCR的架构分为两部分。一是DeepEnco

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

宗馥莉,抛弃娃哈哈?

豹变 浏览 5096

世体:拉波尔塔周一中午抵达体育城,向球队重申支持和鼓励

懂球帝 浏览 4477

伊朗外长:美国是否真心实意进行谈判还有待观察

国际在线 浏览 1436

邮报:利物浦体能教练正帮维尔茨提升身体素质,从而适应激烈对抗

直播吧 浏览 5151

租电版售价5.28万元 埃安UT系列永冲锋版上市

网易汽车 浏览 3535

官方:福建浔兴SBS俱乐部签下法国中锋约安-马昆杜

懂球帝 浏览 2724

为单一球队效力17年,库里将解锁成就成为联盟历史第七人

懂球帝 浏览 4549

澳大利亚国立大学发现:攻击AI视觉模型只需要操控20%的关键词汇

科技行者 浏览 3496

百亿之后,珀莱雅失速

斑马消费 浏览 4632

小米现车选购争议:提车等半年 转头卖现车?

网易汽车 浏览 3891

窦泽成下赛季重返美巡赛

体坛周报 浏览 4591

44岁李小璐参加公开活动!怼脸拍真实状态曝光,网友态度两极分化

萌神木木 浏览 4573

遭美国施压 卡尼:加拿大无意与中国达成自由贸易协定

环球网资讯 浏览 7438

全智贤与《暴风圈》剧方仍未发文道歉

韩小娱 浏览 5570

特斯拉三季度净利同比暴跌4成!马斯克透露五大关键进展,为天价薪酬拉票

车东西 浏览 4500

baby相隔17年同角度怼脸拍!全脸变化肉眼可见

萌神木木 浏览 2884

当一个57岁的女人,决定从零开始

Yuki女人故事 浏览 3575

中国电动汽车出口欧洲通道打通,谁最受益?

电动汽车观察家 浏览 3603

丹麦尴尬:抵制美国代价高昂 却眼睁睁看着格陵兰离开

澎湃新闻 浏览 8294

两名国民党民代遭起诉 郑丽文:民进党想团灭在野党

海峡导报社 浏览 15228

推广|| 双11来了!好口碑国货返场,买1送20

黎贝卡的异想世界 浏览 4737
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1