关闭广告

10倍压缩率,97%解码精度!DeepSeek开源新模型,为何赢得海内外关注

澎湃新闻2889人阅读

DeepSeek开源新模型:用视觉模式实现上下文压缩。

10月20日,DeepSeek宣布开源最新大模型DeepSeek-OCR。所谓的OCR,据DeepSeek在论文中解释称,是通过光学2D映射压缩长上下文可行性的初步研究。DeepSeek-OCR由两部分组成:DeepEncoder和作为解码器的DeepSeek3B-MoE-A570M。DeepEncoder作为核心引擎,设计为在高分辨率输入下保持低激活,同时实现高压缩比,以确保视觉tokens数量优化且可管理。

通俗而言,这是一种视觉-文本压缩范式,通过用少量的视觉token来表示原本需要大量文本token的内容,以此降低大模型的计算开销。

据公布的论文名单显示,该项目由DeepSeek三位研究员Haoran Wei、Yaofeng Sun、Yukun Li共同完成,但这三位核心作者都颇为低调,其中一作作者Haoran Wei曾在阶跃星辰工作过,曾主导开发旨在实现“第二代 OCR”的GOT-OCR2.0系统。


DeepSeek-OCR的架构分为两部分。一是DeepEnco

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

出场时间创新低,记者:马刺有意交易索汉来换更强的轮换球员

懂球帝 浏览 2014

吴尊元旦晒全家福!一家四口笑容灿烂温馨幸福

失宠的小野猪 浏览 1789

马年壁纸送上,祝大家新年快乐,马上发财!

黎贝卡的异想世界 浏览 1016

尚界H5月销万台,成绩合格了吗?

邱小铖 浏览 2048

23岁女孩骨癌截肢父母失联:第一次手术签字 手都在抖

上观新闻 浏览 12527

响应市场需求,积极推动中加经贸合作

国是直通车 浏览 1643

美欲推动加沙停火计划第二阶段 专家:既想占好处又不愿担责

环球网资讯 浏览 2757

美政府"停摆"破纪录 英伟达市值一夜蒸发1.4万亿元

每日经济新闻 浏览 7646

英国防大臣称想"绑架"普京 俄方:痴人说梦

界面新闻 浏览 1668

巴萨向拉什福德提出买断条件!帮助压价曼联并降薪,承诺加强防守

罗米的曼联博客 浏览 1990

健康第一,卢:伦纳德目前身体状况正佳,希望他能保持住

懂球帝 浏览 2840

美政府寻求查封数十艘与委内瑞拉有关联的油轮

国际在线 浏览 1631

媒体:一份非官方的美国就业数据 把美国投资者吓坏了

财联社 浏览 7410

斯帕莱蒂为跑轰尤文注入灵魂,奥彭达被重新“救活”

体坛周报 浏览 2013

巴媒质问:忘恩负义的阿富汗是否正成为印度代理人

澎湃新闻 浏览 7177

泰柬在13条战线上交战 泰总理:愿意接听特朗普电话

环球网资讯 浏览 2060

不出意外霍启山很难结婚不是因为他遇到自己

科学发掘 浏览 1980

价值10万的皮肤“到手价”仅6000元?腾讯手游《金铲铲之战》“翻车”

国际金融报 浏览 1973

Nature|尺寸与光电转换效率创世界纪录,上海科学家团队携手龙头企业突破大尺寸钙钛矿光伏模组产业化关键技术

上观新闻 浏览 2835

用她和朱珠比较,不太公平?

江湖人称艾掌门 浏览 2438

“老登股”列传I:海天味业,匆匆忙忙跌跌撞撞这五年

锦缎研究院 浏览 2773
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1