关闭广告

10倍压缩率,97%解码精度!DeepSeek开源新模型,为何赢得海内外关注

澎湃新闻962人阅读

DeepSeek开源新模型:用视觉模式实现上下文压缩。

10月20日,DeepSeek宣布开源最新大模型DeepSeek-OCR。所谓的OCR,据DeepSeek在论文中解释称,是通过光学2D映射压缩长上下文可行性的初步研究。DeepSeek-OCR由两部分组成:DeepEncoder和作为解码器的DeepSeek3B-MoE-A570M。DeepEncoder作为核心引擎,设计为在高分辨率输入下保持低激活,同时实现高压缩比,以确保视觉tokens数量优化且可管理。

通俗而言,这是一种视觉-文本压缩范式,通过用少量的视觉token来表示原本需要大量文本token的内容,以此降低大模型的计算开销。

据公布的论文名单显示,该项目由DeepSeek三位研究员Haoran Wei、Yaofeng Sun、Yukun Li共同完成,但这三位核心作者都颇为低调,其中一作作者Haoran Wei曾在阶跃星辰工作过,曾主导开发旨在实现“第二代 OCR”的GOT-OCR2.0系统。


DeepSeek-OCR的架构分为两部分。一是DeepEnco

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

美国司法部查扣12.7万枚比特币 其所有人仍在逃

澎湃新闻 浏览 5742

三年半亏19亿,超90%订单依赖聚合平台,享道出行IPO底气在哪儿?

尺度商业 浏览 714

五六十岁女性别瞎穿,教你三步解锁优雅气质,轻松告别油腻感

静儿时尚达人 浏览 826

警惕!荷兰出现首起新冠动物传人事件,水貂成新冠病毒潜在宿主

趣看热点 浏览 25675

许志安拒回应黄心颖结婚及丁父忧:好好过生活

TVB剧评社 浏览 13398

放弃“模仿”,小米汽车的价值才能显现

盖世汽车 浏览 10950

国台办:对于迫害大陆配偶的"台独"帮凶爪牙决不轻饶

环球网资讯 浏览 13155

张伦硕钟丽缇又被传离婚!当事人晒恩爱照辟谣

老大爷侃娱 浏览 14626

重启9亿并购,大地海洋铁了心“收破烂”

斑马消费 浏览 15588

何赛飞劝59岁刘嘉玲生娃,传宗接代!评论区炸了

二妹扯娱 浏览 754

推文《努力努力白努力》引吐槽 茶颜悦色致歉:取名不当

网易财经 浏览 14776

出口有望连续两月增长,消费贡献占比已超八成,多方预测中国经济长期向好

环球网资讯 浏览 12847

300353,重大资产重组!明日复牌

中国基金报 浏览 717

召集全球高级将领开会前 美军试射4枚导弹

新民晚报 浏览 1506

坏了,看到剧本杀鼻祖了!

时尚COSMO 浏览 691

世界头号高尔夫球手老虎伍兹发生车祸,腿部多处受伤正在接受手术

趣看热点 浏览 158465

美欧宣布对俄"毁灭性"制裁 普京作出回应

环球时报国际 浏览 12544

叔叔宗泽后再发声:娃哈哈不是宗家的 水军害了宗馥莉

第一财经资讯 浏览 1014

格威:没有哪两队比他们更值得 很幸运能成为这两队的一员

直播吧 浏览 10719

胜率大降!若特朗普“对等关税”被推翻,市场会如何反应?

华尔街见闻官方 浏览 651

失业数据显示美联储6月将首次降息?

巴伦周刊 浏览 11557
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1