关闭广告

让大模型“瘦身”90%!清华&哈工大提出极限压缩方案

量子位12440人阅读

徐玉庄 投稿
量子位 | 公众号 QbitAI

对大模型进行量化、剪枝等压缩操作,是部署时最常见不过的一环了。

不过,这个极限究竟有多大?

清华大学和哈工大的一项联合研究给出的答案是:

90%。

他们提出了大模型1bit极限压缩框架OneBit,首次实现大模型权重压缩超越90%并保留大部分(83%)能力。

可以说,玩儿的就是“既要也要”~



一起来看看。

大模型1bit量化方法来了

从剪枝、量化,到知识蒸馏、权重低秩分解,大模型已经可以实现压缩四分之一权重而几乎无损。

权重

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

巴黎人报:出于保险,恩里克半场就换下了努诺-门德斯

懂球帝 浏览 394

苹果或限制第三方配件充电速度收欧盟禁售警告

界面新闻 浏览 17906

超万人离岗,韩国医生罢工为何持续升级

中国新闻周刊 浏览 12258

妈妈辈如何穿出“贵气感”?4个打扮习惯,轻松提升优雅气质

静儿时尚达人 浏览 1039

速卖通正在成为更多亚马逊商家的第一阵地

华尔街见闻官方 浏览 997

男子称爷爷坟里埋了200万 女友给他272万发现其是老赖

潇湘晨报 浏览 4668

医院人满为患 加沙患者焦急等待救治

国际在线 浏览 563

锋寻生物完成近6000万元种子轮及天使轮融资,加速体内CAR-T疗法临床转化 | 融资首发

钛媒体APP 浏览 662

拜登就瓦格纳事件明确表态:普京"绝对"因此被削弱

澎湃新闻 浏览 15716

1200亿元深耕中原!中国人寿助力河南区域经济高质量发展

证券市场周刊 浏览 742

美股、中概股,全线爆发!机构称A股调整是布局良机!

证券时报e公司 浏览 983

赛力斯今日登陆香港主板 成首家“A+H股”新能源车企

上游新闻 浏览 700

点赞!中国科学家制出新型仿生手术缝线基于“藕断丝连”现象研发

趣看热点 浏览 25665

斯卢茨基:训练没强度意味着没质量,必须保持高强度、高节奏

直播吧 浏览 12684

电讯报:面对球迷冲场+燃放烟花,欧足联对温布利安保总体满意

懂球帝 浏览 10904

王励勤出任乒羽中心副主任

体坛周报 浏览 275

电动车双雄终极PK:比亚迪胜在销量、毛利,特斯拉赢在市值

DearAuto 浏览 12607

大连有梅花鹿连续2天攻击游客 受伤女子:我没招惹它

极目新闻 浏览 19421

全运男足U20:浙江、新疆成绩完全相同,需抽签决定晋级球队

懂球帝 浏览 705

福特烈马增程版申报信息曝光: 1.5T增程+弗迪电池

网易汽车 浏览 1026

从播放次数到播放时长,背后是B站的一次“改短”失败

电厂 浏览 15546
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1