关闭广告

让大模型“瘦身”90%!清华&哈工大提出极限压缩方案

量子位12429人阅读

徐玉庄 投稿
量子位 | 公众号 QbitAI

对大模型进行量化、剪枝等压缩操作,是部署时最常见不过的一环了。

不过,这个极限究竟有多大?

清华大学和哈工大的一项联合研究给出的答案是:

90%。

他们提出了大模型1bit极限压缩框架OneBit,首次实现大模型权重压缩超越90%并保留大部分(83%)能力。

可以说,玩儿的就是“既要也要”~



一起来看看。

大模型1bit量化方法来了

从剪枝、量化,到知识蒸馏、权重低秩分解,大模型已经可以实现压缩四分之一权重而几乎无损。

权重

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

太阳5人15+力克湖人升至西部第2 勒布朗38+5+6

网易体育 浏览 25868

杭州启用AI交通管理机器人“杭行1号”;印尼洪灾和山体滑坡已致超600人遇难

上观新闻 浏览 279

程前向周鸿祎道歉:失态失礼,回头看自己都觉得不可原谅

网易科技频道 浏览 12428

李嘉欣姐姐身价猛涨,61岁姐妹合影展现瑰丽容颜

素素娱乐 浏览 16757

美称因俄空军活动频繁 将向中东部署F-22战斗机

参考消息 浏览 16229

太离谱!侃爷花611万定制钢牙,效果超差,像糊了一层劣质锡箔纸

文艺圈娱乐号 浏览 12927

音悦台要回归了?官方透露:很快就要内测

网易娱乐 浏览 19361

46岁袁泉低调做公益人美心善 素颜现身气质温柔

叶公子 浏览 13532

支付宝下架首页AQ广告,回应“内斗”传闻,网友:感觉就是一场营销

红星资本局 浏览 907

Claude Opus 4.5来了!单次生成打造《我的世界》,还破解高难度Agent测评

智东西 浏览 415

你适合“剪刘海”还是“露额头”?关键看这点!

Yuki女人故事 浏览 206

媒体:西班牙可以思考下 为何胡塞武装不袭击中国船只

新民周刊 浏览 73256

漫画照进现实!近江教练:青森山田是灌篮高手的山王,我们像湘北

直播吧 浏览 12895

像林青霞这样老了也很美的女性都发不过肩

虎哥说衣不二 浏览 19543

靳东这波转型,真是让人佩服得五体投地。

小光侃娱乐 浏览 1667

跌破发行价!市值较巅峰蒸发80%!美团跌落神坛?

上游新闻 浏览 12811

两嫌犯被抓后银行卡遭警方扣押 卡内13万被25次取空

红星新闻 浏览 86770

日本研究运输机发射远程导弹 可变身战略轰炸机

澎湃新闻 浏览 14595

米体:尤文希望在冬窗引进新后卫,目标包括什克和金玟哉

懂球帝 浏览 1003

38岁C罗游艇上冲凉惹关注!肌肉线条清晰如雕刻

译言 浏览 15674

高市早苗4天上3次新闻联播:玩火者必自焚

看看新闻Knews 浏览 43168
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1