关闭广告

AI大模型"减肥"新突破:MWS AI团队让语言模型变小却更聪明

科技行者920人阅读


这项由MWS AI公司和ITMO大学联合完成的研究发表于2025年10月,论文编号为arXiv:2509.22075v2。研究团队包括来自MWS AI的Dmitriy Shopkhoev、Denis Makhov、Magauiya Zhussip和Stamatios Lefkimmiatis,以及来自ITMO大学的Ammar Ali。有兴趣深入了解的读者可以通过该论文编号查询完整研究报告。

现在的大型语言模型就像一台超级智能的机器,能够回答各种问题、写文章、翻译语言,但有一个大问题:它们实在太"胖"了。这些模型需要占用大量的计算机内存和处理能力,就像一辆装满行李的重型卡车,虽然功能强大,但开起来费油又缓慢。对于想在手机、平板电脑或者小型服务器上运行这些智能助手的人来说,这简直是个噩梦。

为了解决这个问题,研究人员们想出了各种"减肥"方法。最流行的一种方法叫做"低秩分解",可以把它理解为把一个复杂的大拼图拆解成几个简单的小拼图。但是这种方法有个致命缺陷:它假设所有的拼图碎片都必须遵循同一个模式,就像强制要求所有人都穿同一个尺码的衣服一样,结果往往是不合身的。

MWS A

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

彻底放弃纽约了?希音据称最早本周在伦敦提交招股意向书

科创板日报 浏览 10882

巴菲特TOP 10仓位公布!股神最新投资动向:钟情苹果,大抛台积电……

金融界 浏览 19081

日元,跌回1986年!

国是直通车 浏览 10784

空军副司令:轰20很快将公布 没有技术瓶颈

北京时间 浏览 10599

中甲综述:广西平果哈嘹5分领跑 广州队收获赛季主场首胜

直播吧 浏览 15357

汽车之家官宣冬季测试真要来了:杜绝充值 喊话陈震愿意来吗

快科技 浏览 718

袁隆平在农业杂交水稻上很有作为,提高粮食产量解决了温饱问题

趣看热点 浏览 25457

年轻创意总监们为何频频离职?

精奢商业观察 浏览 16621

刘越:申花最后的点球判罚的太牵强,阿利米踢球合理简练

懂球帝 浏览 797

比亚迪驱逐舰 05 荣耀版上市,7.98 万元起

IT之家 浏览 12099

阿里交出“拆分”后第一份答卷

虎嗅APP 浏览 14382

比起辣妹风,早秋这样穿的女生才是高段位吧!

Yuki女人故事 浏览 1976

2025全球十大工程成就发布,DeepSeek、人形机器人等入选

澎湃新闻 浏览 1020

楼市,又一个重大隐患……

杨国英观察 浏览 10731

官方:利物浦签下15岁曼城青训门将阿尔菲-杜利

懂球帝 浏览 1075

最高法改判福清祖屋强拆案后 屋主再提诉讼

澎湃新闻 浏览 1024

女子应聘疑遭老板性暗示 涉事企业法人:出于工作需要

极目新闻 浏览 6076

晋级四强!陈雨菲2-1逆转世界冠军辛杜 国羽单打首个半决赛名额

醉卧浮生 浏览 12561

女子2年被家暴16次进ICU:我逃也逃不了 离也离不掉

上游新闻 浏览 87001

科研人员发现5亿年前四不像动物,生物进化论又一强而有力的证据

趣看热点 浏览 25804

华谊兄弟策划师王天也酒后殴打三名民警 获刑一年

北京日报 浏览 26069
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1