关闭广告

清华大学提出NHA:让AI语言模型既快又准的"双重记忆"新架构

科技行者4394人阅读


这项由清华大学杜举森、胡佳熹、张涛教授,上海人工智能实验室孙维高研究员,以及香港中文大学程余教授共同完成的研究发表于2025年10月的arXiv预印本平台,论文编号为arXiv:2510.07019v1。有兴趣深入了解的读者可以通过该编号查询完整论文。

当你使用ChatGPT或其他AI语言模型时,有没有想过它是如何记住你前面说过的话的?就像人类既有短期记忆又有长期记忆一样,AI模型也需要处理眼前的信息和遥远的上下文。但现有的AI模型在这方面存在一个两难问题:要么像传统的Transformer模型一样记住所有细节但速度极慢,要么像线性模型一样速度很快但容易忘记重要信息。

研究团队提出了一种名为"原生混合注意力"(Native Hybrid Attention,简称NHA)的全新架构,巧妙地解决了这个难题。这就好比给AI配备了一套"双重记忆系统":一个像照相机一样精确记录最近发生的事情,另一个像日记本一样压缩保存长期的重要信息。更巧妙的是,这套系统能够根据当前需要自动决定更多地依赖哪种记忆,而不需要人工设定固定的规则。

传统的混合模型通常是将两种不同的注意力机制分别计算,

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

加拿大留学7年,95后小伙回杭开奔驰摆摊卖盒饭!“大家都只活一次,重要的就是体验生活”

都市快报橙柿互动 浏览 4141

豪华MPV的"新解法" 吉利银河V900上市26.98万起售

车评社Auto 浏览 3351

外观微调配置全面 小鹏P7+新老款车型对比

车质网 浏览 3416

专栏 | 我们对女性友谊太缺乏想象力了

时尚COSMO 浏览 4611

“食安AI博士”智能体首秀进博会!

文汇报 浏览 4358

1000亿美元投资仍处“纸上”?黄仁勋称英伟达尚未支付OpenAI一分钱

环球网资讯 浏览 3756

河北农村老人挨冻,取暖费为何贵上万

深蓝财经 浏览 2962

她复出拿奖,这次没人笑得出来

独立鱼 浏览 4304

特斯拉Model3/ModelY Standard正式发布

网易汽车 浏览 4596

17岁日乒一姐状态堪忧:亚锦赛再败苦主 近五战最远8强各种被逆转

颜小白的篮球梦 浏览 4637

一心为女儿铺路的李湘,竟被撕下体面?

输在感情刀 浏览 3090

乌外长:美已邀乌再赴美继续和平谈判

上观新闻 浏览 3865

内塔尼亚胡:对伊朗的打击以军已部署全部力量

参考消息 浏览 40773

金价算是彻底失控!不是因为涨到1000多,那些回收店排起了长队…

火山诗话 浏览 4495

以色列部长回应"虐待环保少女":很自豪

CCTV国际时讯 浏览 3259

北京现代纯电SUV EO羿欧开启预售 13–15万元

网易汽车 浏览 4285

马英九首度"自嘲"回应赖清德:我还要救援几次

台海网 浏览 18992

外媒:巴基斯坦一哨所遭武装分子袭击 6名士兵死亡

环球网资讯 浏览 4000

瑞银:中国出现AI泡沫的概率不高,变现靠云与广告

第一财经资讯 浏览 3532

太强了!单月销量近9万?压着特斯拉打的“中国新势力”诞生了

少数派报告Report 浏览 3493

德央行行长妄言:若报复中国是最后一招 那就干票大的

澎湃新闻 浏览 10230
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1