关闭广告

清华大学提出NHA:让AI语言模型既快又准的"双重记忆"新架构

科技行者4239人阅读


这项由清华大学杜举森、胡佳熹、张涛教授,上海人工智能实验室孙维高研究员,以及香港中文大学程余教授共同完成的研究发表于2025年10月的arXiv预印本平台,论文编号为arXiv:2510.07019v1。有兴趣深入了解的读者可以通过该编号查询完整论文。

当你使用ChatGPT或其他AI语言模型时,有没有想过它是如何记住你前面说过的话的?就像人类既有短期记忆又有长期记忆一样,AI模型也需要处理眼前的信息和遥远的上下文。但现有的AI模型在这方面存在一个两难问题:要么像传统的Transformer模型一样记住所有细节但速度极慢,要么像线性模型一样速度很快但容易忘记重要信息。

研究团队提出了一种名为"原生混合注意力"(Native Hybrid Attention,简称NHA)的全新架构,巧妙地解决了这个难题。这就好比给AI配备了一套"双重记忆系统":一个像照相机一样精确记录最近发生的事情,另一个像日记本一样压缩保存长期的重要信息。更巧妙的是,这套系统能够根据当前需要自动决定更多地依赖哪种记忆,而不需要人工设定固定的规则。

传统的混合模型通常是将两种不同的注意力机制分别计算,

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

土耳其下令拘捕内塔尼亚胡 以色列外长公开回应

新京报评论 浏览 10068

千人来珠峰"逛公园" 有人冻到绝望:以为要永远留在这

新京报 浏览 20823

外国女教师性侵16岁男学生数月上百次 详情炸裂

胡侃社会百态 浏览 39696

卡内基梅隆大学团队揭秘:AI绘画无需人工标注也能学会"听话"

科技行者 浏览 4191

美对委军事打击造成至少40人死亡

界面新闻 浏览 3460

今日热点:丁程鑫首部电影获奖;《怪奇物语第5季》正式预告……

伊周潮流 浏览 3460

不务正业? 理想汽车发布AI眼镜 长续航还能控车

网易汽车 浏览 3652

美国驻冰岛大使候选人:冰岛或成为美国"第52个州"

环球网资讯 浏览 14008

月销暴跌至不到50辆 小米SU7 Ultra专属销售团队解散

大象新闻 浏览 99004

韩国最大军工企业爆炸 已造成5人死亡

红星新闻 浏览 380

牵手长安汽车,京东、宁德时代继续拓新

观察者网 浏览 4526

现场直击|神舟21号升空前6小时,带你沉浸式追火箭!

上观新闻 浏览 4275

腾讯元宝回应AI辱骂用户:小概率下的模型异常输出

中新经纬 浏览 2741

卫宁健康实控人周炜犯单位行贿罪一审获刑一年半,其子被提名为非独董

红星资本局 浏览 4206

记者:卡里克处于竞争曼联正式主帅的有利位置

懂球帝 浏览 3326

CES2026开幕,英伟达黄仁勋提到多个中国大模型,这些中国产品将亮相

文汇报 浏览 3566

王传君影帝封号引发争议,24小时后遭遇令人不适事件

80后房车生活 浏览 4116

"最快女护士"张水华辞职后首战获第六名 本人赛后回应

每日经济新闻 浏览 7661

记者:佛罗伦萨球员不满基恩500万高薪,后者态度也存在问题

懂球帝 浏览 3913

日媒:中国U23仿佛在球场筑起万里长城,完成了数据上不可能的奇迹

懂球帝 浏览 3237

王石离婚风波首现身?豪宅聚餐打牌

好贤观史记 浏览 3457
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1