关闭广告

清华大学提出NHA:让AI语言模型既快又准的"双重记忆"新架构

科技行者633人阅读


这项由清华大学杜举森、胡佳熹、张涛教授,上海人工智能实验室孙维高研究员,以及香港中文大学程余教授共同完成的研究发表于2025年10月的arXiv预印本平台,论文编号为arXiv:2510.07019v1。有兴趣深入了解的读者可以通过该编号查询完整论文。

当你使用ChatGPT或其他AI语言模型时,有没有想过它是如何记住你前面说过的话的?就像人类既有短期记忆又有长期记忆一样,AI模型也需要处理眼前的信息和遥远的上下文。但现有的AI模型在这方面存在一个两难问题:要么像传统的Transformer模型一样记住所有细节但速度极慢,要么像线性模型一样速度很快但容易忘记重要信息。

研究团队提出了一种名为"原生混合注意力"(Native Hybrid Attention,简称NHA)的全新架构,巧妙地解决了这个难题。这就好比给AI配备了一套"双重记忆系统":一个像照相机一样精确记录最近发生的事情,另一个像日记本一样压缩保存长期的重要信息。更巧妙的是,这套系统能够根据当前需要自动决定更多地依赖哪种记忆,而不需要人工设定固定的规则。

传统的混合模型通常是将两种不同的注意力机制分别计算,

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

消失的汽车,找车的人

中国企业家杂志 浏览 14711

拉夫罗夫:瓦格纳事件后 俄变得更强大

环球网 浏览 15606

王俊凯工作室深夜发文退出湖南跨年,因彩排后突发头晕

趣看热点 浏览 26067

董忠云:保持战略定力,增强必胜信心,A股有望恢复震荡上行趋势

首席经济学家论坛 浏览 802

有种的冲这儿打!

电影最TOP 浏览 995

菲总统马科斯访问越南,大米是焦点

环球网资讯 浏览 12742

OpenAI组建新团队:收集公众意见以确保AI大模型"与人类价值观保持一致"

网易科技报道 浏览 12755

2025羽绒服8大流行趋势,温暖时髦过冬天!

LinkFashion 浏览 716

比刘强东只大5岁的丈母娘长啥样?

木子爱娱乐大号 浏览 15398

夏天简约舒适的日常穿搭 照着穿就很好看

七柒时尚笔记 浏览 15780

谢娜主持晚会还是差一口气!直播接不上话,看热闹忘记控场一直笑

萌神木木 浏览 746

湖人已经给里夫斯4年5200万美元顶薪报价,他将等待别队给出更高价

OnFire 浏览 15599

CIA前分析师:美国想除掉泽连斯基 并嫁祸给俄罗斯

红星新闻 浏览 14499

广汽昊铂GT全新Lite版上市 售价15.38万元起

网易汽车 浏览 781

大鹏拍《煎饼侠》时,带着两个剧本去找艺人—,一个很好、一个稀烂

趣看热点 浏览 26998

擦碰中国海警艇 揭秘菲律宾“拍照打卡”式炒作套路

环球网资讯 浏览 4790

债市,大调整!

米筐投资 浏览 108

俄称控制乌居民点 乌称击落米-8直升机

环球网资讯 浏览 444

传奇球星保罗罗西去世,曾攻入6球为意大利拿下世界杯冠军

趣看热点 浏览 26322

乌军方称对俄铁路发起特别作战行动

国际在线 浏览 1605

新增车道级导航与全向记录仪 腾势N9迎重磅OTA升级

网易汽车 浏览 961
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1