关闭广告

清华大学提出NHA:让AI语言模型既快又准的"双重记忆"新架构

科技行者4236人阅读


这项由清华大学杜举森、胡佳熹、张涛教授,上海人工智能实验室孙维高研究员,以及香港中文大学程余教授共同完成的研究发表于2025年10月的arXiv预印本平台,论文编号为arXiv:2510.07019v1。有兴趣深入了解的读者可以通过该编号查询完整论文。

当你使用ChatGPT或其他AI语言模型时,有没有想过它是如何记住你前面说过的话的?就像人类既有短期记忆又有长期记忆一样,AI模型也需要处理眼前的信息和遥远的上下文。但现有的AI模型在这方面存在一个两难问题:要么像传统的Transformer模型一样记住所有细节但速度极慢,要么像线性模型一样速度很快但容易忘记重要信息。

研究团队提出了一种名为"原生混合注意力"(Native Hybrid Attention,简称NHA)的全新架构,巧妙地解决了这个难题。这就好比给AI配备了一套"双重记忆系统":一个像照相机一样精确记录最近发生的事情,另一个像日记本一样压缩保存长期的重要信息。更巧妙的是,这套系统能够根据当前需要自动决定更多地依赖哪种记忆,而不需要人工设定固定的规则。

传统的混合模型通常是将两种不同的注意力机制分别计算,

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

中年女性高级感穿搭秘诀:裙过膝、鞋带跟、包精致,更大方

静儿时尚达人 浏览 3911

埃尔多安指责以色列违反加沙停火协议

新华社 浏览 4360

姚明将在今年开始正式领取NBA退休金,每月可领约1.3万人民币

懂球帝 浏览 4443

华为诺亚实验室突破:轻量化技术提升AI规划效率

科技行者 浏览 3155

将于6月上市 上汽大众途观L ePro谍照曝光

车质网 浏览 3193

黄一鸣才真清醒,大四怀孕不做“首富太太”

柠檬有娱乐 浏览 3850

2-0!申花扬眉吐气,掀翻韩国劲旅获首胜,亚冠排名超蓉城进前八

侃球熊弟 浏览 4350

广州一变电站迎来全球首发机器人:可全向移动、双臂协作

南方都市报 浏览 3954

第十届四川省大学生机器人大赛在蓉开幕 全省51所高校614支战队硬核对决

红星新闻 浏览 4448

船员在公海杀同事6个月后跳海潜逃 中国海警跨境捉拿

扬子晚报 浏览 7686

自动驾驶真的来了 两款车型分别在北京/重庆获准上路

网易汽车 浏览 3801

苹果发布 iPhone 17e 搭载 A19 芯片 4499 元起售

威锋网 浏览 2644

国电高科新专利可提高卫星设备的工作可靠性

财闻 浏览 2288

秋冬别穿阔腿裤了!裙子才是粗腿女孩的救星!

Yuki女人故事 浏览 3936

无止境,梅西常规赛28场贡献29球16助攻

懂球帝 浏览 4391

豆包手机最高被炒至1.29万元 日租费高达1600元

极目新闻 浏览 34053

携程迎来监管风暴

华尔街见闻官方 浏览 3350

白百何工作室放聊天记录了!锤了剧组没撒谎,东京之前就有矛盾

萌神木木 浏览 3370

ByteDance最新发布:一个能从任意数量图像重建3D世界的神奇模型

科技行者 浏览 3352

西班牙U20主帅:很高兴亚马尔、库巴西、赫伊森能进成年队

懂球帝 浏览 4910

牛弹琴:中国的强烈愤怒还在继续 日本有三个没想到

北京日报客户端 浏览 44147
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1