爆点资讯

这项由苏州大学LCM实验室联合中国移动(苏州)共同完成的突破性研究发表于2026年1月，论文编号为arXiv:2601.11969v1。有兴趣深入了解的读者可以通过该编号查询完整论文。

想象一下，当我们看一部长达三小时的电影时，大脑需要不断记忆和管理信息——记住开头的情节线索，理解中间的人物关系，并将所有信息整合起来理解结局。这正是当前人工智能系统面临的挑战：如何处理超长文本或对话，如何有效管理和利用历史信息。

然而，更有趣的问题是：我们如何判断一个AI系统的记忆管理能力是好是坏？这就像需要一位经验丰富的电影评论家来评判一部电影的叙事结构是否合理。在AI领域，这个"评论家"就是奖励模型（Reward Model），它们被用来评估和改进AI系统的表现。

苏州大学的研究团队率先提出了一个关键问题：这些AI"评论家"是否真的能够准确判断其他AI的记忆管理能力？为了回答这个问题，他们创建了全世界第一个专门用于测试奖励模型记忆评估能力的基准测试平台——MemoryRewardBench。

这项研究的创新性在于，它首次将评估重点从

苏州大学突破：AI评判官能评估人工智能的记忆管理能力吗？

智能座舱也能...

手握200亿...

合纵连横更进...

致敬球队传奇...

GUI自动化...

礼来和诺和诺...

五十岁的女人，牢记这 “三不穿”，便能轻松平衡优雅与减龄

马斯克也要涉足GEO，AI应用概念全面爆发

内维尔：我原本认为曼城状态不够稳定，但看来我大错特错了

乌克兰一地遭俄军无人机密集袭击基辅实施紧急停电

姚晨怒批倍速看剧：观众不该背锅

官方：狼堡签下20岁日本中场盐贝健人；据悉转会费900万欧

3500亿小红书，到了最危险时刻？

移动、联通押注下一代“手机”

AI也能写学术论文了？上海交大团队揭开大模型撰写科研综述的秘密

被大空头狙击的明星AI股Palantir，华尔街怎么看

不尊重中国领土完整！巴萨遭批：中国特供不发外网甩锅临时工

砸1亿元跨界，百亿巨头老板电器杀入机器人赛道

美国宇航局成功验证太空识别GPS干扰源能力

波利塔诺：我们应铭记输给埃因霍温，提醒自己要一直全力以赴

《惊蛰无声》预告质感太差！杨幂没精神刘诗诗像盲人，被嘲像网大

支持家乡球队，网球球员吴易昺来黄龙体育场观战浙江vs山东

中国被指与伊朗接近达成超音速导弹采购协议外交部回应

伊朗外长：伊朗做好了应对一切可能的准备

佘诗曼《新闻女王2》首波口碑出炉了！现场观众的评价一针见血

极兔速递三季度包裹量76.8亿件，同比增长23.1%

推荐失准、价格偏差、平台割裂，AI购物被吹过头了？

中国使出大招全世界嘲笑美：终于中国出来收拾美国了

墨西哥总统宣布将向古巴提供援助并推动恢复石油供应

Motif发布12.7B模型：用小算力挑战大模型，效率与性能的＂双赢＂