关闭广告

香港中文大学突破AI训练难题:单个词汇也能让机器学得更聪明

科技行者810人阅读


这项由香港中文大学的明瑞、吴昊原团队与华为诺亚方舟实验室、ChatEDA科技公司合作完成的研究,发表于2025年9月的arXiv预印本平台(论文编号:arXiv:2509.26313v1)。对于关心人工智能发展的普通读者来说,这项研究解决了一个听起来很技术但实际影响深远的问题:如何让AI更好地学习和泛化知识。

当我们教孩子学习时,有两种不同的方式。第一种是让孩子反复抄写标准答案,这就像传统的监督微调方法,孩子能够完美复制,但遇到新问题时往往不知所措。第二种是让孩子在实际练习中摸索,从错误中学习,这就像强化学习,虽然过程曲折,但孩子最终能举一反三。研究团队发现,第二种方法之所以更有效,关键在于孩子是在"真实练习"中学习,而不是只从固定的教材中死记硬背。

基于这个洞察,研究团队开发了一种名为"单词汇滚动"的新训练方法。这种方法巧妙地将两种学习方式的优点结合起来,既保持了第一种方法的高效性,又获得了第二种方法的泛化能力。核心创新在于将AI生成每个词汇的过程都视作一次完整的学习机会,而不是等到生成完整句子后再进行评估。

研究团队在数学推理、代码生成和通用推理等多个领域进行了广

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

高市内阁名单出炉 身材火辣的日本知名写真女星入选

红星新闻 浏览 6825

智能化升级 新款卡罗拉锐放限时售9.68万起

网易汽车 浏览 771

太阳报:曼联17岁中场思韦茨随一线队训练,被比作佩德里

懂球帝 浏览 1101

11月十大必看短剧

仙女事件簿 浏览 266

宁德时代与易控智驾签署战略协议

证券时报 浏览 851

博时基金“换帅”

国际金融报 浏览 997

美防长称外国要在美国本土建军事基地 惹怒特朗普拥趸

新民周刊 浏览 4024

广西隆安发现16000年前的人头骨化石16000年前的人长啥样的?

趣看热点 浏览 26185

国台办新年首场发布会摄像机位人挤人 台记者称很重视

直新闻 浏览 78146

安赛龙回应发球争议:我采用这种发球方式已有多年

懂球帝 浏览 959

贾跃亭又拿到9000万美元续命钱!

国际金融报 浏览 15800

360发布2023年业绩预告:亏损同比收窄80%

网易科技报道 浏览 12759

马斯克称xAI本周将开源Grok大模型

第一财经资讯 浏览 10884

理想汽车CEO李想朋友圈发声:“我们决定开始反击”

环球网资讯 浏览 11066

保时捷的十字路口:奥博穆交棒,勒茨斯的回归与挑战

网易汽车 浏览 950

《公诉》收视率狂跌,热巴转型失败真实演技"露馅"

甜小娱儿 浏览 16650

一图看懂|朝鲜庆祝空军成立80周年 展示了哪些新式武器

澎湃新闻 浏览 208

4天3赛干了129分钟!阿努诺比:不知道我顶不顶得住……

直播吧 浏览 12537

开发商未批先建楼盘烂尾5年 13次专题会督促解决未果

鲁中晨报 浏览 64334

外媒:北约讨论在日本设立联络处 马克龙表态反对

环球网资讯 浏览 16607

NASA局长给申请研究月球样品开绿灯:必须通过审查

观察者网 浏览 62734
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1