关闭广告

香港中文大学突破AI训练难题:单个词汇也能让机器学得更聪明

科技行者4332人阅读


这项由香港中文大学的明瑞、吴昊原团队与华为诺亚方舟实验室、ChatEDA科技公司合作完成的研究,发表于2025年9月的arXiv预印本平台(论文编号:arXiv:2509.26313v1)。对于关心人工智能发展的普通读者来说,这项研究解决了一个听起来很技术但实际影响深远的问题:如何让AI更好地学习和泛化知识。

当我们教孩子学习时,有两种不同的方式。第一种是让孩子反复抄写标准答案,这就像传统的监督微调方法,孩子能够完美复制,但遇到新问题时往往不知所措。第二种是让孩子在实际练习中摸索,从错误中学习,这就像强化学习,虽然过程曲折,但孩子最终能举一反三。研究团队发现,第二种方法之所以更有效,关键在于孩子是在"真实练习"中学习,而不是只从固定的教材中死记硬背。

基于这个洞察,研究团队开发了一种名为"单词汇滚动"的新训练方法。这种方法巧妙地将两种学习方式的优点结合起来,既保持了第一种方法的高效性,又获得了第二种方法的泛化能力。核心创新在于将AI生成每个词汇的过程都视作一次完整的学习机会,而不是等到生成完整句子后再进行评估。

研究团队在数学推理、代码生成和通用推理等多个领域进行了广

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

利润预增超400%,存储芯片独角兽,势不可挡!

飞鲸投研 浏览 3283

九旬李明启谈到容嬷嬷为自己发声

蜜桔娱乐 浏览 4239

《疯狂动物城2》之后,更炸的大片来了

独立鱼 浏览 3261

14岁少年强奸杀害女同学被判无期 奶奶受刺激闭门不出

潇湘晨报 浏览 31310

消息称vivo X300s系列手机将搭载7K大电池及2亿主摄

IT之家 浏览 3386

北约下周军演 将模拟可能动用核武器场景

界面新闻 浏览 4492

扎十一惹:像鸟飞往她的山

时尚COSMO 浏览 2387

特朗普宣布延长停火 伊朗表态

界面新闻 浏览 1494

还有反转?上周五“精准做空”引发全市场关注,神秘交易员再度开出1.6亿美元空单

华尔街见闻官方 浏览 4547

女生希望"慢慢相处" 男子以送早餐为名进酒店实施性侵

红星新闻 浏览 13657

放下偶像包袱 大众安徽开始“听劝”

网易汽车 浏览 526

雅达利复刻“前竞争对手”Mattel Intellivision Sprint 游戏机

IT之家 浏览 4346

"巴铁"越打越猛阿富汗塔利班致电北京 中方斩钉截铁

健身狂人 浏览 110601

东升西降?拆解全球车企三季报,中国车企业绩更稳

大李说车 浏览 3973

今年秋天最流行的穿法:针织+衬衫,时髦又减龄!

LinkFashion 浏览 4722

针对其父可能被“身边人”出卖的传言 马杜罗之子回应

上观新闻 浏览 3436

船员在公海杀同事6个月后跳海潜逃 中国海警跨境捉拿

扬子晚报 浏览 7686

52岁颜丙燕官宣恋情!小20岁男友被拍

青梅侃史啊 浏览 4616

当“中国表格之王”开始发力多维表格

硅星人 浏览 4268

于东来周鸿祎秦英林王宁张红超,2025河南企业家影响了中国?

BT财经 浏览 3716

天才少年姚顺雨入职腾讯后首次公开发声

21世纪经济报道 浏览 3359
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1