关闭广告

东南大学突破:AI学会情境化拒绝能力

科技行者2775人阅读


由东南大学计算机科学与工程学院的杨俊明、许宁、刘彪、乔世奇和耿新等研究者组成的团队,最近在人工智能领域取得了一项重要突破。这项研究发表于2025年,论文编号为arXiv:2509.23371v1,提出了一种名为MetaAPO(Meta-Weighted Adaptive Preference Optimization)的全新AI训练方法。有兴趣深入了解的读者可以通过该编号查询完整论文。

要理解这项研究的重要性,我们先来看一个生活中的例子。假设你正在教孩子学习做饭,你有两种教学资源:一套经典的家传菜谱(就像AI训练中的离线数据),还有让孩子实际动手练习的机会(就像在线生成的数据)。传统的AI训练方法就像只用家传菜谱或只让孩子盲目练习,而东南大学团队的新方法则像是配备了一位智慧的厨艺老师,这位老师能够根据孩子当前的水平,灵活决定什么时候该参考菜谱,什么时候该放手让孩子实践,从而让学习效果达到最佳。

当前的大型语言模型训练面临着一个根本性的挑战:如何让AI既能从人类已有的经验中学习,又能通过实践不断改进自己。这就像是在平衡传承与创新的关系。传统方法要么过度依赖预先收集的人类反馈数据,导致AI无法适应新情况;要么完全

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

谈判之际擦枪走火 伊无人机冲向美航母或给美动武借口

第一军情 浏览 3829

趋势!考核升级,全国多地探索从严管理新机制

识局 浏览 2662

资负统筹,多元发展,中国人寿前三季度新业务价值强劲增长41.8%

证券市场周刊 浏览 2608

摩洛哥队长赛斯自宣从国家队退役,共代表摩洛哥出场86次

懂球帝 浏览 991

天空:曼联在关注雷恩中卫雅凯,他冬窗不太可能加盟

懂球帝 浏览 1779

推广中奖名单-更新至2025年11月5日推广

黎贝卡的异想世界 浏览 2098

梁小龙一生刚直!因一句“我是中国人”被逼写悔过书,他当场拒写

萌神木木 浏览 1698

小米YU7交付量突破4万台 推出高端定制服务

网易汽车 浏览 3354

不确定的时代里,亚马逊广告如何重构确定性?

有数DataVision 浏览 1943

厄德高谈晋级世界杯:这种感觉无法用语言形容,简直疯狂至极

懂球帝 浏览 2391

女警带儿子逛街遇行凶 徒手夺刀面部受伤差点伤到动脉

大象新闻 浏览 6275

电池技术取得重要突破,新能源车续航里程有望翻倍

环球网资讯 浏览 2822

吉利品牌登陆英国市场,目标 2030 年实现 10 万台汽车销量

IT之家 浏览 2643

西甲:皇家贝蒂斯2比0奥萨苏纳

体坛周报 浏览 3144

特朗普大规模换大使:涉及30多国 均在拜登时期上任

齐鲁壹点 浏览 7096

王菲女儿李嫣疑恋爱!与帅气男生现身机场

二妹扯娱 浏览 1714

媒体:马克龙戴墨镜出席达沃斯 说的话不给特朗普面子

新民周刊 浏览 18939

我国计算机软件事业先驱者之一、中国科学院院士董韫美因病逝世

IT之家 浏览 1464

新款坦克400 4种动力+激光雷达 纯电续航200公里

念寒车评 浏览 2473

关键时刻又崩!许利民发布会罕见发怒,却甩锅球员态度与球员能力

篮球资讯达人 浏览 1715

【原声】阿韦洛亚,最后一个穆里尼奥主义者

体坛周报 浏览 1469
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1