关闭广告

东南大学突破:AI学会情境化拒绝能力

科技行者4437人阅读


由东南大学计算机科学与工程学院的杨俊明、许宁、刘彪、乔世奇和耿新等研究者组成的团队,最近在人工智能领域取得了一项重要突破。这项研究发表于2025年,论文编号为arXiv:2509.23371v1,提出了一种名为MetaAPO(Meta-Weighted Adaptive Preference Optimization)的全新AI训练方法。有兴趣深入了解的读者可以通过该编号查询完整论文。

要理解这项研究的重要性,我们先来看一个生活中的例子。假设你正在教孩子学习做饭,你有两种教学资源:一套经典的家传菜谱(就像AI训练中的离线数据),还有让孩子实际动手练习的机会(就像在线生成的数据)。传统的AI训练方法就像只用家传菜谱或只让孩子盲目练习,而东南大学团队的新方法则像是配备了一位智慧的厨艺老师,这位老师能够根据孩子当前的水平,灵活决定什么时候该参考菜谱,什么时候该放手让孩子实践,从而让学习效果达到最佳。

当前的大型语言模型训练面临着一个根本性的挑战:如何让AI既能从人类已有的经验中学习,又能通过实践不断改进自己。这就像是在平衡传承与创新的关系。传统方法要么过度依赖预先收集的人类反馈数据,导致AI无法适应新情况;要么完全

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

两名国民党民代遭起诉 郑丽文:民进党想团灭在野党

海峡导报社 浏览 15070

茅台镇一酒厂91吨基酒拍卖,仅1人报名,评估价548万,以373万元成交

红星资本局 浏览 3324

冬天想穿得轻盈保暖,看看这些大衣穿搭,大方舒适又有高级感

静儿时尚达人 浏览 3785

卡塔尔:加沙可能陷入“无战无和”局面

国际在线 浏览 4241

辱骂西蒙尼的球迷:我没说种族歧视的话,也没提马岛战争

懂球帝 浏览 5034

双星鞋业84岁创始人宣布断绝父子关系:儿子抢公章夺权

红星新闻 浏览 11041

陈匡怡怒斥台媒毁人名节,自曝写了遗书

萌神木木 浏览 2952

美军:不会容忍伊朗在军演中的“不安全行为”

新华社 浏览 3163

深夜,全线大跌!“超级风暴”突袭!

券商中国 浏览 2735

宽基ETF被抢筹,市场风格走向何方?

国际金融报 浏览 3717

"女首相梦"悬了的高市公开支持赖清德 日本亲华派翻脸

梁讯 浏览 8204

特朗普与泽连斯基再会面详情公开 见面就夸后者时尚

新京报政事儿 浏览 9860

关键时刻又崩!许利民发布会罕见发怒,却甩锅球员态度与球员能力

篮球资讯达人 浏览 3491

比亚迪:今年前5个月新能源车累计销量同比下降20.32%

面包财经 浏览 397

李书福砍了一刀,尹同跃打出一枪!车市大战硝烟弥漫

象视汽车 浏览 4185

47岁冯绍峰颜值回春,自称是威尼斯影后的朋友

扒虾侃娱 浏览 4151

2026年开年看什么?这些新剧已经帮你挑好了

桃桃淘电影 浏览 3434

委内瑞拉外长会见美外交使团团长

环球网资讯 浏览 3185

国产药械对外授权交易再现新进展,创下多个“首个”

第一财经资讯 浏览 4661

赵本山还是没叫醒闫学晶,儿子被举报涉高考移民,本人辽晚遭抵制

萌神木木 浏览 3015

礼来下调Zepbound减肥药现金价格,最低至每月299美元,股价下挫1%

华尔街见闻官方 浏览 3908
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1