关闭广告

东南大学突破:AI学会情境化拒绝能力

科技行者907人阅读


由东南大学计算机科学与工程学院的杨俊明、许宁、刘彪、乔世奇和耿新等研究者组成的团队,最近在人工智能领域取得了一项重要突破。这项研究发表于2025年,论文编号为arXiv:2509.23371v1,提出了一种名为MetaAPO(Meta-Weighted Adaptive Preference Optimization)的全新AI训练方法。有兴趣深入了解的读者可以通过该编号查询完整论文。

要理解这项研究的重要性,我们先来看一个生活中的例子。假设你正在教孩子学习做饭,你有两种教学资源:一套经典的家传菜谱(就像AI训练中的离线数据),还有让孩子实际动手练习的机会(就像在线生成的数据)。传统的AI训练方法就像只用家传菜谱或只让孩子盲目练习,而东南大学团队的新方法则像是配备了一位智慧的厨艺老师,这位老师能够根据孩子当前的水平,灵活决定什么时候该参考菜谱,什么时候该放手让孩子实践,从而让学习效果达到最佳。

当前的大型语言模型训练面临着一个根本性的挑战:如何让AI既能从人类已有的经验中学习,又能通过实践不断改进自己。这就像是在平衡传承与创新的关系。传统方法要么过度依赖预先收集的人类反馈数据,导致AI无法适应新情况;要么完全

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

好消息,此前因膝盖小伤缺阵的热苏斯已回归阿森纳训练

懂球帝 浏览 12831

衣服想要穿出高级感 这些套路你要知道

In风尚 浏览 19259

美媒:中国技术突破极限 42条输电线路全都碾压美国

澎湃新闻 浏览 1022

737MAX事故多发,监管如何做?

澎湃新闻 浏览 12668

巩俐的前夫是圈外高级打工人,75岁在新加坡养老

白面书誏 浏览 854

杨振宁获诺奖速度纪录至今未破 提出理论到获奖仅1年

澎湃新闻 浏览 4630

在泰国,比亚迪挑战丰田

晚点LatePost 浏览 10601

更快更省钱!宁德时代发布全球首款磷酸铁锂4C神行超充电池硬刚比亚迪

澎湃新闻 浏览 14264

购置税新规下的购车选择题,插混车抄底还是等新车?

百姓评车 浏览 971

医院院长敛财2000万元!贪腐细节披露

环球网资讯 浏览 14613

共谋细胞与基因治疗产业创新发展!珠海举行前沿技术交流会

南方都市报 浏览 1514

宋仲基确认妻子今年生产:要在宝宝出生前疯狂约会

开开森森 浏览 39655

车主称比亚迪一款混动车纯电模式下会自行启动发动机,公司:正在跟进

澎湃新闻 浏览 14630

今夏穿T恤配这3种下装 显高显瘦又洋气

八分搭配 浏览 16849

限量30台 仰望U9X将于广州车展亮相

车质网 浏览 575

方程豹首款车型“豹5”正式发布,“豹9”概念车同步亮相

界面新闻 浏览 14568

全球最大稳定币遭质疑 标普将评级降至“最差一档”

财联社 浏览 403

关掉1000家门店!通用汽车通过收购将别克品牌经销网络削减一半

网易科技报道 浏览 12677

杜海涛和沈梦辰晒出合照否认分手

趣看热点 浏览 27023

追梦谈落选奥运会名单:很失望&本想拿第三金,我是球队领袖

懂球帝 浏览 12499

甲骨文业绩不及预期,资本开支比预期多约150亿美元,盘后重挫超10%

华尔街见闻官方 浏览 91
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1