关闭广告

东南大学突破:AI学会情境化拒绝能力

科技行者4245人阅读


由东南大学计算机科学与工程学院的杨俊明、许宁、刘彪、乔世奇和耿新等研究者组成的团队,最近在人工智能领域取得了一项重要突破。这项研究发表于2025年,论文编号为arXiv:2509.23371v1,提出了一种名为MetaAPO(Meta-Weighted Adaptive Preference Optimization)的全新AI训练方法。有兴趣深入了解的读者可以通过该编号查询完整论文。

要理解这项研究的重要性,我们先来看一个生活中的例子。假设你正在教孩子学习做饭,你有两种教学资源:一套经典的家传菜谱(就像AI训练中的离线数据),还有让孩子实际动手练习的机会(就像在线生成的数据)。传统的AI训练方法就像只用家传菜谱或只让孩子盲目练习,而东南大学团队的新方法则像是配备了一位智慧的厨艺老师,这位老师能够根据孩子当前的水平,灵活决定什么时候该参考菜谱,什么时候该放手让孩子实践,从而让学习效果达到最佳。

当前的大型语言模型训练面临着一个根本性的挑战:如何让AI既能从人类已有的经验中学习,又能通过实践不断改进自己。这就像是在平衡传承与创新的关系。传统方法要么过度依赖预先收集的人类反馈数据,导致AI无法适应新情况;要么完全

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

彩虹-7高空高速隐身无人机成功首飞 实现重大突破

新京报 浏览 9174

暴涨!全线拉升!芯片传闻,突然刷屏

券商中国 浏览 3148

船员在公海杀同事6个月后跳海潜逃 中国海警跨境捉拿

扬子晚报 浏览 7478

连续被血洗!今年前十个月的涨幅,币圈一个月跌完了

华尔街见闻官方 浏览 3965

大爷拍"素颜巴黎"火了:欧洲行费用1万多 不会说英语

极目新闻 浏览 13879

关店100家!潘多拉败走中国,营收萎缩至1%,消费者:质量太差

木禾投研 浏览 4158

苹果公司在印度反垄断案中可能面临高达380亿美元罚款

华尔街见闻官方 浏览 3807

陈凯歌做梦也没想到,竟有一天会因儿子陈飞宇,实现口碑暴增

温柔娱公子 浏览 3960

售35.98万元起 第二代腾势D9正式上市

网易汽车 浏览 1173

科技大佬话AI未来:手机消失、工作消失、全民富有?

帮宁工作室 浏览 3243

收视率破2,唐嫣赵又廷令观众成功入坑,央视都市剧有新招牌了

娱乐圈笔娱君 浏览 1183

郭宇欣刘萧旭太原盛典现场互动 太甜了

生性洒脱 浏览 3775

用月亮球把郑钦文送回家的赫瓦林斯卡,闯入法网八强了!

网球之家 浏览 113

给过去十年最好的10部“历史剧”排名:《太平年》第7,第1无争议

皮皮电影 浏览 2919

一个月内两度请辞!“80后”刘鹏辞任中顺洁柔董事长、总裁,年薪514万

红星资本局 浏览 3235

就两岸关系 郑丽文、马英九最新表态

新京报政事儿 浏览 8896

卫星图像首次发现:伊朗两处受损核设施有"重大活动"

澎湃新闻 浏览 7686

撒贝宁去加拿大探望丈人,带着老婆孩子逛街

甜柠聊史 浏览 4413

美教授说大实话:特朗普对委动手背后 石油优先于民主

澎湃新闻 浏览 10625

科沃斯“最贵”的高管,又要套现3000万?

蓝鲸新闻 浏览 4194

短剧红毯成“见光死”现场,没了美颜和修图,遍地普男普女!

娱乐圈笔娱君 浏览 1355
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1