关闭广告

东南大学突破:AI学会情境化拒绝能力

科技行者4436人阅读


由东南大学计算机科学与工程学院的杨俊明、许宁、刘彪、乔世奇和耿新等研究者组成的团队,最近在人工智能领域取得了一项重要突破。这项研究发表于2025年,论文编号为arXiv:2509.23371v1,提出了一种名为MetaAPO(Meta-Weighted Adaptive Preference Optimization)的全新AI训练方法。有兴趣深入了解的读者可以通过该编号查询完整论文。

要理解这项研究的重要性,我们先来看一个生活中的例子。假设你正在教孩子学习做饭,你有两种教学资源:一套经典的家传菜谱(就像AI训练中的离线数据),还有让孩子实际动手练习的机会(就像在线生成的数据)。传统的AI训练方法就像只用家传菜谱或只让孩子盲目练习,而东南大学团队的新方法则像是配备了一位智慧的厨艺老师,这位老师能够根据孩子当前的水平,灵活决定什么时候该参考菜谱,什么时候该放手让孩子实践,从而让学习效果达到最佳。

当前的大型语言模型训练面临着一个根本性的挑战:如何让AI既能从人类已有的经验中学习,又能通过实践不断改进自己。这就像是在平衡传承与创新的关系。传统方法要么过度依赖预先收集的人类反馈数据,导致AI无法适应新情况;要么完全

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

12岁小学生自杀遗书称写不会英语单词 英语老师:委屈

观威海 浏览 13494

挪威主帅谈晋级世界杯:这是个超现实的夜晚,我感到非常自豪

懂球帝 浏览 4075

沃尔沃S60也开始卷价格?最高优惠12.6万

汽车网评 浏览 3726

每体:多家俱乐部提出租借巴尔德吉,弗里克暂时希望他留队

懂球帝 浏览 4236

《逍遥》大结局:秉烛结束了红烨,肖瑶曾为妖王!

肆季娱乐 浏览 3511

56岁陈红颜值回春,参加路演不惧高清镜头,她满脸皱纹依旧美丽

温柔娱公子 浏览 4509

存储涨价之后,如何让AI走向数据?丨ToB产业观察

钛媒体APP 浏览 1188

尤文旧将阿莫鲁索:不能让伊尔迪兹独自承担赢球责任

懂球帝 浏览 4985

解放军突然亮出大量东风17 竹林起竖画面被央视公开

小涛叨叨 浏览 9871

李昀锐孟子义被曝恋情,双方火速回应

萌神木木 浏览 4545

卡内基梅隆大学团队揭秘:AI绘画无需人工标注也能学会"听话"

科技行者 浏览 4191

雷军回应内部会议将玄戒O1读成01:鬼使神差念错了

IT之家 浏览 3356

累坏了,库尼亚打进扳平球+中框1次,贡献解围2次拦截2次

懂球帝 浏览 3496

特朗普与高市早苗首次会晤 外交部回应

政知新媒体 浏览 16323

特朗普威胁哥伦比亚总统:马杜罗之后就是你

澎湃新闻 浏览 21353

外套里面穿什么?这4款内搭时髦又显瘦!

Yuki女人故事 浏览 6208

装修“精神角落”,就是这么上瘾

时尚COSMO 浏览 1526

空中客车:任命王璀担任全球高级副总裁及空客中国民用飞机商务负责人

经济观察网 浏览 4998

邮报:纽卡中卫丹-伯恩遭遇肺穿孔和肋骨骨折,将缺阵六周

懂球帝 浏览 3701

修杰楷承认逃兵役!曾花钱造出假病历,贾静雯回应称孩子受到惊吓

萌神木木 浏览 4422

女子卷走公司2000万欲跑路 最后一刻害怕被抓放弃登机

环球网资讯 浏览 10852
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1