关闭广告

东南大学突破:AI学会情境化拒绝能力

科技行者4601人阅读


由东南大学计算机科学与工程学院的杨俊明、许宁、刘彪、乔世奇和耿新等研究者组成的团队,最近在人工智能领域取得了一项重要突破。这项研究发表于2025年,论文编号为arXiv:2509.23371v1,提出了一种名为MetaAPO(Meta-Weighted Adaptive Preference Optimization)的全新AI训练方法。有兴趣深入了解的读者可以通过该编号查询完整论文。

要理解这项研究的重要性,我们先来看一个生活中的例子。假设你正在教孩子学习做饭,你有两种教学资源:一套经典的家传菜谱(就像AI训练中的离线数据),还有让孩子实际动手练习的机会(就像在线生成的数据)。传统的AI训练方法就像只用家传菜谱或只让孩子盲目练习,而东南大学团队的新方法则像是配备了一位智慧的厨艺老师,这位老师能够根据孩子当前的水平,灵活决定什么时候该参考菜谱,什么时候该放手让孩子实践,从而让学习效果达到最佳。

当前的大型语言模型训练面临着一个根本性的挑战:如何让AI既能从人类已有的经验中学习,又能通过实践不断改进自己。这就像是在平衡传承与创新的关系。传统方法要么过度依赖预先收集的人类反馈数据,导致AI无法适应新情况;要么完全

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

香港重磅活动,17日盛大开启!

中国基金报 浏览 3871

美财长公然挑拨中阿关系:米莱承诺"让中国退出阿根廷"

环球网资讯 浏览 7482

张柏芝与向太的关系彻底崩塌?

涵豆说娱 浏览 5057

紫光展锐发布端边AI芯片平台N9系列:4nm工艺,Arm v9.2 CPU

IT之家 浏览 1298

向佐表示父母不该公开说向佑:为什么不私下解决

韩小娱 浏览 110

李斌透露:蔚来ES8五座版7月发布!大五座SUV市场要变天了?

优视汽车 浏览 721

U23国足遭暴击!鲍世蒙8分钟闪退,抢断王出场,媒体人:因祸得福

奥拜尔 浏览 3568

今秋最撩的“薄外套+裙子”,谁穿谁美!

Yuki女人故事 浏览 6640

国家互联网应急中心提示“龙虾”风险

澎湃新闻 浏览 2634

一年高速迭代、超2000万安装!鸿蒙版微信用实力回应质疑

雷科技 浏览 4617

售16.59万元起 改款奥迪A3家族正式上市

网易汽车 浏览 4180

美方被指仍在追截第三艘油轮 并拟增派力量强行登船

环球网 浏览 3679

“这个风格”今年冬天又火了!谁穿谁高级

LinkFashion 浏览 3431

特瓦斯:大多数联赛都在苦苦挣扎,我好奇为何人们这么想阻止海外赛

懂球帝 浏览 4481

深耕大健康战略,招商信诺获评2025金柿奖·中国保险健康管理服务样本

Daily每日财报 浏览 3891

SHEIN新加坡公司财务真相调查:去年增收不增利,过去3年纳税约4亿美元

红星资本局 浏览 4748

4名游客遭马蜂袭击送医抢救:满头被蜇 头发都剃光了

极目新闻 浏览 8266

港科大突破:代码本技术提升AI医学图像分析稳定性

科技行者 浏览 3348

乐道推7年超低息金融方案 年化费率低至0.49%

网易汽车 浏览 3514

南京爆冷无缘苏超决赛,苏州发布9个感叹号!网友:像是在放鞭炮

风过乡 浏览 4645

巴基斯坦总理在联大敲桌子强调"自卫权"

北京日报 浏览 3755
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1