关闭广告

上海交大突破:AI精准学习人类审美偏好

科技行者4011人阅读


这项由上海交通大学、上海人工智能实验室、中国科学技术大学和复旦大学联合开展的研究发表于2025年10月,论文编号为arXiv:2510.01982v1。研究团队开发了一套名为G?RPO的全新技术框架,专门用于让AI绘画模型更好地理解和满足人类的审美偏好。

要理解这项研究的意义,我们可以把AI绘画过程想象成一个学习画画的学生。传统方法就像给学生一张完整的作品后说"画得好"或"画得不好",但学生并不知道具体哪一笔画得好,哪一笔需要改进。这种模糊的反馈让学习过程变得缓慢而低效。

研究团队发现了现有AI绘画训练方法的两个关键问题。第一个问题是"奖励信号稀疏",就好比一位厨师做菜时,只有等整道菜完成后才能品尝,无法在烹饪过程中及时调整火候和调料。第二个问题是"评估不够全面",类似于只从一个角度评判一幅画作,而忽视了从不同距离、不同光线下观看的效果。

针对这些挑战,研究团队提出了创新的"颗粒化GRPO"解决方案。这套方案包含两个核心技术:单步随机采样策略和多粒度优势集成模块。

单步随机采样策略的工作原理就像给绘画过程装上了"定点导航系统"

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

朱光耀:中美AI实力对比,中国具备三项优势

上观新闻 浏览 3437

阿 Sa4 段公开情史终定局,兜兜转转还是选了他

南万说娱26 浏览 1122

贵州银行:以自身信用承接19亿存款,信托化险突然受宠

密探财经 浏览 3151

剧版《西虹市首富》首波口碑出炉了!观众打分评价都“一针见血”

娱乐圈笔娱君 浏览 2983

2026款比亚迪海豹05 DM-i上市 售价7.98万元

车质网 浏览 3749

码住抄作业!春节见人不翻车就靠这8样!

Yuki女人故事 浏览 3142

桂林银行网点开到居民家里?

财经众议院 浏览 2598

朝鲜进行远程战略巡航导弹发射训练

国际在线 浏览 3276

法尔克:对没拿到三分有些失望,但对曼联拿到一分也是不错的

懂球帝 浏览 3238

111年之耻!巴西首次2比0领先却失利,安切洛蒂亲手揪出罪人

奥拜尔 浏览 4433

中美两军在夏威夷见面 中方当场划下两条"红线"

看看新闻Knews 浏览 13764

没入选巴西国家队,恩德里克在国际比赛日期间前往摩洛哥度假

懂球帝 浏览 4263

蔚来艰难求盈利

北京商报 浏览 3720

摩恩电气深V之意

富凯财经 浏览 3933

今日热点:李庚希空降粉丝群抵制代拍;荷兰弟复工拍摄《蜘蛛侠4》……

伊周潮流 浏览 3650

迪班萨:如果被奇才队选中,我需要特雷-杨让出3号球衣

懂球帝 浏览 113

日本汽车业面临停产风险!

电动知家 浏览 4275

宗馥莉的两大心腹疑似离职,“宏胜系”权力大洗牌

财通社 浏览 4205

致态 TiPlus 7100s 固态硬盘发布:长江存储新一代颗粒,659 元起

IT之家 浏览 3986

郑智化发声道歉!坦言自己情绪上头用词不当

萌神木木 浏览 4079

球员是否因阿森纳输球更有动力?瓜帅:我建议他们专注于自己

懂球帝 浏览 3027
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1