爆点资讯

这项由上海交通大学、上海人工智能实验室、中国科学技术大学和复旦大学联合开展的研究发表于2025年10月，论文编号为arXiv:2510.01982v1。研究团队开发了一套名为G?RPO的全新技术框架，专门用于让AI绘画模型更好地理解和满足人类的审美偏好。

要理解这项研究的意义，我们可以把AI绘画过程想象成一个学习画画的学生。传统方法就像给学生一张完整的作品后说"画得好"或"画得不好"，但学生并不知道具体哪一笔画得好，哪一笔需要改进。这种模糊的反馈让学习过程变得缓慢而低效。

研究团队发现了现有AI绘画训练方法的两个关键问题。第一个问题是"奖励信号稀疏"，就好比一位厨师做菜时，只有等整道菜完成后才能品尝，无法在烹饪过程中及时调整火候和调料。第二个问题是"评估不够全面"，类似于只从一个角度评判一幅画作，而忽视了从不同距离、不同光线下观看的效果。

针对这些挑战，研究团队提出了创新的"颗粒化GRPO"解决方案。这套方案包含两个核心技术：单步随机采样策略和多粒度优势集成模块。

单步随机采样策略的工作原理就像给绘画过程装上了"定点导航系统"

上海交大突破：AI精准学习人类审美偏好

一颗“空心菜...

郭敬明太爱用...

XbotGo...

什么？！你告...

梓渝：慢下来...

脑机接口再迎...

夏天别总穿T恤，这些粉色裙子也不妨试一试，温柔高级又舒适

E句话| 王星与女友合体，复盘在缅甸遭遇？

大车要做大，小车更加要——工信部第399批新车热评

中国移动成功举办“AI赋能医院后勤管理新发展”论坛

蔚来ES9四月发布！车长近5.4米-比林肯领航员还大

香港迪士尼偶遇奚梦瑶，儿子女儿被保镖贴身保护

乐道推7年超低息金融方案年化费率低至0.49%

郭涛在大理补办婚礼！小石头兄妹当花童

收视破1，全员狠人，我断言：央视这部剧，又要火向全国了

重磅 | 2025中国消费年度智能创新名录揭晓：揭开消费增长的“虚与实”

赖清德宣布追加400亿美元用于对美军购提及2个时间点

港媒：高市所谓“对话”表态纯属玩文字游戏

新东方员工再出新歌＂骂＂公司俞敏洪曾奖励12万

推广 || 断舍离N次也不会断了它，买过最值的冬日单品之一

苹果折叠屏iPhone Fold细节曝光：钛合金机身，售价超2000美元

从OS到AI OS：荣耀MagicOS 10定义AI OS新时代

揭密！中国导弹为何飞越北极圈，不走太平洋

放不下身段就别扮丑，张嘉益告诉你，什么叫敬业不糊弄观众

给过去10年最好的谍战剧排个名：《沉默的荣耀》第6，《风筝》第2

吉利11月销量破31万辆连续9个月同环比双增长再刷历史新高

向太曝古天乐曾坐过牢：初次见面头都不敢抬

帕金斯：杜兰特去篮网太阳都是灾难，他并非争冠球队的理想引援

美官员称委内瑞拉代总统即将到访委方尚未证实

塞萨洛尼基大学推出MBC：让AI大脑像U盘一样随时扩容