关闭广告

北大腾讯团队只改一行代码,让AI图像生成效果提升20%!

科技行者3329人阅读


这项研究由北京大学和腾讯混元实验室共同完成,并于2026年1月发表在计算机视觉领域的顶级学术期刊上。论文编号为arXiv:2601.17124,感兴趣的读者可以通过此编号查找完整的技术细节。

想象一下,你正在烘焙蛋糕,面前有两个不同的烤箱。一个烤箱只能设定几个固定的温度档位,比如低温、中温、高温,这就像是现在AI绘画中的"离散模式"。另一个烤箱可以精确调节到任意温度,就像"连续模式"。长期以来,AI图像生成领域就被这样分成了两个阵营,无法统一比较哪种方式更好。

但北京大学和腾讯混元的研究团队发现了一个巧妙的解决方案。他们注意到,现有的图像编码技术FSQ就像一个可以在两种模式间切换的烤箱,但这个烤箱有个致命缺陷:温度分布不均匀。大多数食物都挤在中间几个温度档位,而边缘的档位几乎用不到,造成了严重的"温度浪费"。

研究团队的洞察力在于,他们发现神经网络处理图像时产生的数据分布就像钟形曲线一样,大部分数值集中在中间,两端很少。但FSQ采用的是平均分布的量化方式,就好比用同样大小的盒子来装不同数量的物品,必然会造成中间的盒子装得满满当当,边缘的盒子却空空如也。

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

应聘者被骂「吃的不如狗」?格力回应;市占率存疑?影石回应市占率下滑及大疆价格战;零跑汽车辟谣将被一汽集团收购:消息不实丨雷峰早报

雷峰网 浏览 4175

乌在黑海海域击沉一艘俄“影子舰队”油轮

上观新闻 浏览 3081

伊朗军队总司令:“我们的手始终放在扳机上”

环球网资讯 浏览 3316

每体:腓骨骨折的邦马蒂将接受手术,或将伤缺5个月

懂球帝 浏览 3971

香港警方含泪通报:要让每一位遇难者都有名字

扬子晚报 浏览 18195

能否复刻N7的成功?日产N6申报图现身

Nice好车 浏览 4655

谁说每年都要穿新衣服?准备一些基础款,百搭耐看又不过时

静儿时尚达人 浏览 1279

OpenAI确认旗下首款AI硬件今年发布,形态有望为“一支笔”

IT之家 浏览 3455

北约或取消峰会 避免与特朗普冲突出现"戏剧性场面"

环球网资讯 浏览 34691

给央视《小城大事》演技最好10位演员排名,赵丽颖第5,第1无争议

皮皮电影 浏览 3442

媒体:高市早苗当选首相 对华采取挑衅措施的可能提升

界面新闻 浏览 9216

博尔达拉斯:巧妇难为无米之炊,我不该承受这赛季所遭受的一切

懂球帝 浏览 3529

夏天别总穿T恤,这些粉色裙子也不妨试一试,温柔高级又舒适

静儿时尚达人 浏览 668

鸿蒙智行"9系"扩容 首款MPV智界V9来了

网易汽车 浏览 3954

国米取胜后距榜首1分,罗马如果能客胜米兰将独自领跑积分榜

懂球帝 浏览 4455

同曦126-123双加时逆转深圳,郭昊文31+6+10,史密斯空砍44分

懂球帝 浏览 3329

家居巨头杀入汽车圈,为渠道跨界找到新解法

汽车公社 浏览 3496

部分苹果 iPhone 17 Pro/Max 用户反馈机身褪色

IT之家 浏览 4552

世体:阿尔马达引发多家俱乐部争抢,本菲卡已对他表达兴趣

懂球帝 浏览 3624

看来看去还是这些穿搭舒适!深浅互补、多穿阔腿裤,简约自然

静儿时尚达人 浏览 4661

东风集团股份资本重组方案落地 实现100%国有控股

网易汽车 浏览 2695
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1