关闭广告

北大腾讯团队只改一行代码,让AI图像生成效果提升20%!

科技行者3163人阅读


这项研究由北京大学和腾讯混元实验室共同完成,并于2026年1月发表在计算机视觉领域的顶级学术期刊上。论文编号为arXiv:2601.17124,感兴趣的读者可以通过此编号查找完整的技术细节。

想象一下,你正在烘焙蛋糕,面前有两个不同的烤箱。一个烤箱只能设定几个固定的温度档位,比如低温、中温、高温,这就像是现在AI绘画中的"离散模式"。另一个烤箱可以精确调节到任意温度,就像"连续模式"。长期以来,AI图像生成领域就被这样分成了两个阵营,无法统一比较哪种方式更好。

但北京大学和腾讯混元的研究团队发现了一个巧妙的解决方案。他们注意到,现有的图像编码技术FSQ就像一个可以在两种模式间切换的烤箱,但这个烤箱有个致命缺陷:温度分布不均匀。大多数食物都挤在中间几个温度档位,而边缘的档位几乎用不到,造成了严重的"温度浪费"。

研究团队的洞察力在于,他们发现神经网络处理图像时产生的数据分布就像钟形曲线一样,大部分数值集中在中间,两端很少。但FSQ采用的是平均分布的量化方式,就好比用同样大小的盒子来装不同数量的物品,必然会造成中间的盒子装得满满当当,边缘的盒子却空空如也。

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

特斯拉Model Y低调升级?标配16寸2K大屏+0息政策

大李说车 浏览 3577

规模创历史新高 2025浦江创新论坛共议科技未来

看看新闻Knews 浏览 5061

联合国官员:加沙教育系统状况是灾难性的

北青网-北京青年报 浏览 4398

美方在北约外长会上"炮轰"欧盟 被指系又一次强硬姿态

澎湃新闻 浏览 35229

美国仿制伊朗的自杀式无人机 开始在中东部署

红星新闻 浏览 3763

半年暴涨超470%!中际旭创,实控人拟套现22亿!

侃见财经 浏览 4917

黄慧颐晒结婚证回击保剑锋,业内下场曝猛料,女方曾持刀捅伤男方

萌神木木 浏览 3365

稳定输出,亚历山大22中11砍35分7板6助,三分9中3&11罚10中

懂球帝 浏览 4144

冬天穿衣也可以很简单!这些造型赶紧照搬,舒适时髦两不误

静儿时尚达人 浏览 3617

20名以色列被扣押人员将分两批获释

CCTV国际时讯 浏览 4483

以色列部长回应"虐待环保少女":很自豪

CCTV国际时讯 浏览 3135

第二代腾势D9插混版亮相 搭载闪充技术

网易汽车 浏览 2411

翁帆:杨先生离开时一定很欣慰 他交出了份满意的答卷

光明日报 浏览 7886

Hi财经丨海外仓升级,“买卖全球”更通畅

海外网 浏览 1382

丑到离谱的牛马鞋,新中产抢疯了

她刊 浏览 516

刚亮完核杀器 俄罗斯"末日电台"发出6字神秘信号

参考消息网 浏览 15346

特朗普对伊朗新任最高领袖感到"不高兴"

新华社客户端 浏览 2449

硬核揭秘!福建舰“一马当先”底气何在

环球网资讯 浏览 2816

升第三!深圳双杀山西11连胜创队史纪录 王浩然33分生涯新高

醉卧浮生 浏览 1843

特朗普:美军将驻扎在伊朗境内及周边 美伊达成个共识

每日经济新闻 浏览 59489

谢孟伟彻底“凉凉”,多平台账号被封,潘长江的含金量还在上升

扒虾侃娱 浏览 4991
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1