关闭广告

北大腾讯团队只改一行代码,让AI图像生成效果提升20%!

科技行者3164人阅读


这项研究由北京大学和腾讯混元实验室共同完成,并于2026年1月发表在计算机视觉领域的顶级学术期刊上。论文编号为arXiv:2601.17124,感兴趣的读者可以通过此编号查找完整的技术细节。

想象一下,你正在烘焙蛋糕,面前有两个不同的烤箱。一个烤箱只能设定几个固定的温度档位,比如低温、中温、高温,这就像是现在AI绘画中的"离散模式"。另一个烤箱可以精确调节到任意温度,就像"连续模式"。长期以来,AI图像生成领域就被这样分成了两个阵营,无法统一比较哪种方式更好。

但北京大学和腾讯混元的研究团队发现了一个巧妙的解决方案。他们注意到,现有的图像编码技术FSQ就像一个可以在两种模式间切换的烤箱,但这个烤箱有个致命缺陷:温度分布不均匀。大多数食物都挤在中间几个温度档位,而边缘的档位几乎用不到,造成了严重的"温度浪费"。

研究团队的洞察力在于,他们发现神经网络处理图像时产生的数据分布就像钟形曲线一样,大部分数值集中在中间,两端很少。但FSQ采用的是平均分布的量化方式,就好比用同样大小的盒子来装不同数量的物品,必然会造成中间的盒子装得满满当当,边缘的盒子却空空如也。

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

英伟达发布Alpamayo汽车大模型平台 黄仁勋:这是机器理解现实世界的转折点

快科技 浏览 3454

永辉超市减持红旗连锁,套现上亿元

红星资本局 浏览 3260

“短发”在冬天太权威了,怎么穿都好看!

LinkFashion 浏览 3785

阿信演唱会摔下舞台,相信音乐发声报平安:结束后有专业人员检查

扒虾侃娱 浏览 3668

莫迪视察印度首艘国产航母:名字就让巴基斯坦睡不着

鲁中晨报 浏览 4211

我国高原大型无人机物流航线首次验证飞行成功,北川成关键落地节点

红星新闻 浏览 3339

福建舰电磁弹射技术处世界先进水平

北京日报客户端 浏览 4000

中美两军在夏威夷见面 中方当场划下两条"红线"

看看新闻Knews 浏览 51588

172个观众,首日票房仅7365元,2025年11月最惨新片诞生了

靠谱电影君 浏览 4019

网飞开年第一爆剧来了,快去看

独立鱼 浏览 3324

内娱女明星手撕导演,翻车了?

独立鱼 浏览 3313

今年秋天最流行的4件卫衣,减龄又时髦!

LinkFashion 浏览 6634

玲花时隔4个月单人复出,曾毅近照憔悴暴瘦,凤凰传奇合体艰难

萌神木木 浏览 3556

机主称手机莫名被停机超半个月 运营商:号码为高风险

红星新闻 浏览 12000

一天4瓜!个个离谱

阿纂看事 浏览 4243

TA:告别全白球衣,阿森纳将在足总杯第3轮穿回传统红白球衣

懂球帝 浏览 3493

秋天上班族应该怎么穿衣?衬衫为主、打造腰线,利落又得体

静儿时尚达人 浏览 4472

宇树澄清:去年人形机器人出货量超5500台,不含其他产品

南方都市报 浏览 3296

户外赛道竞速,坦博尔、伯希和冲刺港股突围

斑马消费 浏览 4510

北汽集团10月整车销量160133辆 同比增长11%

网易汽车 浏览 4273

阿斯:瓜帅执教曼城已完成超70笔引援,花费金额超20亿欧

懂球帝 浏览 3246
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1