关闭广告

北大腾讯团队只改一行代码,让AI图像生成效果提升20%!

科技行者3331人阅读


这项研究由北京大学和腾讯混元实验室共同完成,并于2026年1月发表在计算机视觉领域的顶级学术期刊上。论文编号为arXiv:2601.17124,感兴趣的读者可以通过此编号查找完整的技术细节。

想象一下,你正在烘焙蛋糕,面前有两个不同的烤箱。一个烤箱只能设定几个固定的温度档位,比如低温、中温、高温,这就像是现在AI绘画中的"离散模式"。另一个烤箱可以精确调节到任意温度,就像"连续模式"。长期以来,AI图像生成领域就被这样分成了两个阵营,无法统一比较哪种方式更好。

但北京大学和腾讯混元的研究团队发现了一个巧妙的解决方案。他们注意到,现有的图像编码技术FSQ就像一个可以在两种模式间切换的烤箱,但这个烤箱有个致命缺陷:温度分布不均匀。大多数食物都挤在中间几个温度档位,而边缘的档位几乎用不到,造成了严重的"温度浪费"。

研究团队的洞察力在于,他们发现神经网络处理图像时产生的数据分布就像钟形曲线一样,大部分数值集中在中间,两端很少。但FSQ采用的是平均分布的量化方式,就好比用同样大小的盒子来装不同数量的物品,必然会造成中间的盒子装得满满当当,边缘的盒子却空空如也。

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

追觅办演唱会当年会撒贝宁主持 李克勤、张信哲等献唱

极目新闻 浏览 101880

成都通报药店医保违规:解除医保协议,开展整治专项行动

极目新闻 浏览 723

男生最经不住女生这样撩!

Yuki女人故事 浏览 4446

这次白银暴跌是人为操纵的?

新浪财经 浏览 3371

大S雕像揭幕仪式曝光,S妈具俊晔雨中挽手同行,前夫汪小菲未露面

扒虾侃娱 浏览 3404

曝郑爽新账号被封,15天前起的号

有范又有料 浏览 3482

开新局·走市场|烟火“彭”湃!徐州有座“不夜城”!

中国商报 浏览 3472

创维抄袭格力,为何低级得如此赤裸裸?

正经社 浏览 3488

消息称小鹏今年将推G01等4款新车,冲击55万-60万销量目标

IT之家 浏览 3523

赫斯基:斯洛特应该调整战术体系,将萨拉赫撤出首发

懂球帝 浏览 4510

《小城大事》谭光明结局:因郑志强的一刀,他因祸得福终扎根月海

肆季娱乐 浏览 3519

2026春夏八大流行趋势,早穿早美!

Yuki女人故事 浏览 3357

五一档票房超7亿,《给阿嬷的情书》开分9.0

澎湃新闻 浏览 1367

安琪酵母投15亿元补产能缺口

北京商报 浏览 4199

日股大跌,政坛地震威胁“高市交易”

国际金融报 浏览 4625

《一路繁花2》首波口碑,一针见血!

崽下愚乐圈 浏览 4492

伊朗选出新领袖 战事还要打多久

红星新闻 浏览 2663

创三年新低 销量暴跌63% 超越特斯拉难不难?

正在说车 浏览 4211

聂卫平告别仪式:兰莉娅变化大

古希腊掌管松饼的神 浏览 3514

A股继续走牛有底气

IPO日报 浏览 3516

骗取生育保险基金,主犯获刑十年!国家医保局曝光典型案例

环球网资讯 浏览 4604
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1