关闭广告

浙大团队突破:AI实现多人脸精准生成

科技行者2744人阅读


这项由浙江大学计算机科学与技术学院吴涛、江逸博等研究人员领导的团队,联合浙江大学软件技术学院和华为技术有限公司,于2025年9月发表的研究成果,解决了AI绘画领域一个令人头疼的技术难题。该研究成果以论文形式发表,论文编号为arXiv:2509.21953v1,为多主体图像生成技术带来了突破性进展。

当前的AI绘画技术已经能够根据用户提供的照片,生成单个人物的精美图像。但是,当我们要求AI在同一张图片中绘制多个不同的人物时,问题就出现了。就像一个初学画画的孩子,AI经常会把不同人的特征混在一起,比如把张三的眼睛画到了李四脸上,或者让王五戴上了赵六的帽子。这种现象被研究人员称为"属性泄漏",就好比调色板上的颜料不小心混合了,原本清晰分明的色彩变得模糊不清。

更令人困扰的是,即使AI勉强画出了多个人物,生成的图像往往无法满足人们的审美期待,缺乏真实感和艺术美感。这就像一位厨师虽然知道所有的食材,但却不知道如何搭配才能做出令人满意的佳肴。

面对这些挑战,浙江大学的研究团队开发了一套名为"MultiCrafter"的全新框架。这个框架就像一位经验丰富的导演,能够精确指挥每个"演

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

白宫发了张图:“痛击加拿大鹅”

大风新闻 浏览 37534

美媒披露:美空军8天内向中东地区调派至少42架重型运输机

环球网 浏览 1475

美军连扣两艘油轮 美方:都是委内瑞拉“影子舰队”

新华社 浏览 1652

社交电商,一场集体幻灭的资本游戏

钛媒体APP 浏览 2106

李亚鹏海哈金喜离婚早有预兆!女方无意说漏嘴,婚姻不能只有爱情

萌神木木 浏览 2808

新马王就位 法拉利F80即将迎国内首发

车质网 浏览 1412

中国首个低空飞行营地开营,落户广州大学城

IT之家 浏览 2596

梅西创造完成美职联50球最快纪录,此前由约瑟夫和伊布保持

懂球帝 浏览 2712

阿斯:巴萨接近回归财务1:1,今夏或可恢复正常转会操作

懂球帝 浏览 1437

印媒:印度将在印巴边境地区启动大规模三军联合演习

环球网资讯 浏览 2564

央行连续增持黄金,10月我国外汇储备规模稳中有升

中国商报 浏览 2557

宝马将采取油电并存策略,董事会成员高乐称“内燃机永不会消失”

IT之家 浏览 3607

海信发布两款颠覆级激光显示新品,显示产业形态创新迈向关键拐点

IT之家 浏览 3433

口子窖第三季度利润下降超9成,高端酒卖不动了

红星资本局 浏览 2669

75岁谭咏麟街头买金鱼!与老板老友式寒暄

丁睋解说 浏览 1382

Slack CEO 加盟 OpenAI,担任公司首席营收官

经济观察网 浏览 2043

前总裁起诉申通快递,要求分得前妻名下2028万股股权

YOUNG财经 浏览 1559

中国色特别策划 | 故宫技艺与古意新生

时尚COSMO 浏览 2080

新款小米SU7计划春节前到店 预售22.99万起

网易汽车 浏览 1512

服装AB版带货套路:消费欺诈不能成行业“潜规则”丨中听

大象新闻 浏览 2456

台名嘴:大陆对高市早苗提出抗议的层级越来越高

环球时报新闻 浏览 12547
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1