关闭广告

蚂蚁集团突破性研究:一个视觉"万能钥匙"让AI同时理解和创造图像

科技行者2534人阅读


这项由蚂蚁集团旗下Inclusion AI团队领导的重要研究发表于2025年10月,研究团队包括黄梓源、郑丹丹、邹程等众多研究员。论文题为《Ming-UniVision: Joint Image Understanding and Generation with a Unified Continuous Tokenizer》,感兴趣的读者可以通过arXiv:2510.06590查询完整论文,相关代码和模型已在GitHub、HuggingFace等平台开源。

AI看懂图片和创造图片,原本是两个完全不同的任务,就像一个人既要当翻译官又要当画家。以往的AI系统通常需要分别训练两套完全不同的"大脑"来处理这两种任务。现在,蚂蚁集团的研究团队找到了一种方法,让AI用同一套"视觉语言"既能理解图片内容,又能根据文字描述创造全新的图像。

这个突破性发现的关键在于他们开发

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

都体:国米想租佛罗伦萨翼卫多多,愿意送出德弗赖或阿斯拉尼

懂球帝 浏览 1644

特朗普连绵不绝的骚操作高到了大气层!

宋鸿兵 浏览 2624

湖人想要维金斯补充侧翼防守 八村垒+1个首轮签热火能同意吗?

仰卧撑FTUer 浏览 1964

从“养儿防老”到攒私房钱,农村老人的想法变了

观察者网 浏览 1018

史上首次!微软官宣Windows 26H1版本:已推出测试版

快科技 浏览 2367

特朗普为何在最后时刻缩水降级“加冕典礼”?

浏览 24573

控股股东拟出让超1亿股!川股德龙汇能筹划控制权变更 今年股价涨幅近60%

红星资本局 浏览 2758

磐霖资本迎来收获季:连投6轮的明星企业上市了

投中网 浏览 1651

媒体:美以对伊朗战争持续不了太久 G7成员们也受不了

新民周刊 浏览 27312

黄仁勋,亲赴台积电“要产能”

华尔街见闻官方 浏览 2521

莱万特3-0大胜塞维利亚,卡洛斯-阿尔瓦雷斯、卡洛斯-埃斯皮破门

懂球帝 浏览 1697

23岁硕士徒步因高反去世 刚出现症状时没有听劝下撤

红星新闻 浏览 7435

银行批量直售房产 价格从几万元到几亿元不等

经济观察报 浏览 8856

布翁焦尔诺谈主场欧冠首秀:听见欧冠主题曲时我感到无比激动

懂球帝 浏览 2471

广东98-89天津2喜2忧!胡明轩拾巅峰状态,焦泊乔受伤,内线被虐

篮球资讯达人 浏览 1540

俄最新核潜艇下水 可搭载“末日鱼雷”

环球网资讯 浏览 2578

斯图里奇:阿森纳踢得非常老练,他们传球精准&决策出色

懂球帝 浏览 1979

纯度更高的致敬 尚界Z7预告图发布

网易汽车 浏览 1646

纯电移动"游戏机" 索尼本田合资AFEELA 1亮相CES

网易汽车 浏览 1689

罗马诺:鲍勃转会富勒姆谈判进最后阶段,曼城坚持要3500万镑

懂球帝 浏览 1560

极致轻量化 兰博基尼Temerario全新赛车发布

车质网 浏览 2476
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1