关闭广告

蚂蚁集团突破性研究:一个视觉"万能钥匙"让AI同时理解和创造图像

科技行者3971人阅读


这项由蚂蚁集团旗下Inclusion AI团队领导的重要研究发表于2025年10月,研究团队包括黄梓源、郑丹丹、邹程等众多研究员。论文题为《Ming-UniVision: Joint Image Understanding and Generation with a Unified Continuous Tokenizer》,感兴趣的读者可以通过arXiv:2510.06590查询完整论文,相关代码和模型已在GitHub、HuggingFace等平台开源。

AI看懂图片和创造图片,原本是两个完全不同的任务,就像一个人既要当翻译官又要当画家。以往的AI系统通常需要分别训练两套完全不同的"大脑"来处理这两种任务。现在,蚂蚁集团的研究团队找到了一种方法,让AI用同一套"视觉语言"既能理解图片内容,又能根据文字描述创造全新的图像。

这个突破性发现的关键在于他们开发

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

媒体:怒批欧洲软弱 结果特朗普自己成"吐槽大会"主角

新京报评论 浏览 20035

韩国峰会临近特朗普频频放风 突然公布一涉华重磅消息

现代小青青慕慕 浏览 7164

抢占日本本土K-car市场 比亚迪Racco亮相

网易汽车 浏览 4155

北大腾讯团队只改一行代码,让AI图像生成效果提升20%!

科技行者 浏览 2965

长安汽车辟谣“取消年终奖”,或发4.3月薪+3000

盖世汽车 浏览 3259

携手华为!横琴基地每年将培养3000名“数智人才”

海外网 浏览 3108

新增AI试穿场,淘宝510答题免单零点已上线

财闻 浏览 962

“内鬼”赶走老板!300多亿中国资产,要被抢了

大猫财经Pro 浏览 4287

王鹤棣凭一己之力整得大家都不舒服了

伊周潮流 浏览 128

净利润暴跌7912%!天域生物亏麻了

包不同 浏览 3801

2026时髦风向:穿出氛围感才高级!

LinkFashion 浏览 3069

量子位「MEET2026智能未来大会」启动!年度榜单征集中

量子位 浏览 4306

曼联6500万签塞门约计划细节曝光!只有20天操作,已讨论个人待遇

罗米的曼联博客 浏览 3555

冲刺第一股,中国最大独立模型厂商的成色、能力与野心

晚点LatePost 浏览 3431

曝奔驰考虑与长城汽车共享南非工厂

盖世汽车 浏览 2344

跟着这些古早变美综艺,真的能学到东西啊

黎贝卡的异想世界 浏览 3041

从2499到3299:Rokid还要收割几次信任?

蓝鲸新闻 浏览 4792

“北溪”爆炸案一嫌疑人被引渡至德国受审

极目新闻 浏览 3682

胜率大降!若特朗普“对等关税”被推翻,市场会如何反应?

华尔街见闻官方 浏览 3823

陶虹与朋友相聚,17岁女儿五官与神态似徐峥

黔乡小姊妹 浏览 3484

米体:伊尔迪兹想加薪,最起码薪水要和乔纳森-戴维接近

懂球帝 浏览 4352
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1