关闭广告

Meta团队揭秘大模型"视觉天赋"之谜:文本训练竟能培养看图能力

科技行者795人阅读


这项由Meta超级智能实验室和牛津大学的韩俊林、汤盛邦、范大卫等研究团队完成的重要研究,发表于2025年1月,论文编号为arXiv:2509.26625v1。有兴趣深入了解的读者可以通过该编号查询完整论文。

近年来,一个令人困惑的现象开始引起科学家们的注意:那些只用文字训练的大型语言模型,竟然在处理图像任务时表现出了惊人的能力。这就好比一个从未见过画笔的人,仅仅通过阅读绘画理论书籍,就能画出精美的作品。这种看似不可能的现象背后究竟隐藏着什么秘密?

Meta的研究团队决定深入探究这个谜题。他们发现,当我们给这些"纯文字出身"的AI模型配上视觉编码器,然后进行少量的多模态训练后,它们就能在各种视觉任务中表现得相当出色。更令人惊讶的是,有些模型甚至在从未"见过"图像的情况下,就能完成某些视觉推理任务。

为了彻底理解这种现象,研究团队设计了一套系统性的实验方案。他们像调配食谱一样,精心调配不同类型的文本数据,训练了超过100个不同规模的模型,消耗了50万GPU小时的计算资源。这项研究的规模之大,就像是在建造一个巨大的实验工厂,专门用来生产各种"口味"的AI模型。

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

媒体:俄导弹炸毁北约驻基辅情报大楼为假

澎湃新闻 浏览 14850

泰国与中国完成潜艇采购谈判,后面或还有

浏览 11101

殷世航快手账号被封禁,快手:平台接到用户23万条举报信

趣看热点 浏览 25977

媒体:美军犯致命错误 误把敌机当成自家的致重大伤亡

环球时报新闻 浏览 78024

展开激战!击落战机!苏丹多地武装冲突升级

环球网资讯 浏览 15833

陈赫庆生照里看不到鹿晗?

韩小娱 浏览 650

生涯拿下107次三双时年纪:约基奇28岁 威少30岁 詹姆斯38岁

直播吧 浏览 13415

英国安德鲁王子放弃王室头衔 被指与未成年人发生关系

CCTV国际时讯 浏览 6930

理想L9新车被曝提车不到一周方向盘失灵,理想:会和用户沟通

Tech星球 浏览 19299

福奇称美国人或需戴口罩至2022年,未来疫情形势依旧难以预测

趣看热点 浏览 122834

媒体:战火烧向俄罗斯边境 释放危险信号

北京日报客户端 浏览 19281

看大疆做全景相机,不要只看两份报告

连线Insight 浏览 628

媒体:急于获取支持 特朗普又开始"画大饼"了

澎湃新闻 浏览 5979

全球首创!西安造创新医疗器械获批上市

上游新闻 浏览 1007

男子"机闹"后航班取消 同机旅客准备集体起诉东航

红星新闻 浏览 75083

提高平台透明度!马斯克宣布下周推特算法开源

网易科技报道 浏览 19536

董宇辉带货华为一夜卖了上亿

全天候科技 浏览 11397

周销量出炉后,理想、特斯拉接连降价,新一轮价格战已经爆发?

车市红点 浏览 12624

多纳鲁马:曼奇尼和巴洛特利都推荐我来,他们让我更坚定选择

懂球帝 浏览 722

11月豪华品牌 :旧王朝坚如磐石 新秩序仍需时间发酵 |汽势焦点

汽势传媒 浏览 13003

8月24日,世界干了一件大事!

牛弹琴 浏览 14695
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1