关闭广告

Meta团队揭秘大模型"视觉天赋"之谜:文本训练竟能培养看图能力

科技行者2541人阅读


这项由Meta超级智能实验室和牛津大学的韩俊林、汤盛邦、范大卫等研究团队完成的重要研究,发表于2025年1月,论文编号为arXiv:2509.26625v1。有兴趣深入了解的读者可以通过该编号查询完整论文。

近年来,一个令人困惑的现象开始引起科学家们的注意:那些只用文字训练的大型语言模型,竟然在处理图像任务时表现出了惊人的能力。这就好比一个从未见过画笔的人,仅仅通过阅读绘画理论书籍,就能画出精美的作品。这种看似不可能的现象背后究竟隐藏着什么秘密?

Meta的研究团队决定深入探究这个谜题。他们发现,当我们给这些"纯文字出身"的AI模型配上视觉编码器,然后进行少量的多模态训练后,它们就能在各种视觉任务中表现得相当出色。更令人惊讶的是,有些模型甚至在从未"见过"图像的情况下,就能完成某些视觉推理任务。

为了彻底理解这种现象,研究团队设计了一套系统性的实验方案。他们像调配食谱一样,精心调配不同类型的文本数据,训练了超过100个不同规模的模型,消耗了50万GPU小时的计算资源。这项研究的规模之大,就像是在建造一个巨大的实验工厂,专门用来生产各种"口味"的AI模型。

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

新年资金入市!超450亿公募资金到位,“万亿活水”在路上

券商中国 浏览 1706

全新配色 玛莎拉蒂MCPURA定制版官图发布

车质网 浏览 1389

两种容量、最高纯电续航超320公里,极氪8X电池信息揭晓

IT之家 浏览 1702

HuggingFace发布实战指南,从决策到落地手把手教你训练大模型

机器之心Pro 浏览 2051

交警视角解密:腾势N8L如何定义“安全担当”

网易汽车 浏览 1683

“星舰”第11次试飞成功 马斯克兑现承诺让火箭“活着回来”

上游新闻 浏览 2807

王学圻出山,易烊千玺入局,郑保瑞这部统一台湾的大片要火了

娱乐圈笔娱君 浏览 2609

辛芷蕾这部新片被好莱坞大片打懵了

娱乐圈笔娱君 浏览 2369

郑爽新账号遭封禁,晒自拍一个细节被人认出,疑似穿男友衣服出镜

萌神木木 浏览 1669

普京公开重要情报:全国人民都该了解

环球时报新闻 浏览 2422

倪萍又说大实话,感叹李施嬅爱情里像“当妈”

疯说时尚 浏览 2571

被伪装快递盒炸伤女主播:嫌犯称准备16万彩礼想处对象

极目新闻 浏览 5768

40岁邓莎宣布离婚!直言无法改变路行,将告别过去追求新的人生

萌神木木 浏览 1612

就两岸关系 郑丽文、马英九最新表态

新京报政事儿 浏览 7416

一篇搞懂:飞书多维表格、n8n、Dify 等自动化工作流里的 Webhook 到底是个啥

钛媒体APP 浏览 2817

韩总理下达紧急指令:必要时强力应对个别反华集会

环球网资讯 浏览 14579

西班牙足协主席:我们会充分照顾球员利益,俱乐部可以放心

懂球帝 浏览 2570

腾讯集团高级副总裁郭凯天:坚持智能向善,构筑人与AI的信任机制

上游新闻 浏览 2578

Win10用户纷纷转向Linux!Zorin OS称72%新下载来自Windows

快科技 浏览 2721

这些都是普通人适合的穿搭!多穿卫衣和半身裙,舒适又耐看

静儿时尚达人 浏览 2452

香港政务司司长:涉案人员处心积虑犯罪 害死这么多人

南方都市报 浏览 17430
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1