爆点资讯

这项由Meta超级智能实验室和牛津大学的韩俊林、汤盛邦、范大卫等研究团队完成的重要研究，发表于2025年1月，论文编号为arXiv:2509.26625v1。有兴趣深入了解的读者可以通过该编号查询完整论文。

近年来，一个令人困惑的现象开始引起科学家们的注意：那些只用文字训练的大型语言模型，竟然在处理图像任务时表现出了惊人的能力。这就好比一个从未见过画笔的人，仅仅通过阅读绘画理论书籍，就能画出精美的作品。这种看似不可能的现象背后究竟隐藏着什么秘密？

Meta的研究团队决定深入探究这个谜题。他们发现，当我们给这些"纯文字出身"的AI模型配上视觉编码器，然后进行少量的多模态训练后，它们就能在各种视觉任务中表现得相当出色。更令人惊讶的是，有些模型甚至在从未"见过"图像的情况下，就能完成某些视觉推理任务。

为了彻底理解这种现象，研究团队设计了一套系统性的实验方案。他们像调配食谱一样，精心调配不同类型的文本数据，训练了超过100个不同规模的模型，消耗了50万GPU小时的计算资源。这项研究的规模之大，就像是在建造一个巨大的实验工厂，专门用来生产各种"口味"的AI模型。

Meta团队揭秘大模型＂视觉天赋＂之谜：文本训练竟能培养看图能力

特斯拉撞树后...

今年电动汽车...

这个赛季，N...

从百亿到两百...

推广中奖名单...

朱媛媛离世7...

刘晓庆回应年龄追问：关你们什么事

一加 15 真机曝光，设计风格延续一加 13T

所以《All Her Fault》，其实都是“他的错”？

背靠OpenAI的机器人初创1X亮相CES展示家务机器人，售价2万美元

今年冬天最流行的4双鞋，配阔腿裤时髦又高级！

美国宣布针对伊朗实施新一轮制裁

普京批准俄罗斯与古巴军事合作协议

阿里腾讯一起投！理想前高管组团做机器人，半年融了20亿

巴尔韦德：皇马有我信任的理疗师，我都听他的

紫牛头条｜小伙用激光把南京夫子庙扫描做成3D游戏 1：1还原精度到厘米，网友：可以赛博旅游了

曾负债超200亿，创始人已跑路！这家新势力官宣复活，即将发新车

NBA战报：猛龙110-99骑士取NBA8连胜，英格拉姆37+7+2

五角大楼摊牌：解放军有巨大优势美军已经被远远甩开

B席致敬瓜帅：永远都是我的足球之父，史上最佳主帅

快手“沦陷”之夜：1.7万僵尸账号

马杜罗纽约＂首秀＂神态轻松比＂V字剪刀手＂遭多方解读

专家:美对华贸易姿态是战略性失败不再掌握全球霸权

哈格里夫斯：枪手拥有英超最顶级的四名边卫，其中廷贝尔最强

马杜罗不认罪称＂被绑架＂＂仍是总统＂外交部回应

官方：狼堡签下20岁日本中场盐贝健人；据悉转会费900万欧

网友称小区1楼4户业主联合私挖地下室官方回应

频曝食安问题、高管IPO前套现1.3亿！鸣鸣很忙上市太急？

多名美高官将参与监督在委事务特朗普：最终由我负责

小鹏汽车2025年交付超42万台：大增126% 创历史新高