关闭广告

Meta团队揭秘大模型"视觉天赋"之谜:文本训练竟能培养看图能力

科技行者2537人阅读


这项由Meta超级智能实验室和牛津大学的韩俊林、汤盛邦、范大卫等研究团队完成的重要研究,发表于2025年1月,论文编号为arXiv:2509.26625v1。有兴趣深入了解的读者可以通过该编号查询完整论文。

近年来,一个令人困惑的现象开始引起科学家们的注意:那些只用文字训练的大型语言模型,竟然在处理图像任务时表现出了惊人的能力。这就好比一个从未见过画笔的人,仅仅通过阅读绘画理论书籍,就能画出精美的作品。这种看似不可能的现象背后究竟隐藏着什么秘密?

Meta的研究团队决定深入探究这个谜题。他们发现,当我们给这些"纯文字出身"的AI模型配上视觉编码器,然后进行少量的多模态训练后,它们就能在各种视觉任务中表现得相当出色。更令人惊讶的是,有些模型甚至在从未"见过"图像的情况下,就能完成某些视觉推理任务。

为了彻底理解这种现象,研究团队设计了一套系统性的实验方案。他们像调配食谱一样,精心调配不同类型的文本数据,训练了超过100个不同规模的模型,消耗了50万GPU小时的计算资源。这项研究的规模之大,就像是在建造一个巨大的实验工厂,专门用来生产各种"口味"的AI模型。

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

拒绝对涉案做出反省 内塔尼亚胡请求特赦遭强烈抗议

环球网资讯 浏览 2218

微软七月上调Office商业订阅价格,一线员工产品涨幅达33%

华尔街见闻官方 浏览 2172

国防部长董军出席第十二届北京香山论坛并作主旨发言

政知新媒体 浏览 3513

韩国称朝鲜有2吨高浓缩铀 中方回应

北京日报 浏览 3287

马筱梅罕谈大S过去,撕碎S家仅剩的“体面”?

有趣的胡侃 浏览 2474

存储芯片超级周期来袭!江波龙股价两个月涨超200%!超85亿存货在手

时代周报 浏览 2502

当反向过年走红 留在北京的网约车司机"狠狠捡漏"

第一财经资讯 浏览 18000

谢林汉姆:加纳乔非常有天赋,但不确定他能否在蓝军取得成功

懂球帝 浏览 2830

香港科技大学团队发现形式化验证如何让AI推理更聪明

科技行者 浏览 1431

推广|| 用了好几年才推荐,这件单品真的值得投资

黎贝卡的异想世界 浏览 2698

跨年晚会主持人状态曝光!靳梦佳被质疑整容

萌神木木 浏览 1773

周星驰新片被传空降春节档,制作成本3.8亿,票房能否冲击40亿

娱乐圈笔娱君 浏览 1427

杉杉股份易主:任元林接盘,“民营船王”入主锂电材料巨头

征探财经 浏览 2875

伊姐周日热推:电视剧《罚罪2》;电视剧《逍遥》......

伊周潮流 浏览 1461

WLTC纯电续航180km 比亚迪海獭正式亮相

车质网 浏览 2629

耗资3000万,正面对决吴京,我感慨:41岁谢苗终于迈出了这一步

靠谱电影君 浏览 1623

内娱清流!这4位女星从不拍“吻戏”

喜欢历史的阿繁 浏览 3235

9场9球,意甲刷新最低进球纪录?

体坛周报 浏览 2659

中国移动成出海“赋能者”,聚星计划覆盖5000+伙伴

雷科技 浏览 2761

中方回应是否放松稀土出口管制

财联社 浏览 11972

搭载雷神AI电混2.0技术 吉利银河星耀7申报信息发布

网易汽车 浏览 2849
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1