关闭广告

Meta团队揭秘大模型"视觉天赋"之谜:文本训练竟能培养看图能力

科技行者4367人阅读


这项由Meta超级智能实验室和牛津大学的韩俊林、汤盛邦、范大卫等研究团队完成的重要研究,发表于2025年1月,论文编号为arXiv:2509.26625v1。有兴趣深入了解的读者可以通过该编号查询完整论文。

近年来,一个令人困惑的现象开始引起科学家们的注意:那些只用文字训练的大型语言模型,竟然在处理图像任务时表现出了惊人的能力。这就好比一个从未见过画笔的人,仅仅通过阅读绘画理论书籍,就能画出精美的作品。这种看似不可能的现象背后究竟隐藏着什么秘密?

Meta的研究团队决定深入探究这个谜题。他们发现,当我们给这些"纯文字出身"的AI模型配上视觉编码器,然后进行少量的多模态训练后,它们就能在各种视觉任务中表现得相当出色。更令人惊讶的是,有些模型甚至在从未"见过"图像的情况下,就能完成某些视觉推理任务。

为了彻底理解这种现象,研究团队设计了一套系统性的实验方案。他们像调配食谱一样,精心调配不同类型的文本数据,训练了超过100个不同规模的模型,消耗了50万GPU小时的计算资源。这项研究的规模之大,就像是在建造一个巨大的实验工厂,专门用来生产各种"口味"的AI模型。

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

被问与特朗普关系是否已"破裂" 斯塔默回应

环球网资讯 浏览 60409

古巴称特朗普发出“明确且直接的军事侵略威胁”

上观新闻 浏览 1382

雅达利复刻“前竞争对手”Mattel Intellivision Sprint 游戏机

IT之家 浏览 4497

购置税从“免征”到“减半”,新能源车企将迎来一场考验!

百姓评车 浏览 4690

勇士124-106轻取鹈鹕,库里11中2仅9分,穆迪8记三分

懂球帝 浏览 4312

城区油耗2L级 长安逸动/CS75 PLUS蓝鲸超擎抢订价7.99万起

网易汽车 浏览 1579

今年秋冬最流行的外套竟然是它?谁穿谁时髦!

LinkFashion 浏览 3805

大湾区晚会收视出炉!小沈阳父女拿下最高点,王源和时团联手赶客

萌神木木 浏览 5124

特朗普与泽连斯基再会面详情公开 见面就夸后者时尚

新京报政事儿 浏览 9981

俄大幅加税中国汽车出口骤降58% 有商家暂停对俄业务

每日经济新闻 浏览 8643

申花2-0首尔获亚冠首胜!终结对韩国球队4场不胜 阿苏埃破僵+伤退

我爱英超 浏览 4605

上海U20男足进全运8强,徐根宝:出线是第一位,成绩是硬道理

懂球帝 浏览 4451

恒瑞前董事长周云曙履新先声药业,曾在恒瑞工作超25年

YOUNG财经 浏览 3649

传祺向往系列的“降价术”:低配车型弱化华为标签启用Momenta智驾

经济观察报 浏览 4651

为什么最好全款买蔚来ES8,也不要贷款分期买?套路实在太多了

大志聊车 浏览 3622

再见了沈腾,再见了贾玲,再见了沙溢!活得好好的已经被大家怀念

阿雹娱乐 浏览 3650

杨曙光委员:国产科学仪器“突围战”,上海如何打造“科技之眼”?

上观新闻 浏览 3415

普京穿军装看俄白军演:试戴热成像战术眼镜 装填手枪

新京报 浏览 4046

裤子+靴子:今年冬天最经典搭配,松弛又时髦!

LinkFashion 浏览 3316

一斤豆芽28.8元,杨国福的天价麻辣烫到底卖给谁?

江瀚视野 浏览 4343

特朗普:我说服了自己暂缓对伊朗采取军事行动

澎湃新闻 浏览 3493
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1