关闭广告

Meta团队揭秘大模型"视觉天赋"之谜:文本训练竟能培养看图能力

科技行者4010人阅读


这项由Meta超级智能实验室和牛津大学的韩俊林、汤盛邦、范大卫等研究团队完成的重要研究,发表于2025年1月,论文编号为arXiv:2509.26625v1。有兴趣深入了解的读者可以通过该编号查询完整论文。

近年来,一个令人困惑的现象开始引起科学家们的注意:那些只用文字训练的大型语言模型,竟然在处理图像任务时表现出了惊人的能力。这就好比一个从未见过画笔的人,仅仅通过阅读绘画理论书籍,就能画出精美的作品。这种看似不可能的现象背后究竟隐藏着什么秘密?

Meta的研究团队决定深入探究这个谜题。他们发现,当我们给这些"纯文字出身"的AI模型配上视觉编码器,然后进行少量的多模态训练后,它们就能在各种视觉任务中表现得相当出色。更令人惊讶的是,有些模型甚至在从未"见过"图像的情况下,就能完成某些视觉推理任务。

为了彻底理解这种现象,研究团队设计了一套系统性的实验方案。他们像调配食谱一样,精心调配不同类型的文本数据,训练了超过100个不同规模的模型,消耗了50万GPU小时的计算资源。这项研究的规模之大,就像是在建造一个巨大的实验工厂,专门用来生产各种"口味"的AI模型。

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

拉姆塞:我的合同被美洲狮终止了,这令我感到意外且失望

懂球帝 浏览 3419

首秀高效表现,马刺榜眼秀哈珀18分钟6中4得9分3助攻,正负值+20

懂球帝 浏览 4302

国企董事长上门殴打他人被行拘3天 本人拒绝回应

大风新闻 浏览 7432

严屹宽老婆41岁生日,婆婆送杜若溪万元大红包

爱八卦的晓请 浏览 3022

广西平果球员:俱乐部没找我们签字,解散都是从网上知道的

懂球帝 浏览 3468

相伴25年,76岁张艺谋尽显沧桑,44岁陈婷仍年轻

星娱叨叨社 浏览 903

大学教授教100个老人用大模型,让AI了解他们真正的困境

每日人物 浏览 3222

尼昂:外界没帮莱奥,他需要帮助

懂球帝 浏览 263

徐正源:无法以全主力出战,又存在伤病,输球很遗憾

懂球帝 浏览 4303

万科A:第三季度净利润亏损160.69亿元

网易财经 浏览 3334

《寒战1994》票房大爆,四位演员被赞,演技才是真正的颜值滤镜

娱乐圈笔娱君 浏览 938

抗日名将孙立人次子已正式向大陆申请 将父亲迁葬故里

环球时报新闻 浏览 16142

宏胜集团法定代表人变更,郑群娣接棒祝丽丹

21世纪经济报道 浏览 4034

柬埔寨拒引渡3名韩国籍"杀猪盘"头目回韩国:就地审判

红星新闻 浏览 9506

购置税新规下的购车选择题,插混车抄底还是等新车?

百姓评车 浏览 4366

新基金业绩大分化

国际金融报 浏览 4099

山西宣布废除烟花爆竹"禁放令" 网友:年味回来了

每日经济新闻 浏览 14649

影像机能爆炸,这是朱一龙最惊艳的电影之一

幕味儿 浏览 3931

美媒评总决赛前十巨星!2.21亿福克斯仅第八 5数据证28岁开始下滑

颜小白的篮球梦 浏览 108

梁小龙一生太精彩!曾被封杀20年,公开承认出轨,还跟周星驰反目

萌神木木 浏览 3092

伊能静再婚11年首晒比基尼照,腰臀曲线引热议

柠檬有娱乐 浏览 2971
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1