关闭广告

Meta团队揭秘大模型"视觉天赋"之谜:文本训练竟能培养看图能力

科技行者4012人阅读


这项由Meta超级智能实验室和牛津大学的韩俊林、汤盛邦、范大卫等研究团队完成的重要研究,发表于2025年1月,论文编号为arXiv:2509.26625v1。有兴趣深入了解的读者可以通过该编号查询完整论文。

近年来,一个令人困惑的现象开始引起科学家们的注意:那些只用文字训练的大型语言模型,竟然在处理图像任务时表现出了惊人的能力。这就好比一个从未见过画笔的人,仅仅通过阅读绘画理论书籍,就能画出精美的作品。这种看似不可能的现象背后究竟隐藏着什么秘密?

Meta的研究团队决定深入探究这个谜题。他们发现,当我们给这些"纯文字出身"的AI模型配上视觉编码器,然后进行少量的多模态训练后,它们就能在各种视觉任务中表现得相当出色。更令人惊讶的是,有些模型甚至在从未"见过"图像的情况下,就能完成某些视觉推理任务。

为了彻底理解这种现象,研究团队设计了一套系统性的实验方案。他们像调配食谱一样,精心调配不同类型的文本数据,训练了超过100个不同规模的模型,消耗了50万GPU小时的计算资源。这项研究的规模之大,就像是在建造一个巨大的实验工厂,专门用来生产各种"口味"的AI模型。

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

死亡人数增至44人!香港大埔火灾背后的宏福苑已42年楼龄

红星新闻 浏览 3794

太突然,宜家中国宣布:关闭7家商场

深蓝财经 浏览 2538

细菌对抗生素的两种生存机制被揭示

财闻 浏览 3227

新一轮价格战?本田:不到17万买冠道,蔚来:“购置税”全免!

少数派报告Report 浏览 2342

已婚已育三年,朴信惠真的老了好多

娱人细品 浏览 3038

广州一变电站迎来全球首发机器人:可全向移动、双臂协作

南方都市报 浏览 3749

你看到的不是奔驰纯电CLA,而是汽车的下一个20年

1号车盟 浏览 3806

"明珠"概念首次落地 荣威M7 DMH上市限时8.58万起

网易汽车 浏览 4918

经纪人:公平地对待库明加 考虑当下就给球员选项 考虑未来就加钱

直播吧 浏览 5015

安徽小伙辍学卖馒头,今年已赚13亿

创业家 浏览 3358

国安部:有间谍入住海景民宿偷拍军港 被老板识破

央视新闻客户端 浏览 4395

成龙称以前对儿子太严格了 现在只希望平安开心

韩小娱 浏览 3425

被指拒动用冻结俄资产援乌系因不想得罪美国 日本否认

环球时报国际 浏览 8309

半个娱乐圈为肖战包场,《得闲谨制》票房走俏,侯鸿亮鞠躬致谢

娱乐圈笔娱君 浏览 3622

票房从13.65亿跌到1730万,我五味杂陈:这块金字招牌算是砸了

靠谱电影君 浏览 4099

黄金白银暴跌,让媒体都想不出标题了

深蓝财经 浏览 2934

尤文旧将阿莫鲁索:不能让伊尔迪兹独自承担赢球责任

懂球帝 浏览 4762

特朗普行政令降低大麻管制等级,投资者“卖事实”,大麻股普跌

华尔街见闻官方 浏览 3485

苏亚雷斯:有信心率领亚泰保级

体坛周报 浏览 4231

郑丽文就任国民党主席 曾喊"让台湾人自豪说是中国人"

环球时报新闻 浏览 15077

特朗普:达不成协议 哈马斯将遭“彻底消灭”

环球时报新闻 浏览 4184
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1