关闭广告

清华联合字节跳动:AI学会用图像思考,让机器像人一样推理世界

科技行者3180人阅读


这项由清华大学和字节跳动Seed联合发起的研究于2026年1月发表,论文编号为arXiv:2601.19834v1,研究团队提出了一个颠覆性观点:让AI通过生成图像来进行推理,就像人类在头脑中构建"心理图像"一样思考问题。这种全新的推理方式可能彻底改变我们对人工智能的认知。

当你试图回想家里客厅的布局,或者想象将一张纸折叠后打孔会形成什么图案时,你的大脑会自动生成各种视觉画面。这些"脑海中的图像"帮助你理解空间关系,预测物理变化,解决复杂问题。而目前的AI系统,包括ChatGPT这样的语言模型,主要依靠文字进行推理,就像一个只会纸上谈兵的理论家,缺乏直观的视觉理解能力。

研究团队发现了一个有趣现象:尽管当前AI在数学和编程等抽象领域表现出色,但在涉及物理世界的空间推理任务上却表现糟糕,甚至连小孩子都能轻松解决的问题都会出错。这就好比一个学富五车的学者,能够背诵大量理论知识,却不知道如何在现实中应用这些知识。

为了解决这个问题,研究团队开发了一种全新的推理模式。传统AI就像一个只能通过语言描述来理解世界的人,而他们的新方法让AI能够"看到"和"想象"画面,在推理

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

多国接到撤离警告 俄升级对乌报复性打击

环球网资讯 浏览 528

新款小鹏G9申报图曝光 自研图灵芯片上车

网易汽车 浏览 4489

东方甄选人事地震:俞敏洪的意志,新高管的刀

每日人物 浏览 1261

当年霍震霆给儿子霍启刚挑儿媳妇,眼光多毒啊

小光侃娱乐 浏览 3902

A股板块轮动加速 基金净值“跑偏”泄露调仓动向

证券时报 浏览 4973

美国已正式开始出售委内瑞拉石油

新京报 浏览 3426

协助拦截伊朗无人机 乌克兰遭“敲打”

极目新闻 浏览 112675

河南省网络社会组织联合会AI人工智能专业委员会成立

大象新闻 浏览 3650

《红舞鞋》官微删除道歉信,司机还挑衅网友:猫也没人疼戏照样拍

萌神木木 浏览 4386

丹麦国防部:若美国武力夺岛 丹麦士兵可先开枪再请示

环球网资讯 浏览 13737

“不死鸟”上新!丰田Hilux完成换代,造型更硬核,启用纯电动力

闻车品百魅 浏览 2826

32岁章泽天又有新动作!不愿当家庭主妇

娱乐圈圈圆 浏览 3370

以AI治AI 推动智能向善 巨量引擎商业安全开放日在京举办

一点财经 浏览 4341

佩罗内谈2-0尤文:我们已形成胜利心态,相信自己能赢任何球队

懂球帝 浏览 4376

马赛主席在从曼联签下梅森·格林伍德前询问了他的母亲

绿茵情报局 浏览 3227

13.99万元起 深度解读深蓝L06三大黑科技

第五冲程 浏览 4284

邦本宜裕:给自己本赛季表现打100分,本来想完成20个助攻

懂球帝 浏览 4177

台外事部门负责人被指9月曾宴请美官员 美方无人到场

北京日报客户端-长安街知事 浏览 10411

百度发放开工红包:最高可得2026元

三言科技 浏览 2805

马斯切拉诺:我对穆勒的记忆并不美好;希望运气在我们这边

懂球帝 浏览 3726

维权女车主“赢”特斯拉

电动知家 浏览 5156
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1