关闭广告

清华联合字节跳动:AI学会用图像思考,让机器像人一样推理世界

科技行者3330人阅读


这项由清华大学和字节跳动Seed联合发起的研究于2026年1月发表,论文编号为arXiv:2601.19834v1,研究团队提出了一个颠覆性观点:让AI通过生成图像来进行推理,就像人类在头脑中构建"心理图像"一样思考问题。这种全新的推理方式可能彻底改变我们对人工智能的认知。

当你试图回想家里客厅的布局,或者想象将一张纸折叠后打孔会形成什么图案时,你的大脑会自动生成各种视觉画面。这些"脑海中的图像"帮助你理解空间关系,预测物理变化,解决复杂问题。而目前的AI系统,包括ChatGPT这样的语言模型,主要依靠文字进行推理,就像一个只会纸上谈兵的理论家,缺乏直观的视觉理解能力。

研究团队发现了一个有趣现象:尽管当前AI在数学和编程等抽象领域表现出色,但在涉及物理世界的空间推理任务上却表现糟糕,甚至连小孩子都能轻松解决的问题都会出错。这就好比一个学富五车的学者,能够背诵大量理论知识,却不知道如何在现实中应用这些知识。

为了解决这个问题,研究团队开发了一种全新的推理模式。传统AI就像一个只能通过语言描述来理解世界的人,而他们的新方法让AI能够"看到"和"想象"画面,在推理

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

希腊航运巨头28岁女继承人死于虫咬 误诊细节披露

新民周刊 浏览 16697

媒体:国足21年首进亚洲大赛四强 是触底反弹的信号弹

新民晚报 浏览 7668

超34.2万人爆仓,比特币一度跌破10万美元关口

观察者网 浏览 4319

NBA战报:凯尔特人111-107魔术,班凯罗28分

懂球帝 浏览 4154

E句话| 她疑似有新恋情了?

仙女事件簿 浏览 3460

猜你喜欢拿“嘴替”当情绪解药......

时尚COSMO 浏览 3537

高管“换血”,股东内斗落幕!200亿淳厚基金迎国资入主

独角金融 浏览 3539

A股董事被拘!涉嫌违法放贷,早年工行履历被关注

财通社 浏览 4739

口碑王|| 从2020穿到现在,越穿越爱的这件单品回来了

黎贝卡的异想世界 浏览 2755

卡西欧推出《回到未来》40周年联名计算器手表,包装盒形似磁带

IT之家 浏览 4738

哈兰德:我对吕迪格一直很尊重;确实很想念贝林厄姆

懂球帝 浏览 4012

世上没有免费的豆包

光子星球 浏览 1296

短剧要翻拍《新英雄本色》,短剧一哥刘萧旭主演,海报有内味儿

最爱酷影视 浏览 4671

美媒:特朗普声称美将"统治"委 其真实意图逐渐明朗

环球时报国际 浏览 9177

为新能源再投10亿,苹果为何还不造车?

BT财经 浏览 4756

E句话| 他骨灰都被人盗了?

仙女事件簿 浏览 3433

知名女演员邢菲被曝光恋情,更多细节透出

乐悠悠娱乐 浏览 4437

阿信演唱会摔下舞台,相信音乐发声报平安:结束后有专业人员检查

扒虾侃娱 浏览 3819

被张坤抛弃,又一巨头跌懵了!

财经锐眼 浏览 3285

S=更入门?大众速腾S工信部信息曝光

网易汽车 浏览 3609

全智贤风波升级,雪花秘扇时期表现被审判,此前曾多次翻车

扒虾侃娱 浏览 5346
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1