关闭广告

清华联合字节跳动:AI学会用图像思考,让机器像人一样推理世界

科技行者2974人阅读


这项由清华大学和字节跳动Seed联合发起的研究于2026年1月发表,论文编号为arXiv:2601.19834v1,研究团队提出了一个颠覆性观点:让AI通过生成图像来进行推理,就像人类在头脑中构建"心理图像"一样思考问题。这种全新的推理方式可能彻底改变我们对人工智能的认知。

当你试图回想家里客厅的布局,或者想象将一张纸折叠后打孔会形成什么图案时,你的大脑会自动生成各种视觉画面。这些"脑海中的图像"帮助你理解空间关系,预测物理变化,解决复杂问题。而目前的AI系统,包括ChatGPT这样的语言模型,主要依靠文字进行推理,就像一个只会纸上谈兵的理论家,缺乏直观的视觉理解能力。

研究团队发现了一个有趣现象:尽管当前AI在数学和编程等抽象领域表现出色,但在涉及物理世界的空间推理任务上却表现糟糕,甚至连小孩子都能轻松解决的问题都会出错。这就好比一个学富五车的学者,能够背诵大量理论知识,却不知道如何在现实中应用这些知识。

为了解决这个问题,研究团队开发了一种全新的推理模式。传统AI就像一个只能通过语言描述来理解世界的人,而他们的新方法让AI能够"看到"和"想象"画面,在推理

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

大S离世一周年,S Hotel酒店大门被木板封住

素素娱乐 浏览 2881

宏碁正式推出Swift 16 AI旗舰轻薄本,至高酷睿Ultra X9 388H

IT之家 浏览 3266

冲击月销2万?乐道找回闯关“节奏”

网易汽车 浏览 4214

特朗普要求日本停止进口俄罗斯能源 高市早苗当面拒绝

鲁中晨报 浏览 10087

世体:马竞不会轻易放走拉斯帕多里,未来几天罗马将加大攻势

懂球帝 浏览 3386

伊姐周日热推:电视剧《狙击蝴蝶》;电视剧《天书黎明》......

伊周潮流 浏览 3013

火遍全网的这件外套太好穿,我总结了几个实用搭配公式

黎贝卡的异想世界 浏览 3937

华为鸿蒙智行下半场的战略之变

汽车K线 浏览 4616

13.18亿大单!国网信通公告:子公司重大经营合同中标

红星资本局 浏览 3991

推广|| 春天第一双鞋!暴走不累、搭遍好看小裙子

黎贝卡的异想世界 浏览 2385

执法过严?拓王之战首节裁判合计吹罚21次犯规并出现31次罚球

懂球帝 浏览 4320

整车34.98万元/租电24.18万元,蔚来新ES6 30万台纪念版上市

IT之家 浏览 3502

UC圣地亚哥学者巧用树形搜索让AI画画训练快2.4倍

科技行者 浏览 3294

港媒:高市所谓“对话”表态纯属玩文字游戏

参考消息 浏览 8749

终于!短剧向经典IP出手了

艳姐的搞笑视频 浏览 4185

买插混车盯紧这个数!明年可能多花上万元

中新经纬 浏览 4415

纯爽片,真用心,值得被更多人看见!

吐槽电影院 浏览 2501

特斯拉新款Semi电动卡车量产下线 搭载三电机

太平洋汽车 浏览 956

smart精灵#3艺术特别版上市售18.49万

网易汽车 浏览 3049

AI眼镜,大厂第一战

脑极体 浏览 3652

存储芯片成本暴涨230%!iPhone 18高配机型或迎来大幅涨价

华尔街见闻官方 浏览 3165
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1