关闭广告

清华联合字节跳动:AI学会用图像思考,让机器像人一样推理世界

科技行者3186人阅读


这项由清华大学和字节跳动Seed联合发起的研究于2026年1月发表,论文编号为arXiv:2601.19834v1,研究团队提出了一个颠覆性观点:让AI通过生成图像来进行推理,就像人类在头脑中构建"心理图像"一样思考问题。这种全新的推理方式可能彻底改变我们对人工智能的认知。

当你试图回想家里客厅的布局,或者想象将一张纸折叠后打孔会形成什么图案时,你的大脑会自动生成各种视觉画面。这些"脑海中的图像"帮助你理解空间关系,预测物理变化,解决复杂问题。而目前的AI系统,包括ChatGPT这样的语言模型,主要依靠文字进行推理,就像一个只会纸上谈兵的理论家,缺乏直观的视觉理解能力。

研究团队发现了一个有趣现象:尽管当前AI在数学和编程等抽象领域表现出色,但在涉及物理世界的空间推理任务上却表现糟糕,甚至连小孩子都能轻松解决的问题都会出错。这就好比一个学富五车的学者,能够背诵大量理论知识,却不知道如何在现实中应用这些知识。

为了解决这个问题,研究团队开发了一种全新的推理模式。传统AI就像一个只能通过语言描述来理解世界的人,而他们的新方法让AI能够"看到"和"想象"画面,在推理

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

燃油车的“智能”反击!2025广州车展燃油新车盘点

车市红点 浏览 3958

升第三!深圳双杀山西11连胜创队史纪录 王浩然33分生涯新高

醉卧浮生 浏览 1847

"女首相梦"悬了的高市公开支持赖清德 日本亲华派翻脸

梁讯 浏览 8204

给韩国人一点小小的咖啡因震撼

Vista氢商业 浏览 2468

乌在黑海海域击沉一艘俄“影子舰队”油轮

上观新闻 浏览 2957

内维尔:我原本认为曼城状态不够稳定,但看来我大错特错了

懂球帝 浏览 4107

北京78-93天津 球员评价:3人优秀,3人及格,4人低迷

篮球资讯达人 浏览 3217

小S发跨年照纪念大S 对比去年跨年照不止少一个

并不擅长圈粉的铁任 浏览 3487

西安市委书记方红卫任上落马 7月刚表态韩松被查

鲁中晨报 浏览 9548

欧洲航天局:中欧合作“微笑”卫星将于明年 4 月至 5 月发射

IT之家 浏览 4270

宋承炫官宣当爸!“奉子成婚”还是早有规划

今古深日报 浏览 1655

粉色涂装 雷克萨斯Glam LX概念车发布

车质网 浏览 4188

TA:诺丁汉森林不会因对阵曼联存在角球误判向裁判机构上诉

懂球帝 浏览 4345

纯电续航提升 新款小鹏X9纯电版申报图曝光

车质网 浏览 3722

冬季穿搭越简单越好看!衣服不多买、搭配彩色围巾,真的耐看

静儿时尚达人 浏览 3294

气场拉满:泰国改装厂让长城坦克300“变身”Brabus G63

IT之家 浏览 3521

泰它西普治疗干燥综合征中国Ⅲ期临床研究成功入选

豹变 浏览 4944

《一路繁花2》首波口碑,一针见血!

崽下愚乐圈 浏览 4326

国际油价上涨谁会是赢家?外媒:美国石油商“直接受益”,跨国油企希望回归平稳

环球网资讯 浏览 2404

让AI沉下来 北京锻造人工智能第一城

北京商报 浏览 3180

售35.98万元起 第二代腾势D9正式上市

网易汽车 浏览 1377
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1