关闭广告

清华联合字节跳动:AI学会用图像思考,让机器像人一样推理世界

科技行者3183人阅读


这项由清华大学和字节跳动Seed联合发起的研究于2026年1月发表,论文编号为arXiv:2601.19834v1,研究团队提出了一个颠覆性观点:让AI通过生成图像来进行推理,就像人类在头脑中构建"心理图像"一样思考问题。这种全新的推理方式可能彻底改变我们对人工智能的认知。

当你试图回想家里客厅的布局,或者想象将一张纸折叠后打孔会形成什么图案时,你的大脑会自动生成各种视觉画面。这些"脑海中的图像"帮助你理解空间关系,预测物理变化,解决复杂问题。而目前的AI系统,包括ChatGPT这样的语言模型,主要依靠文字进行推理,就像一个只会纸上谈兵的理论家,缺乏直观的视觉理解能力。

研究团队发现了一个有趣现象:尽管当前AI在数学和编程等抽象领域表现出色,但在涉及物理世界的空间推理任务上却表现糟糕,甚至连小孩子都能轻松解决的问题都会出错。这就好比一个学富五车的学者,能够背诵大量理论知识,却不知道如何在现实中应用这些知识。

为了解决这个问题,研究团队开发了一种全新的推理模式。传统AI就像一个只能通过语言描述来理解世界的人,而他们的新方法让AI能够"看到"和"想象"画面,在推理

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

委内瑞拉外长会见美外交使团团长

环球网资讯 浏览 3185

四冠王!南外毕业生所在战队问鼎RoboMaster2025全国总冠军

现代快报 浏览 5322

上市公司购买6000万私募产品“爆雷”

诗与星空 浏览 3424

奇瑞的2025年,一场教科书级的“协同战”

车评社Auto 浏览 3564

超300倍就清零!超高位科技股突然暴跌,中芯国际重挫7%

深蓝财经 浏览 4504

“这顶帽子”太火了,今年流行的风格都离不开它

LinkFashion 浏览 3231

北约建"无人机墙"彻底激怒俄罗斯 俄方强硬回应

上观新闻 浏览 41469

BaaS方案售20.8万起 蔚来ET5/ET5T远空套装版上市

网易汽车 浏览 3765

“9系”旗舰+1 上汽大众的战略反攻

网易汽车 浏览 3382

预测票房26亿!除了中文配音拉胯,《疯狂动物城2》没任何毛病

最爱酷影视 浏览 4032

小鹏汇天“陆地航母”于迪拜完成公开飞行演示

网易汽车 浏览 4515

“单亲妈妈”叶珂哄娃引热议 网友:黄晓明不管么

韩小娱 浏览 3853

"30年老公厕"被改成咖啡店后又遭封 当地城管部门回应

封面新闻 浏览 13036

外媒:克宫称普京愿与马克龙就俄乌冲突对话

环球网资讯 浏览 3553

岚图卢放:打破百年成见 重构豪华轿车价值标准

网易汽车 浏览 3679

奔驰今年大动作: 推15款新车 智驾覆盖全系

网易汽车 浏览 3326

李想评豆包手机为现象级AI产品 努比亚回应:带来自动驾驶式体验升级

快科技 浏览 3092

估值3.5亿的廊坊银行股权被拍卖偿债,持股人刚被法院悬赏

湘财Plus 浏览 3265

S家洗白失败!韩国综艺锤了小S忽视姐姐病情,推卸责任甩锅给大S

萌神木木 浏览 3210

马克龙不加入和平委员会 特朗普:加征关税他就会加入

界面新闻 浏览 12689

阿里正在开发开发最新AI编程工具「秒悟Meoo」

三言科技 浏览 2411
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1