关闭广告

清华联合字节跳动:AI学会用图像思考,让机器像人一样推理世界

科技行者1534人阅读


这项由清华大学和字节跳动Seed联合发起的研究于2026年1月发表,论文编号为arXiv:2601.19834v1,研究团队提出了一个颠覆性观点:让AI通过生成图像来进行推理,就像人类在头脑中构建"心理图像"一样思考问题。这种全新的推理方式可能彻底改变我们对人工智能的认知。

当你试图回想家里客厅的布局,或者想象将一张纸折叠后打孔会形成什么图案时,你的大脑会自动生成各种视觉画面。这些"脑海中的图像"帮助你理解空间关系,预测物理变化,解决复杂问题。而目前的AI系统,包括ChatGPT这样的语言模型,主要依靠文字进行推理,就像一个只会纸上谈兵的理论家,缺乏直观的视觉理解能力。

研究团队发现了一个有趣现象:尽管当前AI在数学和编程等抽象领域表现出色,但在涉及物理世界的空间推理任务上却表现糟糕,甚至连小孩子都能轻松解决的问题都会出错。这就好比一个学富五车的学者,能够背诵大量理论知识,却不知道如何在现实中应用这些知识。

为了解决这个问题,研究团队开发了一种全新的推理模式。传统AI就像一个只能通过语言描述来理解世界的人,而他们的新方法让AI能够"看到"和"想象"画面,在推理

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

52岁男星赔了3.8亿!沉迷炒币不愿脱身,网友直言很难有好下场

萌神木木 浏览 2648

牛弹琴:美印突然和好 一个与俄方有关的细节很不寻常

现代快报 浏览 4957

给过去十年最好的10部“历史剧”排名:《太平年》第7,第1无争议

皮皮电影 浏览 1372

怒放竞技场3V3街头足球赛玉溪站落幕,奥斯卡、约尼查助阵

懂球帝 浏览 2565

联合国秘书长呼吁抓住机遇 结束加沙冲突

国际在线 浏览 2781

杨紫连续七年为李现庆生,没有避嫌只有坦荡

娱乐寡姐 浏览 2818

小鹏汽车2025年全年交付量达429,445台 同比增长126%

网易汽车 浏览 1842

王健林和王思聪同一天上热搜!都是因为欠钱,父子被执行超52亿…

火山诗话 浏览 3344

伊朗:摧毁近10部美国先进雷达

极目新闻 浏览 653

NeurIPS 2025放榜:阿里Qwen门控注意力获最佳论文

量子位 浏览 2243

"网红罗大美遇害案"新进展:三名被告人均提出上诉

扬子晚报 浏览 8957

首发权益价5.98万起 星光560动力及安全信息发布

网易汽车 浏览 1945

曝娜扎被抢休息室,刘亦菲聊天监听,后台大瓜!

萌神木木 浏览 2328

在EasyClaw上,我轻松养出了自己的AI“龙虾”

光子星球 浏览 700

官方:田玉达加盟辽宁铁人

懂球帝 浏览 1500

辛芷蕾飞升独一档,85花格局变了!

Yuki女人故事 浏览 3634

阿特金森帅位岌岌可危!上季当选年度最佳教练 曾获骑士老板力挺

罗说NBA 浏览 2012

特朗普签署2026财年国防授权法案

财联社 浏览 1967

AWS推出AI图像编辑新突破:用说话就能精准移动图片中的物体!

科技行者 浏览 1698

硅谷投资人盛赞特斯拉人形机器人:将令人忘掉特斯拉造过车

澎湃新闻 浏览 1678

主打家用泛越野 哈弗大狗PLUS售13.58万起

网易汽车 浏览 3507
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1