关闭广告

斯坦福突破:机器人实现视频动作到真实操作迁移

科技行者3483人阅读


当我们人类想学一项新技能时,最常见的方法就是看别人怎么做——看视频教程、观察师傅操作,然后模仿着练习。斯坦福大学的研究团队在2024年12月发表的一项研究中,成功地让机器人也掌握了这种"看视频学本领"的能力。这项名为"Dream2Flow"的研究由斯坦福大学的Karthik Dharmarajan、Wenlong Huang、Jiajun Wu、Li Fei-Fei和Ruohan Zhang等学者联合完成,论文编号为arXiv:2512.24766v1。

这个研究解决了一个令人头疼的问题:如何让机器人理解并执行那些看似简单的日常任务。比如说,当你告诉机器人"把面包放进碗里"时,它需要理解什么是面包、什么是碗,更重要的是要知道怎样抓取、移动和放置这些物品。传统的方法需要程序员为每个动作写出详细的指令,就像给机器人编写一本超级详细的操作手册。但现实世界太复杂了,物品的形状、位置、重量都千变万化,写不完的手册根本无法涵盖所有情况。

研究团队想到了一个巧妙的办法:既然现在的AI视频生成技术已经能够根据文字描述生成非常逼真的视频,那何不让机器人先"看"一段展示如何完成任务的视频,然后从中学习物体应该如何移动?这就好比你

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

或45万元起售 岚图泰山将11月18日上市

网易汽车 浏览 4040

单眼皮、矮个子、微胖,停止焦虑!普通女孩的美丽指南请收好

Yuki女人故事 浏览 2921

响应“人工智能+”国家行动,方舟健客(06086)“杏捷大模型”通过国家备案,为AI+慢病管理注入新动能

智通财经 浏览 4105

天马推出高端 OLED 技术品牌“天马天工屏”

IT之家 浏览 5171

江一燕官宣离婚后首发声

扒虾侃娱 浏览 4264

世体:拉菲尼亚将坐在替补席额外座位上,为球队提供支持

懂球帝 浏览 4315

苹果彻查iPhone 17 Pro褪色:问题机型已被回收

快科技 浏览 4345

美业数字化再添新助力 成都美博会AI美业工具受追捧丨新经济观察

封面新闻 浏览 4382

警方通报小米成都车祸: 驾驶员涉嫌酒后驾驶

网易汽车 浏览 4536

程强:市场延续回暖走势

首席经济学家论坛 浏览 3574

中科院突破:AI实现持续学习不忘旧知

科技行者 浏览 4434

3岁童喝珍珠奶茶蹦床时不幸窒息身亡 家长发声欲追责

大风新闻 浏览 10272

女子98万买新房交付前感觉被坑了:设计师都"惊呆"了

1818黄金眼 浏览 16212

售出39000台 小米汽车公布2026年1月销量

网易汽车 浏览 3207

极氪8X车型最新谍照曝光,展示尾灯造型

IT之家 浏览 3588

中央批准 开除姜德果、唐德智党籍

北京日报客户端-长安街知事 浏览 43577

龙芯加速自研显卡进度:性能对标AMD RX550的9A1000将回片开始测试

快科技 浏览 499

对话比亚迪路天:王朝的真正对手 是"未来的自己"

网易汽车 浏览 4044

美客机万米高空风挡玻璃破裂 资深机长:或为陨石撞击

红星新闻 浏览 9112

财经观察:担忧产业短板,欧盟自查“经济瓶颈”

环球网资讯 浏览 4475

“格子衬衫”浓度降低 7年云栖感知科技的温度丨去现场 做原创

封面新闻 浏览 4192
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1