关闭广告

小米研究院推出AI视频理解:让机器像人一样"回看"思考视频内容

科技行者3330人阅读


这项由小米人工智能实验室(MiLM Plus)的李佳泽领导,联合独立研究者以及中国人民大学团队合作完成的研究,发表于2025年11月的计算机视觉领域顶级会议论文中。有兴趣深入了解的读者可以通过论文编号arXiv:2511.13026v1查询完整论文。

当你在看一部长电影时,如果朋友突然问你"刚才那个场景里谁救了谁",你可能会本能地回想刚才看到的画面,重新审视那些关键镜头。现在,研究团队让人工智能也学会了这种"回看思考"的能力。

目前的AI视频理解系统就像一个只能"一遍过"看视频的观众,看完就必须立即给出答案,不能重新检查可能遗漏的重要细节。特别是面对长视频时,这种限制变得更加明显。就好比你被要求看完一部两小时的电影后,不允许回想任何情节就要回答复杂问题一样困难。

研究团队发现了现有AI系统的一个重要缺陷:当这些系统

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

单眼皮、矮个子、微胖,停止焦虑!普通女孩的美丽指南请收好

Yuki女人故事 浏览 2920

轴距3066mm 全新奥迪A6L将于1月15日首发

车质网 浏览 3448

谢娜演唱会庆功宴现场 张杰宠妻 半个娱乐圈齐聚

手工制作阿歼 浏览 1149

站在4000点的十字路口,这六位“固收+”强将值得一看

证券市场周刊 浏览 4218

警惕特朗普TACO交易割韭菜

尺度商业 浏览 4431

杨瀚森NBA生涯季后赛首胜:全场遭弃用躺赢 回主场后能否登场?

醉卧浮生 浏览 1630

仅买10天的哈弗大狗高速上突发变速箱故障 车主后怕

大风新闻 浏览 26810

负债35亿元!扫地机器人巨头宣布破产,被中国代工厂收购;麦当劳回应涨价,网友:谁允许了;我国首批L3级自动驾驶车型进入准入目录

雷峰网 浏览 3746

一千多人牺牲结局,无法改写,但于和伟临刑前一个动作,升华全剧

皮皮电影 浏览 4301

为了挡住豆包,腾讯撒出10亿红包

中国企业家杂志 浏览 3208

U23亚洲杯身价榜:中国第三力压日韩,沙特居首伊朗次席

懂球帝 浏览 3459

演讲遭抗议 以总理下令:"黑"进加沙手机 用扩音器直播发言

红星新闻 浏览 5041

歌手出场费揭秘!薛之谦价格媲美林俊杰,杨丞琳比张韶涵低50万

萌神木木 浏览 3167

中年返贫,一场无声的凌迟

识局 浏览 4254

万科的“至暗时刻”

翠鸟资本 浏览 4331

追觅汽车三款SUV车型外观亮相:星际T08、T08L和D09

IT之家 浏览 3040

6.4万的特斯拉FSD将成为历史!

新车评网 浏览 3394

统帅懒人空调今日上市,Ai人感调节,一键全托管

财视传播 浏览 4444

原厂带升顶/有纯电有增程 福特智趣烈马将上市

网易汽车 浏览 3787

哥伦比亚挫败一起针对军方设施的未遂袭击

国际在线 浏览 4094

美媒补刀:高市早苗挑衅中国 日本承受不起

澎湃新闻 浏览 15490
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1