爆点资讯

这项由牛津大学视觉几何组(VGG)团队开展的研究发表于2025年1月，论文编号为arXiv:2601.09499v1。有兴趣深入了解的读者可以通过该编号查询完整论文。

想象一下，当你在看一段视频时，你的大脑能够同时理解画面中物体的三维形状、它们的运动轨迹，以及摄像机的移动。现在，牛津大学的研究人员成功让计算机也具备了这种"立体视觉"能力。他们开发的V-DPM系统能够从一段普通视频中同时重建出场景的3D结构、物体的运动轨迹，甚至摄像机的参数——这就像给机器装上了一双能够"看透"视频背后三维世界的眼睛。

这项技术的突破性在于，它是首个能够在单次处理中完成所有这些任务的系统。以往的方法要么只能处理静态场景，要么需要多个步骤才能分别处理形状和运动。而V-DPM就像一位全能的"视频分析师"，能够一眼看出视频中的所有三维信息。更令人惊叹的是，研究团队巧妙地利用了在静态场景上训练的现有模型VGGT，通过相对少量的动态数据微调，就让它学会了处理复杂的动态场景——这就像让一位擅长画静物的画家，通过少量练习就学会了画动态人像。

这项研究解决了计算机视觉领域一个长期存在的挑战：如何让机器同

牛津VGG团队突破：单一网络实现视频动态3D重建

杨紫新剧邀林...

不敌王楚钦，...

特朗普：达不...

比亚迪宣布涨...

亲善大使！大...

千人冒雪送“...

NASA局长：中国实力令人震撼发展速度堪比SpaceX

A股板块轮动加速基金净值“跑偏”泄露调仓动向

张柏芝与向太的关系彻底崩塌?

中国斡旋泰柬停火后又单独援助柬方鲁比奥作奇怪表态

《求是》杂志特约评论员：改善和稳定房地产市场预期

俄总统新闻秘书：普京愿与特朗普在莫斯科会晤

关键时刻又崩！许利民发布会罕见发怒，却甩锅球员态度与球员能力

大鹏工业：外购标准件采购占比超七成自研的被评奖项目背后现客户

拉夫罗夫联大提议：以中俄为核心在亚洲搞个安全体系

香港科技大学突破AI画图＂作弊＂难题：让机器学会诚实创作

欧洲8国集体反击特朗普英国首相：将与美国政府交涉

美国男子当街被ICE打死执法人员5秒内至少开了10枪

一篇搞懂：飞书多维表格、n8n、Dify 等自动化工作流里的 Webhook 到底是个啥

维斯塔潘：赛车的驾驶感受很糟糕，不指望在周六雨战有明显提升

鸿蒙智行五界亮相大湾区车展尊界S800 Grand Design 典藏大观开启盲订

XREAL 1S AR眼镜发布，全球首搭内容2D→3D自动转换

国投瑞银被起诉背后

媒体：美军武器靠拆零件续命对美国或是一种致命伤

贵州银行：以自身信用承接19亿存款，信托化险突然受宠

绿茵三十载，长春亚泰将于6月6日举办成立30周年主题活动

遇到家境好的领导是什么体验？

西贝的新考题：如何券后留客

国产自主研发喷气式飞行背包进入小批量生产阶段

西部联体育主管被指控未经许可挪用好友资金，给俱乐部修球场