关闭广告

上海AI实验室团队首创视频驱动交互网页重建基准

科技行者2601人阅读


这项由上海AI实验室、浙江大学、中国科学技术大学深圳分校等机构联合完成的突破性研究发表于2025年9月,论文编号为arXiv:2509.24709。研究团队包括陈阳、刘明浩、沈雨帆等多位来自不同院校的研究者,项目由上海AI实验室的沈雨帆教授领导。有兴趣深入了解的读者可以通过该论文编号查询完整论文内容。

当我们浏览网页时,看到精美的界面、流畅的动画效果和各种交互功能,很少有人会想到这背后需要大量的代码来支撑。传统上,要让AI学会制作网页,研究者们通常只给它看静态的截图,然后让它生成对应的代码。这就像让一个人仅凭一张照片就要画出整幅画作一样,缺少了很多重要信息。

然而,真实的网页远比静态截图复杂得多。当用户点击按钮时页面会发生变化,当鼠标悬停在某个区域时会出现新的内容,当用户填写表单时系统会给出相应反馈。这些动态的交互过程包含了网页运作的核心逻辑,但在传统的AI训练方法中却被完全忽略了。

正是在这样的背景下,研究团队提出了一个革命性的想法:为什么不让AI观看完整的用户操作视频,就像人类学习使用软件一样,通过观察整个交互过程来理解网页的工作原理呢?

阅读全文
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

特朗普按下葫芦亲自去浮瓢:巴以未了结 俄乌又点炮

新民晚报 浏览 6205

售17.98万起 方程豹钛7首周上险量为1257台

网易汽车 浏览 3436

澳大利亚女足近3次亚洲杯半决赛保持不败,共6次参赛4次晋级

懂球帝 浏览 529

业主私挖300平地下室 同楼住户:家里没一面墙是完整的

新民周刊 浏览 7855

iQOO 15 / Neo11 手机全版本标配 2K 屏,自带 AR 增透消反保护膜

IT之家 浏览 2777

长安林肯航海家燃油 SUV 新增“启航版”上市,24.59 万元

IT之家 浏览 3257

克林顿与爱泼斯坦案受害者共浴照片披露:坐在浴缸里

扬子晚报 浏览 1984

看AI变身游戏达人:莫斯科研究院开发超快视觉智能测试平台KAGE

科技行者 浏览 1599

普京会见伊朗最高领袖顾问:正密切关注伊朗局势

上观新闻 浏览 1359

同游仍少年!精灵世界空降杭州

时尚COSMO 浏览 2219

国民党"内讧"郑丽文开会不邀卢秀燕 党内炸锅大佬现身

博览历史 浏览 8549

吴千语施伯雄逛街被偶遇,勾肩同行 有说有笑

扒虾侃娱 浏览 2586

台媒曝具俊晔放弃大S遗产,转入孩子名下

萌神木木 浏览 1487

深夜,全线崩跌!发生了什么?

券商中国 浏览 2174

俄白联合军演两名美军军官"意外现身" 白俄防长:可随意参观

环球网资讯 浏览 3491

哥伦比亚挫败一起针对军方设施的未遂袭击

国际在线 浏览 2399

"商务部公告附件首次改为wps格式"不实 至少5年前已用

极目新闻 浏览 7004

纳帅:特尔施特根是否在豪门不是关键,重要的是他要上场比赛

懂球帝 浏览 2373

羽绒服+阔腿裤:今年冬天最火搭配,松弛又时髦!

LinkFashion 浏览 1642

韩星张元英辱华发酵!相关代言遭抵制品牌方回应,本人持续装糊涂

萌神木木 浏览 1463

数据不会说谎!《向往8》收视0.3

手工制作阿歼 浏览 2368
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1