关闭广告

上海AI实验室团队首创视频驱动交互网页重建基准

科技行者4436人阅读


这项由上海AI实验室、浙江大学、中国科学技术大学深圳分校等机构联合完成的突破性研究发表于2025年9月,论文编号为arXiv:2509.24709。研究团队包括陈阳、刘明浩、沈雨帆等多位来自不同院校的研究者,项目由上海AI实验室的沈雨帆教授领导。有兴趣深入了解的读者可以通过该论文编号查询完整论文内容。

当我们浏览网页时,看到精美的界面、流畅的动画效果和各种交互功能,很少有人会想到这背后需要大量的代码来支撑。传统上,要让AI学会制作网页,研究者们通常只给它看静态的截图,然后让它生成对应的代码。这就像让一个人仅凭一张照片就要画出整幅画作一样,缺少了很多重要信息。

然而,真实的网页远比静态截图复杂得多。当用户点击按钮时页面会发生变化,当鼠标悬停在某个区域时会出现新的内容,当用户填写表单时系统会给出相应反馈。这些动态的交互过程包含了网页运作的核心逻辑,但在传统的AI训练方法中却被完全忽略了。

正是在这样的背景下,研究团队提出了一个革命性的想法:为什么不让AI观看完整的用户操作视频,就像人类学习使用软件一样,通过观察整个交互过程来理解网页的工作原理呢?

阅读全文
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

注射后48小时有知觉,6人重新行走!巴西科学家破解脊髓损伤难题

DeepTech深科技 浏览 3234

特朗普宣布对欧洲八国加征关税 外交部回应

财联社 浏览 8014

莲花控股:算力狂想,股价跌停

斑马消费 浏览 720

碰瓷营销还是真有实力 创维汽车的“生存者游戏”

网易汽车 浏览 2524

量产版明年上市 AUDI E SUV概念车亮相

车质网 浏览 4217

美锁定伊朗打击新目标 考虑重启名为"大锤"的军事行动

上观新闻 浏览 22828

马力破千匹 宝马纯电M3官方谍照发布

车质网 浏览 3462

口袋 AI 设备 Rabbit R1 更新,引入全新堆栈式卡片界面

IT之家 浏览 5338

弗里克:来巴萨后我变了,我也不希望孙子看到爷爷是这样的

懂球帝 浏览 4404

最近最火的,是这只狼?

仙女事件簿 浏览 3453

蓝军太难黑猫太黑!切尔西一周内两张脸

体坛周报 浏览 4529

同比大涨 奕派科技2026年1月销量突破2.1万辆

网易汽车 浏览 3314

丝巾的10种系法,爱美的女人必看

LinkFashion 浏览 1612

特朗普回绝伊朗新方案

界面新闻 浏览 1276

帧帧美若油画,库布里克大神杰作告别放映!

幕味儿 浏览 3490

周杰的负面标签到底哪些是真的?

说历史的老牢 浏览 4083

今年秋冬最时髦的穿法:外套+连帽卫衣,减龄又松弛!

LinkFashion 浏览 3631

2025年,他们集齐了十二枚臂章

我们的太空 浏览 2934

Beats苹果iPhone 17e专用保护壳发售,399元

IT之家 浏览 2772

林永健批顶流进组带编剧乱改戏,网友总结合作演员,成毅被质疑

萌神木木 浏览 4692

长安汽车2026Q1财报:营收327亿元 海外销量大增

网易汽车 浏览 1564
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1