关闭广告

上海AI实验室团队首创视频驱动交互网页重建基准

科技行者4275人阅读


这项由上海AI实验室、浙江大学、中国科学技术大学深圳分校等机构联合完成的突破性研究发表于2025年9月,论文编号为arXiv:2509.24709。研究团队包括陈阳、刘明浩、沈雨帆等多位来自不同院校的研究者,项目由上海AI实验室的沈雨帆教授领导。有兴趣深入了解的读者可以通过该论文编号查询完整论文内容。

当我们浏览网页时,看到精美的界面、流畅的动画效果和各种交互功能,很少有人会想到这背后需要大量的代码来支撑。传统上,要让AI学会制作网页,研究者们通常只给它看静态的截图,然后让它生成对应的代码。这就像让一个人仅凭一张照片就要画出整幅画作一样,缺少了很多重要信息。

然而,真实的网页远比静态截图复杂得多。当用户点击按钮时页面会发生变化,当鼠标悬停在某个区域时会出现新的内容,当用户填写表单时系统会给出相应反馈。这些动态的交互过程包含了网页运作的核心逻辑,但在传统的AI训练方法中却被完全忽略了。

正是在这样的背景下,研究团队提出了一个革命性的想法:为什么不让AI观看完整的用户操作视频,就像人类学习使用软件一样,通过观察整个交互过程来理解网页的工作原理呢?

阅读全文
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

“2025全球十大工程成就”揭晓,DeepSeek开源大模型等上榜

上观新闻 浏览 4491

日股大跌,政坛地震威胁“高市交易”

国际金融报 浏览 4499

深夜,全线崩跌!发生了什么?

券商中国 浏览 3872

YouTube服务出现“宕机”:正在修复中

界面新闻 浏览 8035

新款奔驰GLE家族焕新上市 改变真的挺大的

汽车天涯 浏览 1681

全尺寸SUV定位 奕境首台工程样车下线/量产版4月发布

网易汽车 浏览 3655

临近年关,凤凰传奇高调官宣喜讯,网友:恭喜

阿废冷眼观察所 浏览 3293

国产车在英国被“警告”了,还是安全问题,但这回我真憋不住笑了

小李车评李建红 浏览 5203

【年度爱用】她们2025年买得最值的,是这些

黎贝卡的异想世界 浏览 3439

报道称美方将启动关键矿产储备计划 中方回应

财联社 浏览 6764

大衣别这么穿,显黑又显胖!

Yuki女人故事 浏览 4200

推广|| 你们都在催的鞋子,终于来了!

黎贝卡的异想世界 浏览 4168

没有商业模式--DeepSeek最坚固的“护城河”

华尔街见闻官方 浏览 3358

美媒称美国允许乌对俄使用远程导弹 特朗普:假新闻

界面新闻 浏览 4290

国内油价今年第七涨重返9元时代 国际油价居高不下

上观新闻 浏览 91951

天空体育:热刺高层在考虑所有选项,尚未决定弗兰克的去留

懂球帝 浏览 3328

李斌透露:蔚来ES8五座版7月发布!大五座SUV市场要变天了?

优视汽车 浏览 529

欧洲提交修改版和平计划 涵盖乌克兰安全保障方式

上观新闻 浏览 3891

南加大团队揭秘:让AI做数学题更聪明的"长度感知"训练法

科技行者 浏览 4264

NBA加WNBA至少4夺MVP球员:一共6人 乔丹詹姆斯在列 阿贾今日入围

直播吧 浏览 5065

国乒再添一喜!孙颖莎王曼昱被清华大学拟录取,双子星推免直硕

乒谈 浏览 3632
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1