关闭广告

上海AI实验室团队首创视频驱动交互网页重建基准

科技行者4274人阅读


这项由上海AI实验室、浙江大学、中国科学技术大学深圳分校等机构联合完成的突破性研究发表于2025年9月,论文编号为arXiv:2509.24709。研究团队包括陈阳、刘明浩、沈雨帆等多位来自不同院校的研究者,项目由上海AI实验室的沈雨帆教授领导。有兴趣深入了解的读者可以通过该论文编号查询完整论文内容。

当我们浏览网页时,看到精美的界面、流畅的动画效果和各种交互功能,很少有人会想到这背后需要大量的代码来支撑。传统上,要让AI学会制作网页,研究者们通常只给它看静态的截图,然后让它生成对应的代码。这就像让一个人仅凭一张照片就要画出整幅画作一样,缺少了很多重要信息。

然而,真实的网页远比静态截图复杂得多。当用户点击按钮时页面会发生变化,当鼠标悬停在某个区域时会出现新的内容,当用户填写表单时系统会给出相应反馈。这些动态的交互过程包含了网页运作的核心逻辑,但在传统的AI训练方法中却被完全忽略了。

正是在这样的背景下,研究团队提出了一个革命性的想法:为什么不让AI观看完整的用户操作视频,就像人类学习使用软件一样,通过观察整个交互过程来理解网页的工作原理呢?

阅读全文
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

闫学晶的账还没有算清,49岁李湘又“塌”了

真的八卦小学弟 浏览 3203

以硬核智能定义超值神车 尚界H5交付破10000台

网易汽车 浏览 3868

章子怡近照脸部发肿,最具特色的骨相优势都没了

萌神木木 浏览 3299

提前锁定季后赛!浙江轻取江苏6连胜 陆文博18分庞峥麟18+5

醉卧浮生 浏览 1770

油车首搭华为鸿蒙座舱!日产中国庆生40年,甩出三款新车,补全插混拼图

车东西 浏览 4437

新加坡主权基金起诉蔚来,股价迎中、美、新“三国杀”!

野马财经 浏览 4382

勇士不敌湖人!波杰统领攻守,替补2将齐爆,库明加格林失误多!

篮球资讯达人 浏览 4497

郎酒发布年度十大图片:“拼”出郎酒的向上征程!

Daily每日财报 浏览 3322

俄美乌新一轮三方会谈将举行 只剩一个问题却是死结

新民晚报 浏览 6581

突发!茅台真的换帅了

财通社 浏览 4285

万亿豪赌:OpenAI结盟芯片、云巨头,AI生态闭环了吗?

澎湃新闻 浏览 4526

研究发现:若告知消费者广告是由AI生成的,点击率会减少31%

IT之家 浏览 3867

什么信号?有银行直接5.5折卖房

大猫财经Pro 浏览 3547

科学家刊文称:发现影响癌症进展的关键细胞

新华社 浏览 3252

2025世界青年科学家峰会聚焦开放合作

新华社 浏览 4317

国家放大招了,一口气画了10个圈!

米筐投资 浏览 4235

厦大EMBA,四维一体、育见未来

经理人杂志 浏览 4398

特朗普:以色列与哈马斯签署"20点计划"第一阶段协议

央视新闻客户端 浏览 3715

卡莱特推出Mica P100产线机器人

财闻 浏览 3170

猛士汽车2025全年销量10228台 同比增长387%

网易汽车 浏览 3414

AI狂热不敌冷峻现实:企业下调AI代理预期,实现全自动化仍需数年时间

华尔街见闻官方 浏览 4122
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1