关闭广告

GUI自动化的新突破:ServiceNow让AI更准确定位屏幕界面元素

科技行者811人阅读


这项由ServiceNow、魁北克人工智能研究院、蒙特利尔大学、约克大学、蒙特利尔理工学院和麦吉尔大学联合进行的研究发表于2025年10月,论文编号为arXiv:2510.03230v1。研究团队由王苏宇辰、张天宇、Ahmed Masry、Christopher Pal、Spandana Gella、刘邦和Perouz Taslakian等学者组成,他们致力于解决人工智能在GUI(图形用户界面)自动化中面临的核心难题。有兴趣深入了解的读者可以通过论文编号arXiv:2510.03230v1查询完整论文。

现代生活中,我们每天都要与各种软件界面打交道——从手机应用到电脑程序,从网页浏览到办公软件。如果能让人工智能像人类一样准确地识别和操作这些界面元素,将会极大提升工作效率。然而,要让AI准确找到屏幕上的按钮、文本框或菜单项,就像要求一个从未见过地图的人在陌生城市中找到特定建筑物一样困难。

这项研究的核心贡献在于解决了当前视觉语言模型在GUI定位任务中的一个根本性问题:如何将自然语言指令准确转换为屏幕上的像素坐标。研究团队发现,现有方法就像让一个盲人通过触摸来画地图一样效率低下,因为AI模型需要在没有明确参照物的

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

5年前的今天:考辛斯1年530万加盟勇士 曾拒鹈鹕2年4000万报价

直播吧 浏览 15748

"网红罗大美遇害案"新进展:三名被告人均提出上诉

扬子晚报 浏览 7125

斥资5000万美元,Meta前CTO让海洋帮忙除碳

DeepTech深科技 浏览 16390

央视中秋宋佳大气唐嫣美艳,侯佩岑主持功底深,谢娜受邀另有原因

不八卦会死星人 浏览 1007

特朗普:乌克兰无牌可打 错过解决俄乌问题的最佳时机

台州交通广播 浏览 196

深圳00后600多万在港抄底买房 内地客十年砸下8000亿

南方都市报 浏览 13353

众多UP主吐槽陈凯歌被举报,对人身攻击零容忍

趣看热点 浏览 25473

有村架纯恋情曝光 与高桥海人已交往三年

网易娱乐 浏览 13291

俄在日本海演习击沉假想敌潜艇

参考消息网 浏览 695

喜报!识局助力一家机器人企业落户西南某地!

识局 浏览 828

为了对付这国,日韩要搁置“雷达照射”争议

参考消息 浏览 16919

黄磊17岁女儿大变样 多多穿吊带化浓妆

盖饭娱乐官方号 浏览 15650

达成停火18天后战火再起 以总理下令袭击加沙

国际在线 浏览 773

基德:东契奇克服伤病率队进总决赛不可思议 最近几天他能喘口气

直播吧 浏览 10906

霍勒迪:杰伦-布朗攻防一体 他最近一直都在防对手的最佳后卫

直播吧 浏览 12667

英媒:欧洲企业已因俄乌冲突损失超千亿欧元

国际在线 浏览 14786

福原爱东京奥运会解说工作被叫停,还将面临经纪公司解约

趣看热点 浏览 26410

机器人不约而同毛茸茸,年轻人抢着体验AI养老产品…首届WTCC太全面了

上观新闻 浏览 881

京东集团:子公司达达在内部审计发现存疑行为

中新经纬 浏览 12750

央视在苏丹驻地大楼遭袭 报道员躲地下室几乎没食物

每日经济新闻 浏览 119763

杠杆资金流入 北方铜业股价创28年新高

21世纪经济报道 浏览 1613
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1