关闭广告

AWS推出AI图像编辑新突破:用说话就能精准移动图片中的物体!

科技行者3450人阅读


这项来自香港中文大学、AWS智能AI部门、亚马逊云服务和亚马逊机器人团队的联合研究发表于2025年1月,论文编号为arXiv:2601.02356v1。研究团队由谭靖、张兆阳、沈彦涛、蔡嘉瑞等多位学者组成,有兴趣深入了解的读者可以通过该编号查询完整论文。

想要修改照片里的物体位置,过去总是需要专业的图像处理软件和复杂的操作技巧。现在,AWS的研究团队开发出一种全新的AI系统叫做TALK2MOVE,只需要简单地说出你的想法,比如"把杯子往左移动"或者"把椅子转90度",AI就能准确地完成这些操作。这就像拥有了一个非常聪明的助手,能够完全理解你的语言指令并在照片中精准执行。

这项研究的核心创新在于采用了强化学习的训练方式,可以把它理解为让AI通过反复练习来学会精准操作的过程。不同于传统方法需要大量配对的"修改前后"图片来训练,TALK2MOVE采用了一种更加聪

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

336万年薪请来的CEO,上任两个月就“失联”,高鑫零售的转型阵痛期

红星资本局 浏览 3148

“勃肯鞋”今年冬天爆火!这几双怎么搭都好看

LinkFashion 浏览 3566

男子犯病救命药滞留酒店前台5个小时后死亡 酒店回应

封面新闻 浏览 16712

特斯拉 Model Y L 交流外供电适配器上架,售价 599 元

IT之家 浏览 4121

又赢了!19岁国乒黑马绝杀日本后势不可挡 高情商发言存大将之风

颜小白的篮球梦 浏览 4009

比亚迪元PLUS迎来史诗级升级,续航或超650km!

刘哥谈体育 浏览 4213

中国人聊"美国斩杀线" 居然让新加坡主流媒体彻底破防

沙盘上的战争 浏览 24895

高负债下韬盛科技2023年净利润为负,增收反降利,供应商集中

权衡财经 浏览 430

两集飙上9分,今年又一神剧出现了

独立鱼 浏览 3448

芯片制造的终极范式:原子级制造

钛媒体APP 浏览 4341

BR为勇士换字母模拟4方交易!火箭2换2送KD得巴特勒 休媒:太荒唐

颜小白的篮球梦 浏览 510

诺奖化学奖一得主是巴勒斯坦难民 家中8个兄弟姐妹

扬子晚报 浏览 21441

四部门重拳出击 严控新车以二手车名义出口

北京商报 浏览 4065

韩国防部给出核潜艇下水时间点 此前韩国已向中方保证

澎湃新闻 浏览 16856

靳东这波转型,真是让人佩服得五体投地。

小光侃娱乐 浏览 5033

Claude Opus 4.5来了!单次生成打造《我的世界》,还破解高难度Agent测评

智东西 浏览 4012

最大纯电续航达335km 智己LS8官图发布

车质网 浏览 3427

销量五年连跌,转型未起色,为何日系车最“困难”的是本田?

汽扯扒谈 浏览 3403

快船今日首发中有4人34+岁,NBA近9年来首队

懂球帝 浏览 2840

杨幂视后梦碎了?《生万物》除女主之外全员拿奖

萌神木木 浏览 2533

前三季度私募产品“超涨”十强!复胜、远信、歌汝等夺冠!

私募排排网 浏览 4512
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1