关闭广告

AWS推出AI图像编辑新突破:用说话就能精准移动图片中的物体!

科技行者3608人阅读


这项来自香港中文大学、AWS智能AI部门、亚马逊云服务和亚马逊机器人团队的联合研究发表于2025年1月,论文编号为arXiv:2601.02356v1。研究团队由谭靖、张兆阳、沈彦涛、蔡嘉瑞等多位学者组成,有兴趣深入了解的读者可以通过该编号查询完整论文。

想要修改照片里的物体位置,过去总是需要专业的图像处理软件和复杂的操作技巧。现在,AWS的研究团队开发出一种全新的AI系统叫做TALK2MOVE,只需要简单地说出你的想法,比如"把杯子往左移动"或者"把椅子转90度",AI就能准确地完成这些操作。这就像拥有了一个非常聪明的助手,能够完全理解你的语言指令并在照片中精准执行。

这项研究的核心创新在于采用了强化学习的训练方式,可以把它理解为让AI通过反复练习来学会精准操作的过程。不同于传统方法需要大量配对的"修改前后"图片来训练,TALK2MOVE采用了一种更加聪

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

售19.98万元起 方程豹钛7 EV闪充版上市

网易汽车 浏览 1393

北京79-73力克浙江,陈盈骏18分,杰曼23+5,吴前7中1

懂球帝 浏览 3560

Altman放话:2028年,超级智能将超越人类

钛媒体APP 浏览 2917

说它抄袭,打脸了吧

独立鱼 浏览 2873

浙江稠州商业银行“共享法庭”实践,获评消费者权益保护领航企业

Daily每日财报 浏览 3768

美媒:美对伊朗行动选项"远超传统空袭"

新华社 浏览 3470

美国拟实施载人绕月飞行任务

北京商报 浏览 3517

从夸克眼镜,到豆包手机,为什么巨头扎堆端侧AI?

华尔街见闻官方 浏览 4120

巴列卡诺2-1马略卡,帕拉松点射、德弗鲁托斯破门

懂球帝 浏览 3473

中戏否认闫学晶儿子读新疆班,官方发文打假闫学晶!

素素娱乐 浏览 3619

白酒巨头一季报业绩普降,白酒拐点临近还是拐点远未到来?

郭施亮 浏览 1529

看了隆妮表演才知道,观众都冤枉杨幂了?

霁月文娱阁 浏览 4702

2025最狠理财,惊呆百万散户!

米筐投资 浏览 3499

魅族 22 手机推送 Flyme 12.3.1.3A 稳定版更新

IT之家 浏览 4299

安切洛蒂:现在出现问题并及时修正,总比在世界杯时出错要好

懂球帝 浏览 4835

大咖对话:从L2到L4,如何破解高阶智驾落地难题

网易汽车 浏览 3939

欧盟官员:"特普会"是对欧盟外交地位的公开羞辱

澎湃新闻 浏览 9774

抢滩“双11”,浙江跨境商家为速卖通备货10万棵圣诞树

财闻 浏览 4852

男子爬衡山丢80.88克金牌 失主:做好找不回的打算了

极目新闻 浏览 7918

演员任敏生理期南极跳海,回船喝酒

失宠的小野猪 浏览 3831

记者实测 多地办理电话卡需提供无犯罪证明和银行流水

澎湃新闻 浏览 10519
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1