关闭广告

IDEA研究院发布LEMAS:首个15万小时多语言语音数据集

科技行者1636人阅读


科技发展到今天,人工智能已经能够模仿人类的声音说话了。然而,如果你曾经尝试过让AI说其他语言,比如让一个英语AI说中文,你可能会发现它的口音怪异,发音不准,甚至完全听不懂在说什么。这就像是一个只会说英语的人硬要说中文,结果说得让人啼笑皆非。这背后的根本问题是什么呢?缺乏高质量的多语言语音数据。

由国际数字经济研究院(IDEA)主导的研究团队最近发表了一项突破性成果,这项研究发表于2025年1月的arXiv预印本服务器上,论文编号为arXiv:2601.04233v1。感兴趣的读者可以通过这个编号查询完整论文。研究团队构建了一个名为LEMAS的庞大语音数据集,包含超过15万小时的多语言语音数据,覆盖10种主要语言,并且每个词都有精确的时间戳标注。基于这个数据集,他们还开发了两个强大的AI模型:LEMAS-TTS和LEMAS-Edit,前者专门负责语音合成,后者专门负责语音编辑。

为了理解这项研究的重要性,我们可以把语音AI比作一位多语言播音员。传统的播音员要想掌握多种语言,需要大量的训练素材和精确的指导。同样,AI要想说好多种语言,也需要海量的高质量语音数据作为"教材"。但现有的多语言语音数据存在许多问题:要么

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

伊朗外长:就伊朗核问题达成协议的唯一途径是外交

国际在线 浏览 974

夸克“C计划”浮出水面,AI超级应用卡位战升级

华夏时报 浏览 2645

至高享价值48800元限时购车礼 猛士M817 Hero售30.19万

网易汽车 浏览 2312

《阿凡达3》一言难尽,好看不好吃,顶级特效盖不住影迷吐槽剧情

最爱酷影视 浏览 1977

"特朗普级"战列舰造价公布:高达220亿美元

极目新闻 浏览 1603

全球首个海上千方 PEM 槽及制氢系统的全功率测试启动

IT之家 浏览 2615

外媒:俄国防部称击溃一支乌克兰特种部队

环球网资讯 浏览 2572

“咨询行业的黄埔军校”,又被罚了

财通社 浏览 1597

陈道明主演!36集谍战剧来袭,是《沉默的荣耀》后我唯一想追的剧

娱乐圈笔娱君 浏览 2716

新财年临近,美政府“停摆”风险加剧,白宫指示联邦机构准备裁员计划

环球网资讯 浏览 3400

秦雯袭警风波升级!新剧开播前四天紧急撤档,上星困难唐嫣被牵连

萌神木木 浏览 2642

女子网购雅鹿羽绒服衣袖上现"孝"字标 商家:补偿10元

都市报道 浏览 3829

工程师崩溃!某车企研发开始试行“两班倒”!

明镜pro 浏览 2746

MINI COOPER限定版上市 限时售21.78万元起

太平洋汽车 浏览 2005

理想i6不搞虚的,9月26日上市/第二天开始交付

星星car 浏览 3358

从0到171亿!一座制造名城的“追星”金融账本

贝壳财经 浏览 1600

智元精灵G2新一代工业级交互式具身作业机器人发布

IT之家 浏览 2805

特朗普或优先“做掉”欧洲?

浏览 25420

0-2!中超领头羊丢尽颜面,连续9场不胜日本球队,还沦为亚冠垫底

侃球熊弟 浏览 2692

可搭载“波塞冬”核动力无人潜航器 俄新一艘核潜艇出坞

上观新闻 浏览 2563

清华大学等联手打造智能分析系统,让卫星图像自动识别准确率飙升

科技行者 浏览 1763
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1