关闭广告

IDEA研究院发布LEMAS:首个15万小时多语言语音数据集

科技行者1641人阅读


科技发展到今天,人工智能已经能够模仿人类的声音说话了。然而,如果你曾经尝试过让AI说其他语言,比如让一个英语AI说中文,你可能会发现它的口音怪异,发音不准,甚至完全听不懂在说什么。这就像是一个只会说英语的人硬要说中文,结果说得让人啼笑皆非。这背后的根本问题是什么呢?缺乏高质量的多语言语音数据。

由国际数字经济研究院(IDEA)主导的研究团队最近发表了一项突破性成果,这项研究发表于2025年1月的arXiv预印本服务器上,论文编号为arXiv:2601.04233v1。感兴趣的读者可以通过这个编号查询完整论文。研究团队构建了一个名为LEMAS的庞大语音数据集,包含超过15万小时的多语言语音数据,覆盖10种主要语言,并且每个词都有精确的时间戳标注。基于这个数据集,他们还开发了两个强大的AI模型:LEMAS-TTS和LEMAS-Edit,前者专门负责语音合成,后者专门负责语音编辑。

为了理解这项研究的重要性,我们可以把语音AI比作一位多语言播音员。传统的播音员要想掌握多种语言,需要大量的训练素材和精确的指导。同样,AI要想说好多种语言,也需要海量的高质量语音数据作为"教材"。但现有的多语言语音数据存在许多问题:要么

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

官方:朴茨茅斯vs伊普斯维奇因场地严重积水推迟

懂球帝 浏览 1438

美媒:特朗普敲打高市 要求日本在台海问题上降调

观察者网 浏览 29438

“躺平”后,老干妈卖了快54亿

华尔街见闻官方 浏览 1948

“杭州湾揽胜”杀到!极氪8X的差异化优势是啥?卖这个价必火

蜗牛车志V 浏览 1711

或将搭载V8引擎 奥迪Q9将于2026年发布

车质网 浏览 1671

U23亚洲杯狂欢夜:日本5-0造惨案 韩国平伊朗 中国队首轮战伊拉克

侃球熊弟 浏览 1714

4-1!中国男足大反弹,一举终结2连败,15岁小将大四喜,出线有戏

侃球熊弟 浏览 2754

中国人聊"美国斩杀线" 居然让新加坡主流媒体彻底破防

沙盘上的战争 浏览 23222

特朗普弄混格陵兰岛与冰岛 再提北约秘书长叫他"爸爸"

鲁中晨报 浏览 19066

到底什么人还在买油车?终于我悟了

汽车公社 浏览 2244

39集《沉默的荣耀》大结局前瞻,5人再无反转,黎晴成唯一变数

娱乐圈笔娱君 浏览 2738

这家中国民企,破解了“迪拜之眼”难题,还拿下30多项“世界第一”!

国是直通车 浏览 2568

日本开年密集外交搞了不少小动作 引发地区国家警惕

澎湃新闻 浏览 6017

1-10月累计同比增长57.1% 深蓝汽车10月全球销量36792辆

网易汽车 浏览 2497

以军频袭黎巴嫩南部 黎总统斥责

新华社 浏览 2606

换装纯电动力系统 全新日产JUKE谍照曝光

车质网 浏览 2033

布云朝克特遭遇新赛季开门黑,周意送蛋横扫受到网友表扬!

网球之家 浏览 1827

委内瑞拉下令搜捕美国侵略支持者

澎湃新闻 浏览 1748

乘联分会崔东树:2025年汽车以旧换新规模预计超1800亿元

IT之家 浏览 2112

强掳马杜罗后 特朗普又"敲打"莫迪:让我高兴很重要

看看新闻Knews 浏览 5228

喜羊羊之父,又要去IPO了

投资家 浏览 1857
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1