关闭广告

小米开源语音大模型Xiaomi-MiMo-Audio,对话自然度达拟人水准

IT之家5078人阅读

IT之家 9 月 19 日消息,小米今天宣布开源首个原生端到端语音大模型 Xiaomi-MiMo-Audio,首次在语音领域实现基于 ICL 的少样本泛化

据小米介绍,五年前 GPT-3 首次展示了通过自回归语言模型 + 大规模无标注数据训练,获得 In-Context Learning(ICL,上下文学习)能力,而在语音领域,现有的大模型仍严重依赖大规模标注数据难以适应新任务达到类人智能

而 Xiaomi-MiMo-Audio 模型打破了这种瓶颈,它基于创新预训练架构和上亿小时训练数据,在智商、情商、表现力与安全性在内的跨模态对齐能力均有提升,在自然度、情感表达和交互适配方面呈现出拟人化水准

这款模型的具体创新点如下:

  • 首次证明把语音无损压缩预训练 Scaling 至 1 亿小时可以“涌现”出跨任务的泛化性,表现为 Few-Shot Learning 能力。

阅读全文
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

复出高效,波尔津吉斯砍30分5板4助2断3帽&得分勇士生涯新高

懂球帝 浏览 2323

秦雯自曝袭警被抓后,让王家卫捞人找自己?

芊手若 浏览 4165

将于2027年上市 AMG CLA猎装车谍照曝光

车质网 浏览 3023

卡内基梅隆大学打造"神经侦探":让AI像破案一样学会理解语音

科技行者 浏览 3521

杨迪回应爬山过程中朋友被救护车拉走

封面新闻 浏览 398

新中式,才是属于我们的时尚与生活

LinkFashion 浏览 3632

短剧女神郭宇欣让多少白幼瘦女星脸红?

娱乐圈笔娱君 浏览 4362

比亚迪RACCO内饰官图发布 将于今夏在日本市场发布

太平洋汽车 浏览 2770

酿酒入列历史经典产业,郎酒的“慢功夫”见真章

征探财经 浏览 4205

决胜盘落后顽强逆转!奇纳四进挑战赛决赛终夺冠,迎生涯新突破

网球之家 浏览 2692

7天吸金36亿,合肥冲击“新能源汽车之都”,汽车产业高速发展伴随“阵痛”

红星资本局 浏览 4274

泰国外长:泰柬将于12月24日举行会谈 讨论停火细节

财联社 浏览 3538

墨西哥一市长怀抱幼子被当众枪杀 曾誓言根除贩毒集团

红星新闻 浏览 9799

孙颖莎生日晒与父母合照,一家三口共用一张脸

观察鉴娱 浏览 4319

德国军事人员突然撤离格陵兰岛 原因不详

财联社 浏览 3307

她一夜爆火,成了年度互联网嘴替

Yuki女人故事 浏览 537

乌克兰袭击莫斯科一座热电站 距克宫仅百余公里

上观新闻 浏览 3981

10位院士与会 2025中国自动化大会成功举行

网易科技报道 浏览 4533

年度王炸爽剧,还是烂尾了

独立鱼 浏览 4010

特朗普:俄方知道美国在俄海岸附近部署核潜艇

环球时报 浏览 4249

双14.6英寸联屏 星越L长风系列上市限时价12.47万起

网易汽车 浏览 2606
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1