关闭广告

小米开源语音大模型Xiaomi-MiMo-Audio,对话自然度达拟人水准

IT之家5080人阅读

IT之家 9 月 19 日消息,小米今天宣布开源首个原生端到端语音大模型 Xiaomi-MiMo-Audio,首次在语音领域实现基于 ICL 的少样本泛化

据小米介绍,五年前 GPT-3 首次展示了通过自回归语言模型 + 大规模无标注数据训练,获得 In-Context Learning(ICL,上下文学习)能力,而在语音领域,现有的大模型仍严重依赖大规模标注数据难以适应新任务达到类人智能

而 Xiaomi-MiMo-Audio 模型打破了这种瓶颈,它基于创新预训练架构和上亿小时训练数据,在智商、情商、表现力与安全性在内的跨模态对齐能力均有提升,在自然度、情感表达和交互适配方面呈现出拟人化水准

这款模型的具体创新点如下:

  • 首次证明把语音无损压缩预训练 Scaling 至 1 亿小时可以“涌现”出跨任务的泛化性,表现为 Few-Shot Learning 能力。

阅读全文
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

泰军摧毁6个柬埔寨诈骗基地 称要斩断跨国犯罪根源

扬子晚报 浏览 3718

2025 年最强太阳耀斑爆发,引发非洲和欧洲多地无线电中断

IT之家 浏览 4135

特斯拉与迪士尼合作引争议:车机引入《创:战神》车模被指广告

IT之家 浏览 4433

秦岚自曝身体出现情况,治疗结果不尽人意

乡野小珥 浏览 2694

"煤老虎"敛财数千万元 被批受贿"来者不拒、大小通吃"

北京日报客户端-长安街知事 浏览 7022

Prada如何解构身体与气质?

时尚COSMO 浏览 6501

雷克萨斯,凭什么2025还能逆势增长?

汽车人传媒 浏览 3392

BR为勇士换字母模拟4方交易!火箭2换2送KD得巴特勒 休媒:太荒唐

颜小白的篮球梦 浏览 514

专家:自民党与公明党谈崩了 给高市早苗当头一记闷棍

澎湃新闻 浏览 4991

《御赐小仵作2》空降续集开播!最新口碑出炉,观众评价一针见血

娱乐圈笔娱君 浏览 3490

东风本田10月销量28896台 1-10月累计终端销量255073台

网易汽车 浏览 4253

最新!这家险资巨头,透露康养生态布局进展

券商中国 浏览 3595

国安2-4海牛历史首次主场输给对手,此前12战10胜2平仅失3球

懂球帝 浏览 4443

一车三动力:五菱星光730电/油/插混动力配置公布,10月15日预售

IT之家 浏览 4597

MIT所长涉嫌图片操纵,《自然》发布关注声明

知识分子 浏览 5018

三年打入越南Top 5,这家纸巾厂的出海秘诀是什么?

虎嗅APP 浏览 4449

男子在悬崖边请人拍照滑倒坠下 遗体在水潭底部被找到

封面新闻 浏览 10012

“麂皮包”越来越流行,秋冬怎么搭都好看

LinkFashion 浏览 3293

古二反击《繁花》!新录音曝光打脸秦雯,业内直言压榨新人是常态

萌神木木 浏览 4287

3件开心小事|| 这条视频竟然有一千万人看了

黎贝卡的异想世界 浏览 3656

中邮基金换帅!权益规模下降,中邮核心成长混合为何业绩垫底?

Daily每日财报 浏览 3704
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1