关闭广告

小米开源语音大模型Xiaomi-MiMo-Audio,对话自然度达拟人水准

IT之家4906人阅读

IT之家 9 月 19 日消息,小米今天宣布开源首个原生端到端语音大模型 Xiaomi-MiMo-Audio,首次在语音领域实现基于 ICL 的少样本泛化

据小米介绍,五年前 GPT-3 首次展示了通过自回归语言模型 + 大规模无标注数据训练,获得 In-Context Learning(ICL,上下文学习)能力,而在语音领域,现有的大模型仍严重依赖大规模标注数据难以适应新任务达到类人智能

而 Xiaomi-MiMo-Audio 模型打破了这种瓶颈,它基于创新预训练架构和上亿小时训练数据,在智商、情商、表现力与安全性在内的跨模态对齐能力均有提升,在自然度、情感表达和交互适配方面呈现出拟人化水准

这款模型的具体创新点如下:

  • 首次证明把语音无损压缩预训练 Scaling 至 1 亿小时可以“涌现”出跨任务的泛化性,表现为 Few-Shot Learning 能力。

阅读全文
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

聚焦高额彩礼杀猪盘,反诈电影《极限人生》首映

南方都市报 浏览 3276

王家卫繁花有黑幕!?

八卦疯叔 浏览 4940

奚梦瑶何猷君婚礼曝光 深情热吻甜蜜

情感大头说说 浏览 111

出道十年,宋威龙终于有了花香

时尚COSMO 浏览 2628

医生手术时涉诈停机 20多天未能复机无法与病人联系

中国新闻周刊 浏览 10838

性能+豪华 星途ES7GT/ES8/ET8/ET9四车发布

网易汽车 浏览 3511

现在穿v领毛衣,刚好

Yuki女人故事 浏览 3385

俄朝站队怒批高市 特朗普迅速与日切割中方警告很罕见

现代小青青慕慕 浏览 48422

限时19.68万元起 比亚迪2026款夏上市

网易汽车 浏览 3978

杨振宁获诺奖速度纪录至今未破 提出理论到获奖仅1年

澎湃新闻 浏览 7858

美总统威胁对尼日利亚动武 尼方回应

环球网资讯 浏览 4128

乌方将向美提交新20点和平计划 泽连斯基表态

财联社 浏览 2926

小鹏汽车11月交付新车36,728台 1-11月累计交付391,937台

网易汽车 浏览 3606

横琴人寿去年净亏3.27亿,保险业务收入同比下滑23%

密探财经 浏览 2959

标配激光雷达和四驱 魏牌高山7上市售28.58万

网易汽车 浏览 4296

保时捷的十字路口:奥博穆交棒,勒茨斯的回归与挑战

网易汽车 浏览 4314

消息称苹果计划2026年底进军智能眼镜市场,重塑全球AR光学供应链

IT之家 浏览 3042

英伟达砸20亿入股EDA巨头 黄仁勋赞"巨大扩展机遇"

华尔街见闻官方 浏览 3708

汪小菲罕见亲晒儿子正脸照,眉眼像极了大S,凸牙问题还没改善

萌神木木 浏览 4307

5月开车撞利物浦球迷的司机承认故意撞人,预计12月15日宣判

懂球帝 浏览 3716

介绍一个如果你用了,你就看不到这篇文章的产品

时尚COSMO 浏览 3490
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1