关闭广告

小米开源语音大模型Xiaomi-MiMo-Audio,对话自然度达拟人水准

IT之家3452人阅读

IT之家 9 月 19 日消息,小米今天宣布开源首个原生端到端语音大模型 Xiaomi-MiMo-Audio,首次在语音领域实现基于 ICL 的少样本泛化

据小米介绍,五年前 GPT-3 首次展示了通过自回归语言模型 + 大规模无标注数据训练,获得 In-Context Learning(ICL,上下文学习)能力,而在语音领域,现有的大模型仍严重依赖大规模标注数据难以适应新任务达到类人智能

而 Xiaomi-MiMo-Audio 模型打破了这种瓶颈,它基于创新预训练架构和上亿小时训练数据,在智商、情商、表现力与安全性在内的跨模态对齐能力均有提升,在自然度、情感表达和交互适配方面呈现出拟人化水准

这款模型的具体创新点如下:

  • 首次证明把语音无损压缩预训练 Scaling 至 1 亿小时可以“涌现”出跨任务的泛化性,表现为 Few-Shot Learning 能力。

阅读全文
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

百年固特异的中国未来

网易汽车 浏览 1843

打好价值战,吉利银河冲击「下一个百万」

网易汽车 浏览 1705

许传智被查:在中纪委工作超30年 曾任宁夏纪委书记

界面新闻 浏览 7611

“超级周”来袭!美联储,降息稳了?

券商中国 浏览 2660

44岁郭晶晶看车被偶遇,素颜白发撞脸董明珠

小威说AI 浏览 1671

青创人才说 | 柒色莲生物汪会兵:当好iPSC细胞疗域“铺路人”

上观新闻 浏览 2238

网恋1个月怀孕 45岁女子被61岁男友拉黑:他出轨别人

极目新闻 浏览 8505

买黄金,要大变了!

深蓝财经 浏览 2517

香港男子在宏福苑大火中失去母亲和弟弟:撑不下去了

极目新闻 浏览 33800

三镇1-2新鹏城,杜加利奇破门,杨一鸣肘击染红,三镇全场0射正

懂球帝 浏览 2710

亚奇雷AGI将参展CES 2026:展出10000MT/s内存条与Gen5 SSD

IT之家 浏览 2084

智己LS9开启预售,33.69万元起颠覆大六座市场

林林Go 浏览 2512

美股半导体板块,集体下跌

第一财经资讯 浏览 1565

4个显高显瘦搭配,“小个子”的冬天就这样穿!

LinkFashion 浏览 1725

保时捷纯电卡宴即将首发,PPE平台打造

车评网 浏览 2015

极氪8X实车现身,大过宝马X5+5/6座可选,配1401马力+双腔空悬?

燕赵女司机 浏览 1643

大幅上调英伟达目标价,这家大行的理由:台积电产能分配远超预期,OpenAI“闭环交易”

华尔街见闻官方 浏览 2799

大搞权钱交易和家族式腐败 湖北省委原书记蒋超良被诉

扬子晚报 浏览 83932

全新一代丰田Hilux将于11月10日正式发布

车质网 浏览 2052

U23亚洲杯疯狂一夜:韩国4-2逆转 日本3-0接近进8强 中国队争首胜

侃球熊弟 浏览 1599

全系四驱/全新三电/全套华为 岚图追光L开启预订

网易汽车 浏览 3325
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1