关闭广告

小米开源语音大模型Xiaomi-MiMo-Audio,对话自然度达拟人水准

IT之家5076人阅读

IT之家 9 月 19 日消息,小米今天宣布开源首个原生端到端语音大模型 Xiaomi-MiMo-Audio,首次在语音领域实现基于 ICL 的少样本泛化

据小米介绍,五年前 GPT-3 首次展示了通过自回归语言模型 + 大规模无标注数据训练,获得 In-Context Learning(ICL,上下文学习)能力,而在语音领域,现有的大模型仍严重依赖大规模标注数据难以适应新任务达到类人智能

而 Xiaomi-MiMo-Audio 模型打破了这种瓶颈,它基于创新预训练架构和上亿小时训练数据,在智商、情商、表现力与安全性在内的跨模态对齐能力均有提升,在自然度、情感表达和交互适配方面呈现出拟人化水准

这款模型的具体创新点如下:

  • 首次证明把语音无损压缩预训练 Scaling 至 1 亿小时可以“涌现”出跨任务的泛化性,表现为 Few-Shot Learning 能力。

阅读全文
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

装修“精神角落”,就是这么上瘾

时尚COSMO 浏览 1525

记者:弗里克听说自己的明夏离队传闻后说“又是胡说八道”

懂球帝 浏览 4126

中国人均负债14万!央妈发“信用修复丸”年轻人满意吗?

花朵财经 浏览 3691

大连“智”造金属螺钉骨植入材料将上市

半岛晨报 浏览 5211

联合杯贝尔赫斯首胜阿利亚西姆

体坛周报 浏览 3404

人人都有囤积症?

时尚COSMO 浏览 3369

伊姐周日热推:电视剧《超感迷宫》;电视剧《风与潮》......

伊周潮流 浏览 2968

离开央视为钱四处奔波的李思思,已然风光不再

TVB的四小花 浏览 3165

阿劳霍:我非常喜欢场上的维尼修斯,场外的事情我不在意

懂球帝 浏览 4304

贡多齐:尤文目前的状态并不理想,我们有足够的实力击败他们

懂球帝 浏览 4316

A股年内近160股易主

北京商报 浏览 3904

靠“早C晚A”火出圈!HBN赴港递表,44%抖音平台复购率印证国民好感|港E声

时代周报 浏览 3280

2000万美元重注强脑科技,三七互娱落子脑机接口新纪元

钛媒体APP 浏览 4111

三幅字画涉刑被拍卖 其中徐悲鸿"奔马图"起拍价4762万

极目新闻 浏览 10116

普京与特朗普通电话 讨论伊朗局势

环球网资讯 浏览 2469

电商助力 四川会东石榴从深山走向全国市场

封面新闻 浏览 5034

李昀锐孟子义被曝恋情,却双双否认

霁月文娱阁 浏览 4392

消失1年,王子异自称得了抑郁症

失宠的小野猪 浏览 3549

湖人惨败尼克斯!双核轰52分喜忧参半,艾顿无球权,防守真拉胯!

篮球资讯达人 浏览 3179

还是这些穿搭适合初春季节!外套不多买、常穿裙子,优雅舒适

静儿时尚达人 浏览 1768

鏖战3小时,40岁老将瓦林卡追平纳达尔职业生涯一大纪录!

网球之家 浏览 3544
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1