关闭广告

小米开源语音大模型Xiaomi-MiMo-Audio,对话自然度达拟人水准

IT之家1696人阅读

IT之家 9 月 19 日消息,小米今天宣布开源首个原生端到端语音大模型 Xiaomi-MiMo-Audio,首次在语音领域实现基于 ICL 的少样本泛化

据小米介绍,五年前 GPT-3 首次展示了通过自回归语言模型 + 大规模无标注数据训练,获得 In-Context Learning(ICL,上下文学习)能力,而在语音领域,现有的大模型仍严重依赖大规模标注数据难以适应新任务达到类人智能

而 Xiaomi-MiMo-Audio 模型打破了这种瓶颈,它基于创新预训练架构和上亿小时训练数据,在智商、情商、表现力与安全性在内的跨模态对齐能力均有提升,在自然度、情感表达和交互适配方面呈现出拟人化水准

这款模型的具体创新点如下:

  • 首次证明把语音无损压缩预训练 Scaling 至 1 亿小时可以“涌现”出跨任务的泛化性,表现为 Few-Shot Learning 能力。

阅读全文
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

男博主曝马思唯易梦玲已分手!

SwagFuck 浏览 19066

不想过年的年轻人,躲回工作中

刺猬公社 浏览 12207

队记曝火箭无摆烂可能:13项筹码剑指四替补中锋 白魔崛起改1设想

颜小白的篮球梦 浏览 12481

羊绒专场|| 如果秋冬只买一件针织衫,我一定毫不犹豫选它(已穿上)

黎贝卡的异想世界 浏览 1881

婚变传闻仅5天,窦骁大学同学为其发声

做一个合格的吃瓜群众 浏览 915

60岁陈冲不服老 腰细腿长身材一点没走样

双鱼爱畅谈 浏览 19809

道指收跌0.07%,英特尔跌超7%

中新经纬 浏览 209

王宝强没想到,和马蓉离婚9年后,自己的一双儿女开始为他争光了

TVB的四小花 浏览 1662

男子预定90万雷克萨斯提车时被加价10万 4S店不服调查

澎湃新闻 浏览 78045

伯利再挖布莱顿,邮报:前布莱顿技术总监威尔加盟斯特拉斯堡

懂球帝 浏览 756

中方公布重要证据后 日本防卫大臣只得改口但依然狡辩

环球时报国际 浏览 4755

伊姐周日热推:电视剧《三人行》;电视剧《棕眼之谜》......

伊周潮流 浏览 713

杨丞琳霸气回怼网友恶意截图:称其为霸凌行为

网易娱乐 浏览 19228

朱媛媛离世5月后,辛柏青再传坏消息

乡野小珥 浏览 1054

媒体:2个月被罚4.3亿美元 "成功商人"特朗普遭受重创

新京报外事儿 浏览 79366

外媒:德甲球队达姆施塔特与美因茨有意26岁韩国国脚白昇浩

懂球帝 浏览 13367

日本加息,“可怕”的逻辑拆解

郎club 浏览 14905

詹俊:你对去年世界杯阿澳之战印象最深的一幕?对今晚有啥期待?

直播吧 浏览 15928

武磊谈亚洲杯目标:争取超上届8强战绩!会把输港队的压力变动力

我爱英超 浏览 12911

美泄密文件爆新料 北约被指在乌克兰部署特种部队

环球网资讯 浏览 18885

听我一句劝:中年男人最好少戴围巾、帽子,不是显老就是装嫩!

潮人志Fashion 浏览 13415
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1