关闭广告

小米开源语音大模型Xiaomi-MiMo-Audio,对话自然度达拟人水准

IT之家5223人阅读

IT之家 9 月 19 日消息,小米今天宣布开源首个原生端到端语音大模型 Xiaomi-MiMo-Audio,首次在语音领域实现基于 ICL 的少样本泛化

据小米介绍,五年前 GPT-3 首次展示了通过自回归语言模型 + 大规模无标注数据训练,获得 In-Context Learning(ICL,上下文学习)能力,而在语音领域,现有的大模型仍严重依赖大规模标注数据难以适应新任务达到类人智能

而 Xiaomi-MiMo-Audio 模型打破了这种瓶颈,它基于创新预训练架构和上亿小时训练数据,在智商、情商、表现力与安全性在内的跨模态对齐能力均有提升,在自然度、情感表达和交互适配方面呈现出拟人化水准

这款模型的具体创新点如下:

  • 首次证明把语音无损压缩预训练 Scaling 至 1 亿小时可以“涌现”出跨任务的泛化性,表现为 Few-Shot Learning 能力。

阅读全文
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

叙利亚过渡政府宣布延长停火15天

上观新闻 浏览 3389

李连杰“一夜回春”澄清1个月,小动作不断,一切都完全藏不住了

肆季娱乐 浏览 3352

服装AB版带货套路:消费欺诈不能成行业“潜规则”丨中听

大象新闻 浏览 4247

诺贝尔文学奖得主迷恋中国 要求全家改用筷子吃饭

中国新闻周刊 浏览 4599

上海校园餐背后的供应商,越挖越让人心惊!

功夫财经 浏览 5464

李羲承退出ENHYPEN,组合未来将以六人形式活动

精彩背后的故事 浏览 2718

苹果欲推首款低价Mac,定价远低于1000美元,挑战微软与Chromebook

华尔街见闻官方 浏览 4232

全是感动!《许我耀眼》33集大结局,是我今年看过最泪奔的大结局

娱乐圈笔娱君 浏览 4532

多队渴望挖角祖巴茨 快艇沉没散场时间或提前到来

体坛周报 浏览 3924

时隔一年重要大会在东南沿海大省举办 出现新变化

政知新媒体 浏览 10466

新能源汽车的轮胎,为啥那么贵?

小李车评李建红 浏览 4550

美媒:中美之间一个变化正在显现 欧盟总部相当纠结

环球时报国际 浏览 13923

享界S9同款平台,极狐全新MPV也有小蓝灯

爱驾天下 浏览 3877

中科院突破:AI实现持续学习不忘旧知

科技行者 浏览 4593

小伙去理发被店家弄到VIP房间后脸白了 联系父母要钱

1818黄金眼 浏览 13317

缅甸突袭KK园区后引发"招聘潮" 有人被7万美元"转卖"

红星新闻 浏览 17120

不出意外霍启山很难结婚不是因为他遇到自己

科学发掘 浏览 3816

理想汽车下摆臂异响补偿方案发布月余,多位车主投诉称遭区别对待

澎湃新闻 浏览 5439

多位老人痴迷买保健品:有人甚至吞安眠药逼女儿妥协

新京报 浏览 7347

消费降级2年,大家2025年还会买什么?

黎贝卡的异想世界 浏览 4480

奔驰兜里还有多少牌?

禾颜阅车 浏览 768
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1