关闭广告

杜克大学团队重磅发现:AI语音助手为何在复杂思考时"掉线"?

科技行者2688人阅读


这项由杜克大学林月倩、胡正绵领导,联合Adobe公司研究团队完成的重要研究发表于2025年,论文编号为arXiv:2509.26542v1,有兴趣深入了解的读者可以通过该编号查询完整论文。研究团队首次系统性地揭示了一个令人困惑的现象:当我们用语音与AI助手交流时,它们在处理复杂问题时的表现会大幅下降,这种现象被称为"语音推理鸿沟"。

当你向Siri询问简单的天气信息时,它能迅速准确地回答你。但如果你让它解一道复杂的数学题,或者分析一个需要多步推理的问题,你会发现它的表现远不如你通过文字输入同样问题时的效果。这种差异并非偶然,而是当前语音AI系统普遍存在的根本性挑战。

研究团队通过构建一个名为VERA的全新评测体系,对12个主流语音AI系统进行了深入测试。结果令人震惊:在复杂数学推理任务中,顶级文字AI模型GPT-5能达到74.8%的准确率,而其语音版本GPT-realtime却只有6.1%的准确率,两者相差高达68.7个百分点。这种差距并非个例,在所有需要深度思考的任务中都普遍存在。

这个发现的重要性不言而喻。在人工智能快速发展的今天,语音交互已经成为我们与AI系统沟

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

我国突破固态电池关键技术瓶颈

大象新闻 浏览 2799

脚踏实地"的机器人导航新方法,让AI助手像人类一样边思考边行动

科技行者 浏览 1830

50+女人别穿得“老气横秋”!掌握3个穿搭密码,减龄又优雅

静儿时尚达人 浏览 2231

警惕特朗普TACO交易割韭菜

尺度商业 浏览 2750

特斯拉Model3/ModelY Standard正式发布

网易汽车 浏览 2803

年度最嚣张女配:只给自己磨皮,却被观众偏爱

Yuki女人故事 浏览 1851

“softcore柔系美式”穿搭今年冬天爆火,松弛又减龄!

LinkFashion 浏览 1974

乐摩科技八成设备“躺”在影院

北京商报 浏览 2271

中美达成共识让美豆农松口气 盼望中方订单快点来

环球网资讯 浏览 13579

“青云租”爆雷员工揭内幕:每个员工每月需投资30台手机,11万台集中流向两个村庄

封面新闻 浏览 2472

上赛季至今五大联赛仅6人直接参与40球+:凯恩第1,青木在列

懂球帝 浏览 2015

五粮液前董事长李曙光被“双开”!卖酒类经销权牟利数额巨大,更多细节公布……

国际金融报 浏览 2669

跟队:纽卡vs巴萨赛前发布会上加泰记者很放松,还有人接电话

懂球帝 浏览 731

8.88万起终身质保 威麟R08把皮卡玩成“理财产品”

网易汽车 浏览 3568

30 个月,一个周榜的诞生与消失

晚点LatePost 浏览 2600

特朗普称取消与普京会晤并对俄实施新制裁 普京回应

每日经济新闻 浏览 5921

雅斯特酒店回应房客发病送药不及时死亡:送药者未告知病情,隐私考虑未查看药品

封面新闻 浏览 2225

Meta收购曾火爆一时的AI智能体社交网络Moltbook

IT之家 浏览 701

特朗普政府要求美国最高法院准许将美联储理事库克免职

华尔街见闻官方 浏览 3450

OpenAI更新ChatGPT使用政策,禁止提供专业医疗、法律和财务建议

IT之家 浏览 2445

《伟大的长征》首发预告,于和伟饰演毛泽东,总觉得差点意思

最爱酷影视 浏览 2778
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1