关闭广告

杜克大学团队重磅发现:AI语音助手为何在复杂思考时"掉线"?

科技行者4482人阅读


这项由杜克大学林月倩、胡正绵领导,联合Adobe公司研究团队完成的重要研究发表于2025年,论文编号为arXiv:2509.26542v1,有兴趣深入了解的读者可以通过该编号查询完整论文。研究团队首次系统性地揭示了一个令人困惑的现象:当我们用语音与AI助手交流时,它们在处理复杂问题时的表现会大幅下降,这种现象被称为"语音推理鸿沟"。

当你向Siri询问简单的天气信息时,它能迅速准确地回答你。但如果你让它解一道复杂的数学题,或者分析一个需要多步推理的问题,你会发现它的表现远不如你通过文字输入同样问题时的效果。这种差异并非偶然,而是当前语音AI系统普遍存在的根本性挑战。

研究团队通过构建一个名为VERA的全新评测体系,对12个主流语音AI系统进行了深入测试。结果令人震惊:在复杂数学推理任务中,顶级文字AI模型GPT-5能达到74.8%的准确率,而其语音版本GPT-realtime却只有6.1%的准确率,两者相差高达68.7个百分点。这种差距并非个例,在所有需要深度思考的任务中都普遍存在。

这个发现的重要性不言而喻。在人工智能快速发展的今天,语音交互已经成为我们与AI系统沟

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

自动驾驶行业变天了!英伟达下场,要做“Robotaxi的安卓”?

雷科技 浏览 4402

OpenAI 呼吁美国政府将芯片法案的税收抵免扩大至 AI 数据中心

IT之家 浏览 4331

电车购置税补贴减半在即,这场兜底之战谁敢不打?

汽车公社 浏览 4447

格陵兰岛居民愤怒:商店里的枪支都快卖光了

环球网资讯 浏览 8042

直击MWC2026|AI重构通信网络,6G“卡位战”提前到来

第一财经资讯 浏览 2792

谷歌IMO金牌级Gemini 3深夜上线!华人大神挂帅,OpenAI无力反击

新智元 浏览 3195

邮报:法布雷加斯和特里不在切尔西新帅候选名单上

懂球帝 浏览 3650

伊敏百台无人矿卡常态化安全稳定运行超180天,单日产量创新高

IT之家 浏览 3466

海外市场成行业“香饽饽”,小米汽车也想“分一杯羹”

雷达财经 浏览 1236

光伏“卖铲人”去年净利腰斩

网易财经 浏览 2946

美国政府未偿国债首次突破30万亿美元,自2018年以来翻一番

华尔街见闻官方 浏览 4065

法国展示“凯撒”自行榴弹炮 承诺继续向乌交付

环球网资讯 浏览 4537

输水晶宫,斯洛特怨弗林蓬爱进攻?

体坛周报 浏览 5086

紫牛头条|小伙用激光把南京夫子庙扫描做成3D游戏 1:1还原精度到厘米,网友:可以赛博旅游了

扬子晚报 浏览 4638

美方公开核航弹测试画面

北京青年报 浏览 3109

北大腾讯团队只改一行代码,让AI图像生成效果提升20%!

科技行者 浏览 3331

热议日本3-2巴西:几十年认准一条路;人家从容我们连滚带爬

懂球帝 浏览 4556

“窝囊”35年没人理!直到遇66岁迟蓬才大火

苏子Vlog一 浏览 3668

特朗普发布“致命打击”画面 委内瑞拉:美国不宣而战

上观新闻 浏览 5309

国米本赛季11粒进球中4粒来自角球,身高超1.88米的球员有10位

直播吧 浏览 5246

会打扮的中年女人,冬季穿搭靠这3个套路封神!保暖还时髦

静儿时尚达人 浏览 3928
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1