关闭广告

杜克大学团队重磅发现:AI语音助手为何在复杂思考时"掉线"?

科技行者827人阅读


这项由杜克大学林月倩、胡正绵领导,联合Adobe公司研究团队完成的重要研究发表于2025年,论文编号为arXiv:2509.26542v1,有兴趣深入了解的读者可以通过该编号查询完整论文。研究团队首次系统性地揭示了一个令人困惑的现象:当我们用语音与AI助手交流时,它们在处理复杂问题时的表现会大幅下降,这种现象被称为"语音推理鸿沟"。

当你向Siri询问简单的天气信息时,它能迅速准确地回答你。但如果你让它解一道复杂的数学题,或者分析一个需要多步推理的问题,你会发现它的表现远不如你通过文字输入同样问题时的效果。这种差异并非偶然,而是当前语音AI系统普遍存在的根本性挑战。

研究团队通过构建一个名为VERA的全新评测体系,对12个主流语音AI系统进行了深入测试。结果令人震惊:在复杂数学推理任务中,顶级文字AI模型GPT-5能达到74.8%的准确率,而其语音版本GPT-realtime却只有6.1%的准确率,两者相差高达68.7个百分点。这种差距并非个例,在所有需要深度思考的任务中都普遍存在。

这个发现的重要性不言而喻。在人工智能快速发展的今天,语音交互已经成为我们与AI系统沟

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

倪妮告秦雯和王家卫!?

八卦疯叔 浏览 744

青海13人被淤泥掩埋失联 家属昼夜未合眼在现场守候

极目新闻 浏览 75427

反转!曝何超莲婚礼是亲妈出钱,窦骁不愿签婚前协议,所以没领证

萌神木木 浏览 906

大陆启动贸易壁垒调查后通过WTO通知 台方称超乎预期

环球网资讯 浏览 121534

“罗小黑”热度不减 中文在线尚未跑通IP

北京商报 浏览 372

看来看去这些才是适合普通人穿搭,不必花枝招展,简单又舒适

静儿时尚达人 浏览 2054

深度:再次成为军事强国?德国军改引关注

环球网资讯 浏览 13242

47岁李小冉拍外景戏肤白貌美 一旁大爷表情抢镜

叶公子 浏览 14020

抖音饿了么双双辟谣收购传闻 美团躺枪一度下跌超8%

财联社 浏览 12945

标配激光雷达、磁流变悬架 深蓝L06预售13.99万元起

网易汽车 浏览 757

57岁泰国华裔富婆出席亿万富豪婚礼 穿蓝色蕾丝裙好嫩

时尚丽人风行 浏览 79140

币圈大佬的重生:特朗普特赦赵长鹏

节点财经 浏览 872

高市闯了大祸日方意识到大事不妙 中国有权在日本驻军

时时有聊 浏览 31998

这是我见过最优雅的女人,穿衣不花哨、不油腻,50岁也很高级

静儿时尚达人 浏览 12921

近距离感受国之重器:第一视角看亚洲首个电磁弹射微重力实验装置

IT之家 浏览 1009

SU7失控起火致1死 小米官方和雷军始终未直接回应

第一财经资讯 浏览 5094

戳破马拉松泡沫经济

诗与星空 浏览 951

外媒:中国即将发表的这份文件“备受期待”

参考消息 浏览 36191

林志玲一家三口同框!混血儿子亮相

娱絮 浏览 16432

中国世界领先装备“暴款”,打破“两党共识”

浏览 23198

别再尬吹“韩女”了,这才是韩国人该申遗的东西!

Yuki女人故事 浏览 14893
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1