关闭广告

杜克大学团队重磅发现:AI语音助手为何在复杂思考时"掉线"?

科技行者4160人阅读


这项由杜克大学林月倩、胡正绵领导,联合Adobe公司研究团队完成的重要研究发表于2025年,论文编号为arXiv:2509.26542v1,有兴趣深入了解的读者可以通过该编号查询完整论文。研究团队首次系统性地揭示了一个令人困惑的现象:当我们用语音与AI助手交流时,它们在处理复杂问题时的表现会大幅下降,这种现象被称为"语音推理鸿沟"。

当你向Siri询问简单的天气信息时,它能迅速准确地回答你。但如果你让它解一道复杂的数学题,或者分析一个需要多步推理的问题,你会发现它的表现远不如你通过文字输入同样问题时的效果。这种差异并非偶然,而是当前语音AI系统普遍存在的根本性挑战。

研究团队通过构建一个名为VERA的全新评测体系,对12个主流语音AI系统进行了深入测试。结果令人震惊:在复杂数学推理任务中,顶级文字AI模型GPT-5能达到74.8%的准确率,而其语音版本GPT-realtime却只有6.1%的准确率,两者相差高达68.7个百分点。这种差距并非个例,在所有需要深度思考的任务中都普遍存在。

这个发现的重要性不言而喻。在人工智能快速发展的今天,语音交互已经成为我们与AI系统沟

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

4年半亏了165亿,百亿基金经理被告上法庭

深蓝财经 浏览 3261

卫星图像显示伊朗恰巴哈尔港附近海域现多艘油轮

财联社 浏览 33551

杜兰特:谢泼德站了出来,我甚至无法形容他今晚有多么出色

懂球帝 浏览 3410

杨明洋:感谢罗慕洛为我助攻,也感谢南通球迷一直支持我

懂球帝 浏览 4329

塞内加尔一度罢赛,摩洛哥足协投诉

体坛周报 浏览 3054

雷克萨斯,凭什么2025还能逆势增长?

汽车人传媒 浏览 3199

康师傅换帅!创始人之子接棒CEO,去年薪酬937万元

中国基金报 浏览 3518

健康活到100岁,科学能做些什么?@U35张汉林试图寻找衰老背后的“隐藏逻辑”

上观新闻 浏览 3303

美军参联会主席警告:对伊朗动武可能带来重大风险

央视新闻客户端 浏览 2572

中国第42次南极考察启航

环球网资讯 浏览 3993

杨紫扛剧女王不是白叫的,顶流胡歌也得给她作配

大黑爱旅游 浏览 3039

拉门斯:阿莫林把压力放在自己身上,他为我们承担了很多压力

懂球帝 浏览 4285

AI大模型"减肥"新突破:MWS AI团队让语言模型变小却更聪明

科技行者 浏览 4283

黄宗泽恭喜陈伟霆当爸,没想到隐藏那么深,怼记者做人别太八卦

扒虾侃娱 浏览 4236

京东把榜一大哥整不会了

老斯基财经 浏览 4095

中国曾经也有一家“OpenAI”

虎嗅APP 浏览 3750

“锂王”炒股,赚了111万,赔掉2000亿

大猫财经Pro 浏览 2588

Aqara绿米推出U400智能锁:自带UWB超宽带,可实现无感解锁

IT之家 浏览 3339

2026款小米SU7即将上市!最高纯电续航902Km

小史谈车 浏览 2189

配置升级 2026款雷克萨斯LS官图正式发布

车质网 浏览 3895

小米、小鹏拿证,多家车企晒L3自动驾驶牌照!司机离解放双手还有多远?

时代周报 浏览 3359
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1