关闭广告

香港科技大学团队发现形式化验证如何让AI推理更聪明

科技行者1433人阅读


这是一个关于人工智能如何学会更好地思考的故事。想象一下,你在教一个聪明但有点"散漫"的孩子做数学题。这个孩子通常能猜对答案,但他的推理过程常常有漏洞——他会说"因为看起来对所以就对了",而不是真正理解为什么。如今,来自香港科技大学、上海人工智能实验室、浙江大学和香港浸会大学的研究团队发现了一个巧妙的办法,让这个"散漫的孩子"学会了像数学家一样严谨地思考。这项研究发表于2026年1月,论文编号为arXiv:2601.22642。

这个故事的核心很有趣:当今最强大的语言模型,比如ChatGPT和Claude,在处理复杂推理问题时,常常会犯一个致命的错误。它们会生成看似合理但逻辑上存在严重漏洞的答案。研究人员的发现更是令人担忧——即使在最终答案是对的情况下,推理过程中有39.3%的步骤在形式化验证中被"驳回"了。而当答案错误时,这个比例甚至高达52.4%。这就像一个学生虽然最后得到了正确答案,但他的计算过程完全是错的——纯粹是靠运气或者模式识别碰巧得对了。

研究团队的创新之处在于,他们不是简单地让AI生成答案就完事,而是在推理的每一步都加入了一个"严厉的数学老师"——形式化验证系统。这个"老师"会实时检查每

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

A股年内近160股易主

北京商报 浏览 2204

赵丽颖好事将近?闺蜜给她的生日祝福好微妙,被怀疑恋情有新进展

萌神木木 浏览 2697

全尺寸货运版eVTOL样机已总装下线,「蓝霄航空」完成新一轮数千万元融资,年内累计融资近亿元|36氪首发

36氪 浏览 2799

同样被网友玩梗,李湘给张纪中“上了一课”?

深析古今 浏览 2141

科技范儿·在现场|“AI+智能座舱”让每次出发都是“懂你的陪伴”

上游新闻 浏览 1976

电动Jeep曝新国产计划:或使用猛士技术,首车在2027年上市

明镜pro 浏览 2847

时间的“相对论”:为什么我们总觉得时间越跑越快?『心灵加油站』(271)

我们的太空 浏览 2016

尤文啃下硬骨头 斯帕莱蒂拿到“最重要的胜利”

体坛周报 浏览 1995

乌克兰总统期待见特朗普谈“安全保障期限”

环球网资讯 浏览 1666

男子将热水器钢管通电致妻子触电身亡 女儿向法院求情

红星新闻 浏览 9542

官方:福建浔兴SBS俱乐部签下法国中锋约安-马昆杜

懂球帝 浏览 743

吉利陈奇:L3全场景普及仍需时间,安全与成本平衡是行业关键

网易汽车 浏览 2536

77亿的工厂16亿卖 自主“捡漏”合资产能背后的车市剧变

道哥说车 浏览 2298

李亚鹏带货卖超千万?网友说他是不会蹭热度的人

安宁007 浏览 1576

上汽零售赶超比亚迪

大象新闻 浏览 1698

离婚4年,42岁佟丽娅高调官宣喜讯

刘森森 浏览 2529

中美俄都不想的事出现 欧尔班面临下台特朗普力保没用

博览历史 浏览 12850

警方通报于朦胧坠亡,3位造谣者被处罚,调取监控排除刑事嫌疑

扒虾侃娱 浏览 3495

10.58 万!零跑造了一台「红米 YU7」

极客公园 浏览 2515

搭第四代MBUX系统 奔驰纯电GLC亮相2026 CES

车质网 浏览 1672

斯图里奇:阿森纳踢得非常老练,他们传球精准&决策出色

懂球帝 浏览 1985
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1