关闭广告

o1之后下一个范式?隐式CoT大突破,让推理不再「碎碎念」

机器之心Pro3188人阅读



魏熙林为本篇文章第一作者。魏熙林是复旦大学博士生,师从林达华教授,研究兴趣主要集中在 multi-modal LLMs 和 efficient AI。目前在上海人工智能实验室实习,指导 mentor 是臧宇航、王佳琦。

今天推荐一个 Implicit Chain-of-Thought(隐式推理) 的最新进展 ——SIM-CoT(Supervised Implicit Chain-of-Thought)。它直击隐式 CoT 一直「扶不起来」的核心痛点:隐式 token 一旦 scale 上去,训练就容易塌缩到同质化的 latent 状态,推理语义直接丢失。

SIM-CoT 的关键招式是一个 plug-and-play 的 step-level 监督模块:训练时用辅助解码器把每个 latent token「拉回」到可对齐的推理步骤上,既稳住优化、避免 collapse,又让隐式推理第一次真正可解释 —— 你甚至能把每个 latent token 解码成人类可读的中间推理步骤。

更爽的是:推理阶段零额外开销(辅助解码器训练完就丢),但效果却很猛:在 GPT-2 上相

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

飞天茅台批价首次跌破1700元,机构称“白酒需求仍在磨底阶段”

YOUNG财经 浏览 4257

房企开年集体“变阵”:人事调整与架构重塑背后的生存新法则

拾盐士 浏览 3306

乌总统:美方28点计划已有所精简

每日经济新闻 浏览 3955

老实人狂野起来 卡罗拉概念车拒当“买菜车”

网易汽车 浏览 4183

携手华为!横琴基地每年将培养3000名“数智人才”

海外网 浏览 3290

解密福建舰电磁弹射背后的硬核支撑

上观新闻 浏览 4068

业绩承压借款激增 林平发展“带伤”闯关IPO

北京商报 浏览 3875

上年纪的女人买“上衣”:避开3个坑,这样选时髦又显气质

静儿时尚达人 浏览 3239

还得是她!杀疯了,也杀爽了!

吐槽电影院 浏览 2791

关键时刻又崩!许利民发布会罕见发怒,却甩锅球员态度与球员能力

篮球资讯达人 浏览 3488

不是谁弱谁有理,何美延只是说的好听

小椰的奶奶 浏览 3160

KAIST团队突破视频生成瓶颈:让AI学会"自我反思"修正动作错误

科技行者 浏览 3293

中方在联合国点名日本 呼吁警惕其涉核消极动向

极目新闻 浏览 1207

章子怡晒照为女儿醒醒庆生!

韩小娱 浏览 2895

黎真主党发射火箭弹 回应以违反停火协议

环球网资讯 浏览 1772

可磁吸绝配iPhone!长江存储致态灵潮流版移动SSD 2TB图赏

快科技 浏览 3633

2天票房3亿,看完《疯狂动物城2》,我想说:好莱坞大片赌对了

娱乐圈笔娱君 浏览 3945

里程碑,勇士主帅科尔取生涯执教第600胜&位列NBA第28位

懂球帝 浏览 2384

又一部国产剧,靠「擦边」火出圈了

独立鱼 浏览 3134

特斯拉深度解读|马斯克的2025 CEO绩效奖

不看车bukanche 浏览 4525

沈逸:美国威胁不买中国"地沟油" 已被拆解得体无完肤

澎湃新闻 浏览 8499
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1