关闭广告

苏州大学突破:8B模型实现长文理解媲美GPT-4o

科技行者3947人阅读


当我们阅读一本厚厚的小说时,大脑会自动筛选重要情节,忽略无关细节。然而,人工智能在处理长文本时却常常"迷失在细节中",就像一个初读者被海量信息淹没,难以抓住关键要点。现在,苏州大学的研究团队找到了解决这个问题的巧妙方法,他们提出的"语境降噪训练"技术,让AI模型学会了像经验丰富的读者一样,在冗长文本中精准定位关键信息。

这项由苏州大学唐泽成、季百倍、李俊涛等研究人员主导的突破性研究,于2025年1月发表在机器学习顶级预印本平台arXiv上(论文编号:arXiv:2510.05862v1)。令人振奋的是,通过他们的训练方法,一个仅有80亿参数的开源模型在处理长文本任务时,竟然达到了与GPT-4o相当的表现水平。这就好比一个刚入学的学生,通过特殊的学习方法,在阅读理解能力上追平了博士生。

长文本处理一直是AI领域的"老大难"问题。传统的语言模型在面对超长文档时,往往会被无关信息干扰,就像在嘈杂的派对上试图听清某个特定的对话一样困难。研究团队发现,这些模型虽然能"看到"整篇文档,却无法有效区分哪些内容真正重要,哪些只是"噪音"。

为了解决这个问题,研究人员开发了一种名为"语

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

媒体:日本拥有核武器 只差一把"螺丝刀"

北京日报客户端-长安街知事 浏览 12829

“万元定价”已成新趋势?人形机器人也打起了价格战

澎湃新闻 浏览 4227

极氪2025年12月交付30267台 单月首破3万大关

网易汽车 浏览 2953

东体:傅欢大概率留在海港;防线还会是引援方向

懂球帝 浏览 2960

"10岁男孩被烟花炸伤头部身亡"案二审开庭 被告拒担责

极目新闻 浏览 9490

尼克斯大胜送黄蜂7连败 布伦森33分首发五人组狂轰111分

醉卧浮生 浏览 3840

大迫敬介:巴西的球员个人能力出色,高位逼抢可能会效果不佳

懂球帝 浏览 4326

涪陵榨菜的创业者们陆续退场

斑马消费 浏览 4512

本田全新缩小版“CR-V”上市!限时售价10.99万起,搭载1.5T+CVT

小史谈车 浏览 3145

剑南春|国米2-1客胜维罗纳,泽林斯基破门,皮奥造乌龙绝杀

懂球帝 浏览 3889

今年最火的4双平底鞋,配白裙子穿好看又松弛!

LinkFashion 浏览 1608

林心如曝与霍建华婚姻裂隙:孕期独守空房

一盅情怀 浏览 4185

世体:对阵贝蒂斯卢克曼将直接首发,完成加盟马竞后的首秀

懂球帝 浏览 2935

2胜5平,输给曼城后利兹联已连续7轮英超保持不败

懂球帝 浏览 3280

拜仁独撑门面,德甲遭遇欧冠至暗一周

体坛周报 浏览 3140

伊姐十一热推:电影《阿凡达:水之道》;电影《毕正明的证明》......

伊周潮流 浏览 3652

业绩承诺补偿“爽约”,鹏欣资源起诉公司实控人,此前收购金矿不赚反亏超3亿

红星资本局 浏览 3042

民营航天新年首战告捷:星河动力谷神星一号海上成功发射四星入轨

澎湃新闻 浏览 3105

74岁刘晓庆近况!生图皮肤白皙状态回春

艳儿说电影 浏览 3989

中方提醒中国游客避免前往日本 日媒:或造成重大影响

环球网资讯 浏览 43629

"民营船王"33亿元入主杉杉 继母长子内斗2年双双出局

都市快报橙柿互动 浏览 4304
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1