关闭广告

苏州大学突破:8B模型实现长文理解媲美GPT-4o

科技行者4164人阅读


当我们阅读一本厚厚的小说时,大脑会自动筛选重要情节,忽略无关细节。然而,人工智能在处理长文本时却常常"迷失在细节中",就像一个初读者被海量信息淹没,难以抓住关键要点。现在,苏州大学的研究团队找到了解决这个问题的巧妙方法,他们提出的"语境降噪训练"技术,让AI模型学会了像经验丰富的读者一样,在冗长文本中精准定位关键信息。

这项由苏州大学唐泽成、季百倍、李俊涛等研究人员主导的突破性研究,于2025年1月发表在机器学习顶级预印本平台arXiv上(论文编号:arXiv:2510.05862v1)。令人振奋的是,通过他们的训练方法,一个仅有80亿参数的开源模型在处理长文本任务时,竟然达到了与GPT-4o相当的表现水平。这就好比一个刚入学的学生,通过特殊的学习方法,在阅读理解能力上追平了博士生。

长文本处理一直是AI领域的"老大难"问题。传统的语言模型在面对超长文档时,往往会被无关信息干扰,就像在嘈杂的派对上试图听清某个特定的对话一样困难。研究团队发现,这些模型虽然能"看到"整篇文档,却无法有效区分哪些内容真正重要,哪些只是"噪音"。

为了解决这个问题,研究人员开发了一种名为"语

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

国星宇航“星算”计划 02 组星座发布

IT之家 浏览 4540

在EasyClaw上,我轻松养出了自己的AI“龙虾”

光子星球 浏览 2494

斯帕莱蒂抵达尤文总部,受到球迷夹道欢迎

懂球帝 浏览 4198

窦骁何超莲不忍了合体发文,公开回应婚变

一娱三分地 浏览 4172

穿黑裤子别只会搭白T恤!看看这些显瘦的搭配,高级感拉满

静儿时尚达人 浏览 1126

xbench实验室发布:如何让AI代理真正走进普通用户的日常生活?

科技行者 浏览 3164

青春归来,76人主场换回艾弗森时期经典LOGO致敬01年总决赛赛季

懂球帝 浏览 4104

该不该踢双前锋?哲科:我说多了教练要生气

懂球帝 浏览 4380

英韧预计 2026 年推出 PCIe 6.0 AI SSD,支持 NVMe + CXL 双协议

IT之家 浏览 4926

中央网信办:就数字虚拟人信息服务管理办法面向全社会公开征求意见

红星新闻 浏览 1292

还在磨合纽卡夏窗花近2.8亿欧,英超开局仅1胜3平1负排第13

直播吧 浏览 5139

“多巴胺风”又又又火了!这样穿时髦又减龄

LinkFashion 浏览 3124

大搞权钱交易和家族式腐败 湖北省委原书记蒋超良被诉

扬子晚报 浏览 109917

瑞士国防军司令:为应对"俄罗斯风险"必须增加军费

澎湃新闻 浏览 3589

泰慕士脱敏狂飙

富凯财经 浏览 5068

今晚空降!傅东育又一力作来袭

娱乐圈笔娱君 浏览 3201

打通置换堵点!上海放大招:政府启动二手房收购

国际金融报 浏览 3156

千亿减肥药市场打响“地板价”争夺战

中国商报 浏览 3594

当“中国表格之王”开始发力多维表格

硅星人 浏览 4269

小鹏汽车正式登陆卡塔尔 多款产品亮相

网易汽车 浏览 3594

赫斯基:利物浦要改变打法去激活维尔茨,下赛季期待他的表现

懂球帝 浏览 547
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1