关闭广告

7B大模型测试成绩超GPT-4!微软新研究解决工具调用难题

智东西11409人阅读


智东西
作者 徐珊
编辑 云鹏

智东西3月11日消息,近日微软和俄亥俄州立大学的研究人员发布论文,提出了一种受到生物启发的可以增强大语言模型使用工具能力的方法,即模拟试错(STE)法,并将其开源。

该方法协调了试错、想象和记忆三个关键机制。具体而言,STE通过大模型的“想象力”来模拟使用工具的一些合理场景,从而尝试适配不同的大模型,随后从新的反馈中,获得反馈不断优化。

ToolBench实验结果显示,STE在上下文学习和微调设置下显著提高了大语言模型的工具学习能力,让Mistral-Instruct-7B实现了46.7%的性能提升,使其成绩超过了GPT-4。

阅读全文
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

美政府停摆15天白宫放话要裁1万人 女法官颁令叫停

红星新闻 浏览 6245

外交部回应"认为拜登和特朗普中哪位对华最强硬"提问

环球网资讯 浏览 83712

问界真正最大的威胁,恐怕压根不是比亚迪,而是赋能自己的华为

车有梗 浏览 12617

政府“停摆”持续,美国家核安全管理局千余名员工将被强制休假

界面新闻 浏览 952

哈马斯称将把加沙地带行政控制权移交临时委员会

环球网资讯 浏览 794

李国庆怎么看中年失业:别跟年轻人争 实在不行开滴滴

手机中国 浏览 27106

俄媒:苏罗维金已被捕 在叛乱期间站普里戈任一边

财联社 浏览 15892

俄大幅加税中国汽车出口骤降58% 有商家暂停对俄业务

每日经济新闻 浏览 5049

核污水流向大海:日本福岛核事故4549天后,新危机到来

澎湃新闻 浏览 14498

77亿的工厂16亿卖 自主“捡漏”合资产能背后的车市剧变

道哥说车 浏览 445

1-9月百万级豪车销量:奔驰3款入榜,奥迪出局,仰望U8苦苦支撑?

AGKC阿贵艺车 浏览 753

重磅改革三周年,8000字最新分析来了!

中国基金报 浏览 14759

中国脑机接口发展提速:“机智”上新,从实验室走向市场

第一财经资讯 浏览 10859

临近瓦格纳不复存在之日 普里戈任的飞机在两国间穿梭

红星新闻 浏览 92171

美院硕士在母校附近摆摊卖包子火了 父母也来陪他创业

都市快报橙柿互动 浏览 11676

iPhone15已试产!富士康8000奖金招工 求职者不想进厂

时代财经 浏览 16027

美英打击胡塞武装 行动规模或限定在“小范围”

澎湃新闻 浏览 12587

问界“失去”华为70天

市界 浏览 16676

切费林:我认为球员在赛季结束后,至少应该有一个月假期

懂球帝 浏览 729

50+女人别穿得“老气横秋”!掌握3个穿搭密码,减龄又优雅

静儿时尚达人 浏览 366

秦雯自曝袭警被抓后,让王家卫捞人找自己?

芊手若 浏览 723
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1