关闭广告

7B大模型测试成绩超GPT-4！微软新研究解决工具调用难题

智东西11409人阅读

智东西
作者徐珊
编辑云鹏

智东西3月11日消息，近日微软和俄亥俄州立大学的研究人员发布论文，提出了一种受到生物启发的可以增强大语言模型使用工具能力的方法，即模拟试错（STE）法，并将其开源。

该方法协调了试错、想象和记忆三个关键机制。具体而言，STE通过大模型的“想象力”来模拟使用工具的一些合理场景，从而尝试适配不同的大模型，随后从新的反馈中，获得反馈不断优化。

ToolBench实验结果显示，STE在上下文学习和微调设置下显著提高了大语言模型的工具学习能力，让Mistral-Instruct-7B实现了46.7%的性能提升，使其成绩超过了GPT-4。

阅读全文

版权与免责声明：本文内容转载自其他媒体，目的在于传递更多信息，不代表本网观点或立场，不承担此类作品侵权行为的自己责任及连带责任。

精彩推荐

美政府停摆15天白宫放话要裁1万人女法官颁令叫停

红星新闻浏览 6245

外交部回应＂认为拜登和特朗普中哪位对华最强硬＂提问

环球网资讯浏览 83712

问界真正最大的威胁，恐怕压根不是比亚迪，而是赋能自己的华为

车有梗浏览 12617

政府“停摆”持续，美国家核安全管理局千余名员工将被强制休假

界面新闻浏览 952

哈马斯称将把加沙地带行政控制权移交临时委员会

环球网资讯浏览 794

李国庆怎么看中年失业：别跟年轻人争实在不行开滴滴

手机中国浏览 27106

俄媒：苏罗维金已被捕在叛乱期间站普里戈任一边

财联社浏览 15892

俄大幅加税中国汽车出口骤降58% 有商家暂停对俄业务

每日经济新闻浏览 5049

核污水流向大海：日本福岛核事故4549天后，新危机到来

澎湃新闻浏览 14498

77亿的工厂16亿卖自主“捡漏”合资产能背后的车市剧变

道哥说车浏览 445

1-9月百万级豪车销量：奔驰3款入榜，奥迪出局，仰望U8苦苦支撑？

AGKC阿贵艺车浏览 753

重磅改革三周年，8000字最新分析来了！

中国基金报浏览 14759

中国脑机接口发展提速：“机智”上新，从实验室走向市场

第一财经资讯浏览 10859

临近瓦格纳不复存在之日普里戈任的飞机在两国间穿梭

红星新闻浏览 92171

美院硕士在母校附近摆摊卖包子火了父母也来陪他创业

都市快报橙柿互动浏览 11676

iPhone15已试产！富士康8000奖金招工求职者不想进厂

时代财经浏览 16027

美英打击胡塞武装行动规模或限定在“小范围”

澎湃新闻浏览 12587

问界“失去”华为70天

市界浏览 16676

切费林：我认为球员在赛季结束后，至少应该有一个月假期

懂球帝浏览 729

50+女人别穿得“老气横秋”！掌握3个穿搭密码，减龄又优雅

静儿时尚达人浏览 366

秦雯自曝袭警被抓后，让王家卫捞人找自己?

芊手若浏览 723

7B大模型测试成绩超GPT-4！微软新研究解决工具调用难题

职场“关系户...

广西拟出新规...

药材遭哄抢女...

程强：缩量反...

冲击月销2万...

河南最大城商...

进行大量体能训练恢复，博格巴：我好像签约了马拉松俱乐部

克雷斯波：齐尔克泽有巨大潜力，但卢卡库更适合现在的米兰

身材走样的中年女人，请认准这三条搭配技巧，照着学优雅又时尚

美政府停摆15天白宫放话要裁1万人女法官颁令叫停

外交部回应＂认为拜登和特朗普中哪位对华最强硬＂提问

问界真正最大的威胁，恐怕压根不是比亚迪，而是赋能自己的华为

政府“停摆”持续，美国家核安全管理局千余名员工将被强制休假

哈马斯称将把加沙地带行政控制权移交临时委员会

李国庆怎么看中年失业：别跟年轻人争实在不行开滴滴

俄媒：苏罗维金已被捕在叛乱期间站普里戈任一边

俄大幅加税中国汽车出口骤降58% 有商家暂停对俄业务

核污水流向大海：日本福岛核事故4549天后，新危机到来

77亿的工厂16亿卖自主“捡漏”合资产能背后的车市剧变

1-9月百万级豪车销量：奔驰3款入榜，奥迪出局，仰望U8苦苦支撑？

重磅改革三周年，8000字最新分析来了！

中国脑机接口发展提速：“机智”上新，从实验室走向市场

临近瓦格纳不复存在之日普里戈任的飞机在两国间穿梭

美院硕士在母校附近摆摊卖包子火了父母也来陪他创业

iPhone15已试产！富士康8000奖金招工求职者不想进厂

美英打击胡塞武装行动规模或限定在“小范围”

问界“失去”华为70天

切费林：我认为球员在赛季结束后，至少应该有一个月假期

50+女人别穿得“老气横秋”！掌握3个穿搭密码，减龄又优雅

秦雯自曝袭警被抓后，让王家卫捞人找自己?

7B大模型测试成绩超GPT-4！微软新研究解决工具调用难题

职场“关系户...

广西拟出新规...

药材遭哄抢女...

程强：缩量反...

冲击月销2万...

河南最大城商...

进行大量体能训练恢复，博格巴：我好像签约了马拉松俱乐部

克雷斯波：齐尔克泽有巨大潜力，但卢卡库更适合现在的米兰

身材走样的中年女人，请认准这三条搭配技巧，照着学优雅又时尚

美政府停摆15天白宫放话要裁1万人 女法官颁令叫停

外交部回应＂认为拜登和特朗普中哪位对华最强硬＂提问

问界真正最大的威胁，恐怕压根不是比亚迪，而是赋能自己的华为

政府“停摆”持续，美国家核安全管理局千余名员工将被强制休假

哈马斯称将把加沙地带行政控制权移交临时委员会

李国庆怎么看中年失业：别跟年轻人争 实在不行开滴滴

俄媒：苏罗维金已被捕 在叛乱期间站普里戈任一边

俄大幅加税中国汽车出口骤降58% 有商家暂停对俄业务

核污水流向大海：日本福岛核事故4549天后，新危机到来

77亿的工厂16亿卖 自主“捡漏”合资产能背后的车市剧变

1-9月百万级豪车销量：奔驰3款入榜，奥迪出局，仰望U8苦苦支撑？

重磅改革三周年，8000字最新分析来了！

中国脑机接口发展提速：“机智”上新，从实验室走向市场

临近瓦格纳不复存在之日 普里戈任的飞机在两国间穿梭

美院硕士在母校附近摆摊卖包子火了 父母也来陪他创业

iPhone15已试产！富士康8000奖金招工 求职者不想进厂

美英打击胡塞武装 行动规模或限定在“小范围”

问界“失去”华为70天

切费林：我认为球员在赛季结束后，至少应该有一个月假期

50+女人别穿得“老气横秋”！掌握3个穿搭密码，减龄又优雅

秦雯自曝袭警被抓后，让王家卫捞人找自己?

美政府停摆15天白宫放话要裁1万人女法官颁令叫停

李国庆怎么看中年失业：别跟年轻人争实在不行开滴滴

俄媒：苏罗维金已被捕在叛乱期间站普里戈任一边

77亿的工厂16亿卖自主“捡漏”合资产能背后的车市剧变

临近瓦格纳不复存在之日普里戈任的飞机在两国间穿梭

美院硕士在母校附近摆摊卖包子火了父母也来陪他创业

iPhone15已试产！富士康8000奖金招工求职者不想进厂

美英打击胡塞武装行动规模或限定在“小范围”