关闭广告

7B大模型测试成绩超GPT-4!微软新研究解决工具调用难题

智东西11395人阅读


智东西
作者 徐珊
编辑 云鹏

智东西3月11日消息,近日微软和俄亥俄州立大学的研究人员发布论文,提出了一种受到生物启发的可以增强大语言模型使用工具能力的方法,即模拟试错(STE)法,并将其开源。

该方法协调了试错、想象和记忆三个关键机制。具体而言,STE通过大模型的“想象力”来模拟使用工具的一些合理场景,从而尝试适配不同的大模型,随后从新的反馈中,获得反馈不断优化。

ToolBench实验结果显示,STE在上下文学习和微调设置下显著提高了大语言模型的工具学习能力,让Mistral-Instruct-7B实现了46.7%的性能提升,使其成绩超过了GPT-4。

阅读全文
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

跨时代的武侠视觉巨制,今晚迎来告别放映!

幕味儿 浏览 85

调离后"消失"2年多的宁夏"老虎"被公诉 细节首次披露

政知新媒体 浏览 78365

陈雨菲:戴资颖成就了自己;很珍惜安洗莹这个对手

懂球帝 浏览 1053

天空:德里赫特希望加盟曼联,而滕哈赫也想要他

直播吧 浏览 10767

内娱女明星手撕导演,翻车了?

独立鱼 浏览 606

消费股大爆发,但背后另有玄机!

君临财富 浏览 658

夏天最美的4个颜色,这样穿高级又时髦!

LinkFashion 浏览 11162

刘捍东被查:在南京工作超40年 多名前下属接连落马

中国新闻周刊 浏览 110521

稳了?皇马此前16次淘汰赛首回合取胜最终15次晋级

趣看热点 浏览 24877

哈马斯与法塔赫将在俄罗斯讨论组建巴政府

央视新闻客户端 浏览 12000

队记:惠特摩尔可能很难立刻获得机会 他预计会去毒蛇队锻炼

直播吧 浏览 15453

凌晨!全线大涨!美联储宣布:降息!鲍威尔重磅发声!

券商中国 浏览 104

美拉德失宠了?今年冬天最流行的3个颜色,谁穿谁好看!

LinkFashion 浏览 691

罗永浩还了4个亿是真的吗?他还要拍一部纪录片叫真还传

趣看热点 浏览 26316

这位意大利博主太惊艳 法式风不香了

八只爪的猫 浏览 16959

外交部回应布林肯称"美国将继续做中方不喜欢的事"

外交部网站 浏览 15552

方程豹首款车型“豹5”正式发布,“豹9”概念车同步亮相

界面新闻 浏览 14564

年中发布/细节升级 新款高尔夫R官方谍照来了

一猫说车 浏览 12423

追觅进入剃须刀市场推出首款产品“小胶囊S7 Pro”

IT之家 浏览 1068

4年1亿也能接受!曝湖人愿匹配任何里夫斯报价:为何仍准备替代者

罗说NBA 浏览 15756

9月中级车市场洗牌,新能源新兵为何也栽了跟头?

百姓评车 浏览 945
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1