关闭广告

7B大模型测试成绩超GPT-4!微软新研究解决工具调用难题

智东西11397人阅读


智东西
作者 徐珊
编辑 云鹏

智东西3月11日消息,近日微软和俄亥俄州立大学的研究人员发布论文,提出了一种受到生物启发的可以增强大语言模型使用工具能力的方法,即模拟试错(STE)法,并将其开源。

该方法协调了试错、想象和记忆三个关键机制。具体而言,STE通过大模型的“想象力”来模拟使用工具的一些合理场景,从而尝试适配不同的大模型,随后从新的反馈中,获得反馈不断优化。

ToolBench实验结果显示,STE在上下文学习和微调设置下显著提高了大语言模型的工具学习能力,让Mistral-Instruct-7B实现了46.7%的性能提升,使其成绩超过了GPT-4。

阅读全文
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

雷恩vs欧塞尔:恩博洛、塞科-福法纳首发,西纳约科、易卜拉欣-奥斯曼出战

懂球帝 浏览 938

菲总统马科斯访问越南,大米是焦点

环球网资讯 浏览 12743

中国基站现身阿布扎比 可远程遥控远在珠海的无人艇

枢密院十号 浏览 92567

苹果股价创历史新高

都市快报橙柿互动 浏览 988

中石油原副总经理徐文荣被查 落马时机引人关注

中国新闻周刊 浏览 88763

缅甸政府军突袭KK园区 查获30套星链设备

红星新闻 浏览 6171

坚持10年做这件小事,我收获了太多

黎贝卡的异想世界 浏览 942

哈马斯方面拒绝布林肯访问加沙地带

界面新闻 浏览 12522

台"馆长"称"把赖清德狗头斩下来" 遭民进党当局约谈

环球时报新闻 浏览 17911

燃油车的“智能”反击!2025广州车展燃油新车盘点

车市红点 浏览 412

日本核污水排海,上海部分中高端日料店“地震”?

澎湃新闻 浏览 14911

讲解员回忆杨振宁95岁来访两弹城:他说这个时代特别需要“两弹一星”精神

封面新闻 浏览 995

替补都很强!布歇7中7砍17分9板 施罗德13分3板4助 特伦特14分

直播吧 浏览 12862

春天最怕乱穿衣,掌握这些气质打扮技巧,50岁女人也美得轻松

静儿时尚达人 浏览 12606

就两岸关系 郑丽文、马英九最新表态

新京报政事儿 浏览 5648

泽连斯基称德国已向乌交付“爱国者”防空导弹系统

环球网资讯 浏览 728

相恋6年"军官女友"收60余万后消失 警方证实其已落网

红星新闻 浏览 16481

2号种子险爆冷!张本智和打满5局逆转日本悍将,8强战约战勒布伦

乒谈 浏览 830

特斯拉新版Model Y实车现身!优化调整,预计最快10月下线

车矩阵更懂车 浏览 12769

队记:惠特摩尔可能很难立刻获得机会 他预计会去毒蛇队锻炼

直播吧 浏览 15455

宁波方正携手山东未来机器人,聚焦深海机器人业务

财闻 浏览 838
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1