关闭广告

7B大模型测试成绩超GPT-4!微软新研究解决工具调用难题

智东西11398人阅读


智东西
作者 徐珊
编辑 云鹏

智东西3月11日消息,近日微软和俄亥俄州立大学的研究人员发布论文,提出了一种受到生物启发的可以增强大语言模型使用工具能力的方法,即模拟试错(STE)法,并将其开源。

该方法协调了试错、想象和记忆三个关键机制。具体而言,STE通过大模型的“想象力”来模拟使用工具的一些合理场景,从而尝试适配不同的大模型,随后从新的反馈中,获得反馈不断优化。

ToolBench实验结果显示,STE在上下文学习和微调设置下显著提高了大语言模型的工具学习能力,让Mistral-Instruct-7B实现了46.7%的性能提升,使其成绩超过了GPT-4。

阅读全文
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

落地为王:谁在用AI引领百亿价值跃迁?

虎嗅APP 浏览 364

刚呼吁中菲对话,菲律宾又出“幺蛾子”

浏览 10812

快被AI“杀死”的日本人?

观察者网 浏览 14449

伊姐周六热推:电视剧《亦舞之城》;电视剧《时差一万公里》......

伊周潮流 浏览 105

英伟达入股英特尔

北京商报 浏览 1776

瓦格纳总部大楼照常运营 在俄两地招募中心恢复工作

界面新闻 浏览 87153

凯特王妃妈妈才是“最强丈母娘”跨越阶层有多拼

商务范 浏览 16506

郭德纲官宣小儿子说相声!8岁安迪上台肚腩比爸大

夏冬爱搞笑 浏览 15521

拒绝对涉案做出反省 内塔尼亚胡请求特赦遭强烈抗议

环球网资讯 浏览 278

美国财长:美对俄等国经济制裁可能危及美元主导地位

环球网资讯 浏览 120844

林靖恩准备到国外去生活,不和亲生父母相认,只想开启新的人生

素素娱乐 浏览 12770

50多岁女人不要“装嫩”,掌握这些搭配原则,衣品提升一大截

静儿时尚达人 浏览 758

俄总统助理:普京和特朗普会晤意愿依旧存在

每日经济新闻 浏览 817

法拉第未来 Super One 迈入批量试制及生产阶段

IT之家 浏览 656

六王表演赛:辛纳2-0横扫阿卡,带走600万美金和一把纯金球拍

懂球帝 浏览 949

古天乐黄百鸣发文悼念吴孟达:他的精神永存

网易娱乐 浏览 26942

《燃冬》《雪豹》等华语片入围今年多伦多电影节

网易娱乐 浏览 15137

佟丽娅最新古装近照曝光!比李沁还漂亮,42岁第一次演仙侠剧

温柔娱公子 浏览 835

比亚迪唐DM-i保值率直逼汉兰达,只是巧合吗?

Nice好车 浏览 12920

66岁港星与太太秀恩爱 被指吃软饭遭太太出手维护

TVB剧评社 浏览 19247

普京:感谢中国对乌克兰问题采取平衡的态度

人民网-人民日报 浏览 109710
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1