关闭广告

Gemini修bug神了!录网页视频把代码库甩给它就行,网友坐不住了

量子位10387人阅读

西风 发自 凹非寺
量子位 | 公众号 QbitAI

谷歌Gemini修改bug让网友大开眼界!

X一小伙分享,为测试Gemini 1.5 Pro,自己在编写一个网页的代码时故意留了3个bug,并分别录制了网页bug视频。

接着把代码库打包成文件连同视频一起输给了Gemini 1.5 Pro,提示它找到并修复代码中的所有bug,且要提供一个简要指南以及所做更改的说明。

没想到,Gemini 1.5 Pro还真就分分钟正确识别并修复了每一个bug。



小伙将这种玩法po出来后热度不断攀升,网友们纷纷一键三连,转赞收藏量过万。

其本人还在评论区强调,“这只是一个简单的例子,也将是它最差的表现”,Gemini这小汁前途不可限量啊。



有网友表示想起来一件事觉得有趣:英伟达黄院士前段时间曾公开表示“孩子们以后不需要学编程了”,那时候还有很多人反对称“AI不会取代程序员”





但甭管怎么说,AI可以给程序员提供帮助是有目共睹的。



接下来我们展开来看Gemini 1.5 Pro修复bug的经过。

事件经过

正如开头提到的,网友先是在编写网页代码时故意写错了3处:



这就导致网页上的一些功能操作无法正常运行,于是小伙分别拍摄了3处无法正常运行的视频,每个视频十几秒。

然后将视频连同代码库一起输给了Gemini 1.5 Pro。

prompt为:

Fix the bugs in my code.Create a simple markdown guide for me to fix them,and then write the actual code to fix the bugs.I need the full code like it’s for a complete PR so I am make the changes.(修复我代码中的bug,为我创建一个简单的Markdown指南以修复bug,然后编写实际的代码来修复。我需要完整的代码,就像它是为了一个完整的Pull Request一样,这样我才能进行更改。)



随后,Gemini 1.5 Pro立刻准确识别了3个bug:

  • 点击一个待办事项并不会将其标记为完成/未完成
  • 主题切换器不会切换主题
  • 点击登录按钮不会触发任何操作



紧接着就分别给出了修复方案,附带代码:



小伙仔细对照自己敲的代码,确认Gemini 1.5 Pro给出的答案是正确的:



小伙还强调,这3个bug在代码库文件中其实离着很远,这也就意味着Gemini 1.5 Pro确实读完了完整的上下文。



“想要访问权限”

网友看到这一系列操作后激动搓手,直呼想要Gemini 1.5 Pro访问权限:





除坐等外,还有网友表示用GPT-4帮忙修复代码也很好使,顺带畅想了一下GPT-5:

接下来可能是实时交互?或许能与GPT-5进行屏幕共享?



而另一边已经获得访问权限的网友早就玩嗨了。

比如,一次性输给Gemini 1.5 Pro最新的10篇论文,让它从中找到一个作者的电子邮件地址。

结果Gemini 1.5 Pro第一次就成功找到了:



然后又让Gemini 1.5 Pro从超360000token的《哈利·波特与凤凰社》整本书中找到一句话的说话人,Gemini 1.5 Pro也成功找到了。





测试继续上难度,一次性输入三本书,Gemini 1.5 Pro最后用时约1分钟再次成功找到对应的说话人:



惊讶之余,这位测试者总结了Gemini 1.5 Pro的逻辑推理能力:

对于常规提示,接近GPT-4的性能。
但当我添加数十个例子时,Gemini的性能在提升,似乎没有上限。多示例提示成为了新的微调方法。



沃顿商学院教授Ethan Mollick也来整活了。输给Gemini 1.5 Pro一本352页的《太空60年》规则手册,约250000token,然后要求它扮演一个角色。

即使说明书分散在很多页上,而且非常复杂,但Gemini“似乎明白了”:



Ethan Mollick教授表示,对所有其他AI进行这项测试都是失败的,只有Gemini 1.5 Pro成功了。



这位网友想要编译整个X算法的代码存储库并将其上传到Gemini 1.5 Pro,正在线向网友征集想问的问题。



只见编译完成后,共310489token,Dogan Ural向Gemini 1.5Pro提出了网友们关心的一系列问题,比如“在推特上扩大或者减少影响力的前5件事是什么?”

Gemini 1.5Pro很轻松地给出了这样婶儿的答案:



你还见过哪些有趣的玩法?欢迎评论区分享~

[1]https://twitter.com/mckaywrigley/status/1762175776726663267
[2]https://twitter.com/mattshumer_/status/1759981272779108403?s=46&t=iTysI4vQLQqCNJjSmBODPw

— 完 —

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

"常胜将军"赵云做了3件蠢事征战30年仍不被刘备重用

趣看热点 浏览 23835

乔欣、章若楠的“叠叠乐”穿搭,适合逛公园吗?

瑞丽网 浏览 17058

学会这3种组合方式 夏季穿T恤不用愁

虎哥说衣不二 浏览 13465

对话支付宝CTO陈亮:集五福第9年,生成式AI如何让年味更浓?

网易科技报道 浏览 10472

美国新冠死亡人数超50万,拜登下令降半旗致哀

趣看热点 浏览 107248

六大行集体下调存款利率 100万存5年利息少7500元

时代财经 浏览 14770

小鹏MONA M03 7月3日首发 15万元紧凑级

网易汽车 浏览 8923

多家美媒密集放风:布林肯将在几周内访华,期待恢复中美高层沟通

环球网资讯 浏览 14591

高薪族最“受伤”?美国申领失业金群体中增长最快的是这群人

财联社 浏览 12739

普里戈任坠机身亡 俄学者:这是乌克兰今年的主要成就

新京报外事儿 浏览 79213

23岁奥运冠军杨倩跌落神坛?2年间她经历了什么?

扒圈818 浏览 14374

买瑜伽裤,别老盯着lululemon!这4个宝藏小众品牌,不坑中国人

潮人志Fashion 浏览 10748

百花奖提名背后的争议:热点新闻下的电影界风云,谁是真赢家?

肆季娱乐 浏览 8780

詹俊:你对去年世界杯阿澳之战印象最深的一幕?对今晚有啥期待?

直播吧 浏览 14010

东京奥运或闭门举办,不会接纳海外普通观众

趣看热点 浏览 644729

圆通速递高管利用家人账户短线交易被罚:浙商证券、国海证券等曾在高位给予“买入”评级

面包财经 浏览 11435

自称国企员工女子炫耀特权后威胁网友:你举报试试看

封面新闻 浏览 70484

“技术男”科大讯飞的木桶效应

斑马消费 浏览 12768

一上线就霸榜全球,这限制级太猛了

独立鱼 浏览 10930

泰国止步16强!魔咒延续52年,被新帅激活,5个月后将战国足

奥拜尔 浏览 10665

17岁苏瑞长大了!化妆逛街像阿汤哥 妈妈疑有新欢

译言 浏览 13730
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1