看看函数名和注释,AI自动生成代码,程序员:这不真实,我要失业

試著忘記壹切 提交于 2020-08-06 04:22:08

  机器之心报道

  参与:张倩、Racoon X、Jamin

  

  

你有没有想过,有一天,码农是不需要写代码的。你只需要提供函数签名和注释,代码就能自己在屏幕上打出来。「搬砖码农可以都辞退了,留下项目经理提需求即可,大雾!」

  

  上面这段 demo 是不是看着很爽?这就是 OpenAI CEO Sam Altman 刚刚介绍的最新研究成果——根据函数签名和注释,利用语言模型自动生成 Python 代码。这个语言模型用到了和 OpenAI 的 GPT 模型相同的无监督技术。

  为了让模型学会「写代码」,研究人员在微软的超级计算机上,借助数千个开源 GitHub 库里的代码对该模型进行了微调。

  先来看一下生成效果。

  研究人员首先展示了一个较为简单、使用 Python 编写回文检测的例子。回文指的是「正读反读都能读通的句子」,例如:「anna」、「level」等。下面是使用该模型自动生成的代码:

  

  可以看到,在你输入了函数签名和注释之后,模型正确地生成了回文检测的代码。当然,对于回文检测,我们也可以用如下更「秀」的递归方法来实现:

  

  看到这里,也许大家并没有对该模型的效果感到很惊艳,毕竟像回文检测这类基础任务的代码网上一抓一大把,模型大可以直接从训练集中复制过来即可。

  先别着急,咱们继续往下看。

  接下来,研究人员要求模型生成从一个列表中查找长度不少于 7 个字符的代码,而且该任务并没有在训练集中。我们来看看在这样的情况下,模型表现如何:

  

  还是出色地完成了任务!

  从这个例子我们可以确定,模型不是简单地复制网上的现成代码,而是依据函数名及相关注释产生了对应的解决方案,它甚至还使用了之前生成的代码。

  试过了单一函数的例子,研究者还展示了其在类中的运行效果。

  

  这次的任务是计算商品的总价格,并对名称是回文的商品打折。我们来看一看该模型生成的代码:

  

  模型自动地为我们生成了计算商品总价方法的注释及对应代码。然而这并不是我们想要的结果,我们只想要对名字是回文的商品打折,而不是对所有商品都打八折。研究人员之后修改了该方法的注释,详细描述了想要实现的功能。修改注释后,该模型生成的代码如下:

  

  可以看到模型几乎生成了我们想要的结果。这里仅有一个小问题,我们想要对回文名称的商品打八折,而不是打二折,简单修改一下即可。

  最后研究者展示了让模型生成购物收据的结果:

  

  OpenAI 的介绍视频

  OpenAI 放出的 demo 的确惊艳,甚至是革命性的。如果照这个思路走下去,以后简单的「搬砖工」似乎都不需要了。但问题也出在这儿:效果未免太惊艳了,让人不禁怀疑是否存在造假或精心挑选……

  

  不过也有人说,「这可是 OpenAI!他们的口袋里有的是好玩意儿。」

  

  那么,如果这是真的,对程序员来说意味着什么?

  

  程序员的未来何去何从?

  在 AI 领域,每种新鲜技术的出现似乎都会掀起一番「XX 从业者是否会被 AI 取代」的讨论,这次也不例外。

  

  首先,这种工具的出现所带来的效率提升是毋庸置疑的。我们假设这个 demo 是没有掺水的,那么公司可能会出于成本的考虑裁掉一些初级码农,用一个码农来充当「审码员」,完成原来十个码农的工作。

  

  也有人认为,就目前这个模型来讨论程序员是否会被取代未免有点超前。首先,这还只是一个语言模型,即使在非常简单的函数中也可能出错,更别说遇到比较难以理解的自然语言注释语句了。这时候,还是需要人来介入。

  

  其次,这一流程中用到的「注释」还不是需要人来写吗?

  

  但也有人认为,这些都可以通过时间和技术来解决:总有一天,模型犯的错误会越来越少,甚至少于检查代码的那个人类。

  

  或者你再训练一个模型来写单元测试,然后不断对其进行改进,直到它可以给出大部分时候合理的解决方案。

  

  当然,这些都是一些非常超前的假设,现在的技术还很难做到,真正应用起来也会有各种各样的问题。但回想起 19 世纪初期大批纺织工人的命运,这种讨论还是很有意义的。

  参考链接:https://www.reddit.com/r/MachineLearning/comments/gnmjki/dn_microsoft_demos_language_model_that_writes/

易学教程内所有资源均来自网络或用户发布的内容,如有违反法律规定的内容欢迎反馈
该文章没有解决你所遇到的问题?点击提问,说说你的问题,让更多的人一起探讨吧!