除了下围棋、写稿子，人工智能又来抢画家的饭碗了

发布时间：2022-06-13 18:13:56 阅读：次来源：消防服厂家

如果有人让你画一只小鸟，你大概得先线条起稿、补充细节，然后着色，整个过程也得个把小时。微软最近发布了一项新的人工智能项目，名为绘画机器人（drawingbot），可以将文字转换成图画（texttoimage）。

对抗生成网络

何晓东是微软深度学习技术中心的负责人，也是texttoimage项目的核心人员之一。他说，跟网络搜索得到的图片不同，绘画机器人给你的图案都是按照一定的指令一点一点画出来的，也有可能它画出来的东西这个世界上并不存在。

绘画机器人的核心技术是对抗生成网络（GenerativeAdversarialNetwork，即GAN），听这个是不是感觉很难懂想溜，别急，微软亚洲研究院在知乎专栏里举了个很好的例子。

女生拉男票给自己拍照，拍完第一张，女生说：你要学一下谁谁谁的构图；

拍完第二张，女生又说，你要学一下谁谁谁的调色；

拍完第三张，女生再说，你要学一下谁谁谁的感觉；

……反复几次，女生才终于认可了男票拍出来的照片。

这个男友拍照血泪史就是生成对抗网络。生成对抗网络它有两个工作模型，一个负责根据文字生成图片（generator），另一个根据文字评判生成的图片（discriminator），这两个模型不断相互博弈、又相互学习，直到discriminator再也没有能力判断这个图形，「生成模型」就可以出师了。

研究历程

这个项目并不是最近新出的，何晓东与他的团队已经研究了5年了。

他们最早推出过一个Captionbot，只要你上传一张图，这个人工智能就会自动为图片配一段文字；接着，他们又将这个技术进一步发展，你可以根据图片上的事物进行提问，人工智能会回答你提出的问题。这个时期的技术，有点像小学生的看图作文、看图回答问题。

早在2017年1月份，在arXiv.org上就何晓东团队登载了一篇介绍texttoimage的论文，这项技术名为生成对抗网络（Attentional，简称AttnGAN）。而最近微软正在进行的texttoimage项目，生成的图画质量将是以前的3倍。

与根据图片进行文字描述技术相比，texttoimage的难点在于，绘画机器人要描绘出更多细节，而这些细节是文字叙述中所没有的，这就要求你的人工智能自动「脑补」。

研究绘画机器人有极大的科研意义，这是计算机视觉研究（computervision）和自然语言处理（naturallanguage）这两个研究领域的一次融合。怎么理解呢？计算机视觉研究的是机器如何去看，也就是说让机器像人眼一样去看待这个世界、并且进行图像处理；而自然语言处理，研究的就是人与人工智能之间如何用我们日常的语言进行交流。

绘画机器人的实际应用

绘画机器人虽然目前仍处在研究阶段，但是界内预测，它一旦出现，将会有极大的实际用途。

比如，它可以作为画家或者设计师的助理，甚至可以帮他们完成草图。

根据何晓东的想象，绘画机器人还可以帮助电影工作者，可以根据电影剧本直接生成影片，这可以节省大量的人力。电影从业人员莫哭。

人类为谋生奋斗了这么多年，没想到最大的竞争对手却是机器人。而何晓东表示，人类和人工智能共同生活在这个地球上，双方是需要找到一种沟通的方式的，而最好的沟通方式就是语言和图像。这话好像很顺耳，但是你有没有觉得有细思极恐的感觉？

中国风海报
复古海报