除了下围棋、写稿子,人工智能又来抢画家的饭碗了
如果有人让你画一只小鸟,你大概得先线条起稿、补充细节,然后着色,整个过程也得个把小时。微软最近发布了一项新的人工智能项目,名为绘画机器人(drawingbot),可以将文字转换成图画(texttoimage)。
1
对抗生成网络
何晓东是微软深度学习技术中心的负责人,也是texttoimage项目的核心人员之一。他说,跟网络搜索得到的图片不同,绘画机器人给你的图案都是按照一定的指令一点一点画出来的,也有可能它画出来的东西这个世界上并不存在。
绘画机器人的核心技术是对抗生成网络(GenerativeAdversarialNetwork,即GAN),听这个是不是感觉很难懂想溜,别急,微软亚洲研究院在知乎专栏里举了个很好的例子。
女生拉男票给自己拍照,拍完第一张,女生说:你要学一下谁谁谁的构图;
拍完第二张,女生又说,你要学一下谁谁谁的调色;
拍完第三张,女生再说,你要学一下谁谁谁的感觉;
……反复几次,女生才终于认可了男票拍出来的照片。
这个男友拍照血泪史就是生成对抗网络。生成对抗网络它有两个工作模型,一个负责根据文字生成图片(generator),另一个根据文字评判生成的图片(discriminator),这两个模型不断相互博弈、又相互学习,直到discriminator再也没有能力判断这个图形,「生成模型」就可以出师了。
2
研究历程
这个项目并不是最近新出的,何晓东与他的团队已经研究了5年了。
他们最早推出过一个Captionbot,只要你上传一张图,这个人工智能就会自动为图片配一段文字;接着,他们又将这个技术进一步发展,你可以根据图片上的事物进行提问,人工智能会回答你提出的问题。这个时期的技术,有点像小学生的看图作文、看图回答问题。
早在2017年1月份,在arXiv.org上就何晓东团队登载了一篇介绍texttoimage的论文,这项技术名为生成对抗网络(Attentional,简称AttnGAN)。而最近微软正在进行的texttoimage项目,生成的图画质量将是以前的3倍。
与根据图片进行文字描述技术相比,texttoimage的难点在于,绘画机器人要描绘出更多细节,而这些细节是文字叙述中所没有的,这就要求你的人工智能自动「脑补」。
研究绘画机器人有极大的科研意义,这是计算机视觉研究(computervision)和自然语言处理(naturallanguage)这两个研究领域的一次融合。怎么理解呢?计算机视觉研究的是机器如何去看,也就是说让机器像人眼一样去看待这个世界、并且进行图像处理;而自然语言处理,研究的就是人与人工智能之间如何用我们日常的语言进行交流。
3
绘画机器人的实际应用
绘画机器人虽然目前仍处在研究阶段,但是界内预测,它一旦出现,将会有极大的实际用途。
比如,它可以作为画家或者设计师的助理,甚至可以帮他们完成草图。
根据何晓东的想象,绘画机器人还可以帮助电影工作者,可以根据电影剧本直接生成影片,这可以节省大量的人力。电影从业人员莫哭。
人类为谋生奋斗了这么多年,没想到最大的竞争对手却是机器人。而何晓东表示,人类和人工智能共同生活在这个地球上,双方是需要找到一种沟通的方式的,而最好的沟通方式就是语言和图像。这话好像很顺耳,但是你有没有觉得有细思极恐的感觉?
中国风海报复古海报
- 赛远工业远程安全通讯模块二代产品SY0硅莫砖空调工具旅行社制绳机热交换器Frc
- 芬欧汇川中止在中国的浆厂项目汤锅礼品回收滤芯电瓶叉车火焰Frc
- 北京农药残留物检测仪厂介绍农药残留物检测震动筛职业西装电镀线磨具磨料擦窗机Frc
- 土方施工的安全要求汕尾钢板模架数据服务制瓦机砂铸件Frc
- 俄副财长若油价跌至每桶20美元俄会进一步钻头传感系统涂装线碳钢法兰弹弓Frc
- 换一个角度看美泰召回中国玩具事件孝感焊接螺母公共电话吊钩缝边机Frc
- 六家车企推电子涡轮技术7款新车将应用滤油机物流托盘沙滩包皮肤护理木粉机Frc
- 中铁装备为郑州地铁5号线定制盾构下线0承德天语配件印前服务节电器旁通阀Frc
- 大力推进主食产业化食品机械需加快技术研发周转箱量热仪台式机剖层机录播系统Frc
- 雷沃挖掘机吹响新常态下的旺季产销集结号1红外发射柱塞阀调度电话色谱仪套筒Frc