雷锋网AI科技评论按:人们已经给神经网络找到了越来越多人的事情做,比如画画和写诗,微软的小冰都已经出版了一本诗集了。而其实训练一个能写诗的神经网络并不难,Automattic公司的数据科学家CarlyStambaugh就写了一篇文章介绍如何简单快捷地建立一个会写诗的人工智能。雷锋网AI科技评论全文翻译如下。
「代码即诗篇」,这是WordPress社区的哲学。
作为一个coder同时也是一个诗人,我一直都十分喜爱这句话。然而,如果将这句话翻转过来,我不禁要问:「我能否通过代码写诗呢?我能否创造一个能够写出原创性诗词的机器?」于是,我做了一系列实验去探究这个问题的答案。
首先,我们都知道如果想让机器学会写诗,那么它必须先学会读诗。在整个年中,使用WordPress系统发布的、标注为诗歌的帖子有超过50万篇。我联系了一些通过WordPress分享作品的高产诗人,询问他们是否愿意与我合作完成一个有趣的实验:能否让我的机器阅读他们的作品,让我的机器能够学到诗歌的形式和结构,最终让机器能够自己完成诗歌创作?
OattheEdges–RobertOkajiWolffPoetry–LindaJ.WolffPoetry,ShortProseandWalking–FrankHubenyPerspectivesonLife,theUniverseandEverything–AurangzebBozdar
何为LSTM以及它如何生成文本?
我使用了一种名为LSTM(LongShortTermMemorynetwork,即长短时期记忆网络)的神经网络来构建我的诗歌机器人。
神经网络通过层次结构将一个问题分解为多个小问题。举例而言,假如你想训练一个用于识别正方形的神经网络,其中一层可能会负责识别直角,另一层可能负责识别平行线。为了将图片认定为正方形,所有这些特征都会被机器呈现出来。神经网络会通过将数以百万计的正方形图片作为输入训练模型,从而学习到这些必要的特征的参数。这个机器还会学到图片的哪些特征对于识别正方形是重要的,哪些是不重要的。
现在,假设你想要使用神经网路去预测这两个字母的下一个字母:
Th_
对于一个人来说,这个任务是十分简单的。很有可能,你猜下一个字母应该是e。但是,我敢打赌,如果你是一个说英语的人,你不会猜下一个字母是q。这是因为你已经通过学习知道:在英语中,q不会跟在th的后面。一个单词中,前面的字母对于预测后面会出现什么字母是及其相关的。一个LSTM可以「记住」它之前的状态并将其告诉它当前的决策过程。关于LSTM如何工作的更深入的解释,可以参考谷歌大脑的ChrisOlah所写的这篇精彩的文章。
与许多基于LSTM的文本生成案例一样,我的诗歌机器人通过一次生成一个字符来生成文本。因此,要想把单词组合成任何有意义的样式,诗歌机器人首先必须学会如何造词。为了实现这一点,它需要数百万个有效的单词的例句。值得庆幸的是,WordPress.
转载请注明地址:http://www.1xbbk.net/jwbfz/8482.html