第十讲--循环神经网络--课时22--语言模型

房东的猫 提交于 2019-12-06 18:40:25

language model即语言生成模型

character level language model 训练过程

训练过程的输入时给定的,结果是一个向量,进过softmax后就是为各个character的概率


测试过程     输入是前一个的输出,输出是由soft max 之后的概率分布 采样得到的


----------------------------------------------------------------------------------------------------------------------------------

如果想要用维基百科的英文语句训练RNN,那么将会无法收敛



----------------------------------------------------------------------------------------------------------------------------------

可以生成诗歌,戏剧,数学证明,c语言代码!

---------------------------------------------------------------------------------------------------------------------------------

language modeling中,隐藏层向量的各个位置是由含义的!比如,或许第一个单元就是检测引号的


可以看到,这个单元的值在引号里和引号外tanh激活后的大小是不一样的



易学教程内所有资源均来自网络或用户发布的内容,如有违反法律规定的内容欢迎反馈
该文章没有解决你所遇到的问题?点击提问,说说你的问题,让更多的人一起探讨吧!