DNN语言模型基本介绍-rnnlm语言模型

2023-08-23 02:20:49

我们前面学习了n-gram语言模型的使用。我们今天来学习nlp的另外一个模型。DNN（深度神经网络的缩写）（Deep Neural Networks）。这个深度学习的基础。

下面我们就来了解一下这个模型。

感知机

学习神经网络之前我们先看看感知机。

感知机的模型是一个有若干输入和一个输出的模型。

例如：

比如这个图，输出和输入之间学习到一个线性关系，可以得到中间的输出结果。

接着是一个神经元激活函数：

从而得到想要的结果1或者-1。

这个模型只能用于二元分类，并且无法学习比较复杂的非线性模型，因此在工业界无法使用。

而神经网络则在感知机的模型上做了扩展，总结下主要有三点：

感知机模型增加隐藏层，隐藏层可以有多层，增强模型的表达能力，比如下面的图。

比如上面这个图，但是增加了这么多隐藏层会导致模型复杂度提升很多。

上面的神经元只有一个输出，也可以多个输出。这样的模型可以灵活的应用于分类回归，以及其他机器学习领域比如降维和聚类等。

多个神经元输出的输出层对应的一个实例如下图。输出层有4个神经元。

感知机的激活函数是sign(z),虽然简单但是处理能力有限，因此神经网络一般使用其他激活函数，比如我们在逻辑回归里面使用过的Sigmoid函数。

即：

还有后来出现tanx，softmac和ReLU等。通过使用不同的激活函数，神经网络的表达能力进一步增强。

以上就是关于《DNN语言模型基本介绍-rnnlm语言模型》的全部内容，本文网址：https://www.7ca.cn/baike/70307.shtml，如对您有帮助可以分享给好友，谢谢。

标签:

声明