back to index
ML Lecture 21-1: Recurrent Neural Network (Part I) English version

link |
Recurrent Neural Network,RNN。大家好,讓我們開始課程。
link |
好的,讓我們談談 Recurrent Neural Network。
link |
Recurrent Neural Network 其實可以做我們在上一堂課程中提到的事情。
link |
Sequence Labeling。最後,我們會談論
link |
The example we are going to give is slot filling.We know that.AI customer service is very popular now.For instance, AI ticket booking systems.These customer services or ticket booking systems would often use slot filling.So, what does slot filling refer to?Slot filling refers to, for example, if someone tells your booking system.I would like to arrive Taipei on November 2nd, then your system should automatically send you a ticket.
link |
I would like to arrive Taipei on November 2nd, then your system should automatically know that.There are some slots in itself.For example.In the booking system, there should be a slot named destination.And another slot named time of arrival.Your system needs to automatically know.The slot every word listed here belongs.Your system should know that Taipei belongs to the destination slot.And it should also know that November 2nd belongs to the time of arrival.
link |
As for the other words, they don't belong to any slot.How do we solve this problem?Actually, for this problem.Of course, you can also use a feed-forward neural network to solve it.In other words, all stack one.Feed-forward neural network.And its input is a word.For example, if you turn Taipei into a vector and throw it into this neural network.If you want to throw a word into a vector, you can use the feed-forward neural network.
link |
But if you want to throw a word into a neural network, you must first transform it.Into a vector.How do we represent a word using a vector?There are too many ways to do it and the most naive way.Is one of n encoding.I think we don't need to elaborate this more.Of course, you could use word vector to represent a word.Or there are also some.Methods beyond one of n encoding.For example.Sometimes, if you only use one of n encoding to describe a word.Then you can use a n-n-n-n-n-n-n-n-n-n-n-n-n-n-n-n-n-n-n-n-n-n-n-n-n-n-n-n-n-n-n-n-n-n-n-n-n-n-n-n-n-n-n-n-n-n-n-n-n-n
link |
如果人工智能网络有记忆,它可以解决同一词的输入问题。
link |
好的,这种人工智能网络与记忆,叫做循环人工智能网络。
link |
每当我们的隐藏层次中的 neuron 生成了输出,
link |
在这里,我们使用蓝色的方块来代表记忆。
link |
当这些隐藏层次中的 neuron 生成了输出时,
link |
对于 RNN 而言,除了 x1 和 x2,
link |
我们也假设所有的启动功能都是线性的。
link |
进入这个线性的 neuron 组织。
link |
使用这个线性的 neuron 组织。
link |
而这个 neuron 组织的输出也是 2。
link |
输出的绿 neuron 组织是 4.
link |
绿 neuron 组织的输出到记忆中。
link |
绿 neuron 组织的输出会是什么?
link |
所以你加 2 加 2 加 1 加 1,
link |
红 neuron 组织的输出是 6 加 6 加 12,
link |
绿 neuron 组织的输出是 6 和 6.
link |
每个绿 neuron 组织都在这里。
link |
我们会考虑 4 个输入, 2 和 2, 6 和 6.
link |
绿 neuron 组织的输出是 32.
link |
如果我们想使用绿 neuron 组织
link |
然后我们把它放入绿 neuron 组织。
link |
绿 neuron 组织的隐藏层数的输出
link |
这 A1 是绿 neuron 组织的输出,
link |
因此,它实际上是绿 neuron 组织。
link |
这 Y1 是绿 neuron 组织的可能性。
link |
这两个输出 Taipei 和 A1,
link |
这两个输出 Taipei 和 A1,
link |
所以我们可以生产 Y3 基于 A3。
link |
这里属于的 Taipei 和 A1 存在的可能性。
link |
我用同样的颜色来代表同样的重量在这里的目的
link |
这就叫做Ellman Network
link |
你的组织只会看到X1到XT加1的部分
link |
ZF的信号也通过了SIGMOID启动功能
link |
哪个价值应该被增加,并且哪个价值应该是偏差价值?
link |
X1是乘以1,所有其他东西是乘以0,
link |
因此,在这里,我们只是使用X1作为输入,
link |
偏差是-10,也就是说,当X2没有价值,
link |
因为偏差是-10,输入门通常会关闭。
link |
如果偏差是-10,那么在启动功能之后,
link |
这里是sigmoid,它的价值将接近0。
link |
那么让我们通过这个软件进行一些输入。
link |
好的,让我们输入第一个数字,310。
link |
1×3,输入门通过后得到的数值是3。
link |
你可以想象LSTM的记忆组织是一个脉络。
link |
所以如果我们今天想使用一个LSTM网络,
link |
现在的进口X1和X2将被不同重量积分,
link |
假设我们现在只有两个脉络在这个隐藏的层面上,
link |
你可能有,说,1000个脉络和1000个LSTM的记忆组织,
link |
再次,把它们分成另一组重量积分来控制第一个LSTM的进口门,
link |
并把它们分成另一组重量积分来作为第一个LSTM的进口,
link |
并把它们分成另一组重量积分来控制第一个LSTM的出口门。
link |
X1和X2将被一组重量积分来控制第一个LSTM的出口门,
link |
为了出口门,为了进口门,为了进口,为了忘记门。
link |
现在,我们刚才提到LSTM有四个进口和一个出口,
link |
而为了一个LSTM,四个进口都不一样。
link |
就像一些机器一样,它只需要一根力线来运行机器。
link |
LSTM需要四根力线来运行LSTM机器。
link |
假设LSTM的网络有同样的数量的智能。
link |
这张图片并不像我们刚才学习的原始智能网络
link |
因此,我们必须画出另一张图片来展示它。
link |
假设我们现在有一个整个LSTM图片。
link |
在这个LSTM图片的图片中,在每个记忆中,
link |
我们将它分解成一个图片来变成另一个图片Z。
link |
然后第一个Z面积控制了第一个图片的进口,
link |
好的,这个X-T将被另一个变化变化。
link |
来得到ZI,而这个ZI,其面积也同样是图片的数字。
link |
以及最后一个面积控制了最后一个图片的进口。
link |
好的,所以我们乘以XT乘以四个不同变化。
link |
因为每个图片的进口来自于图片的不同面积。
link |
然后这个过程会在下一个时间表中重复。
link |
写下L, S, T, M, 然后就结束了。
link |
GRU是一个比较简单的版本LSTM。