Backpropagation

标签

字数

1073 字

阅读时间

5 分钟

Perceptron 感知机

这是真实的神经元建模：

如果我们从数学上建模这样的神经元，就是这样的：

我们现在要开始讲解感知机。首先，我们复习一下解析几何知识。

如果一个平面/直线是以wTx + b = 0的形式给出的，那么，w就是平面的法向量，b是平面在法向量上平移的距离。
而如果两个向量点乘，a = (a1 .. an), b = (b1 .. bn), dot(a,b) = a1b1 +..+ anbn为标量，长度为b在a方向上的投影长度。

有了这样的前置复习知识，就来看感知机。

在图里面，x不是横坐标，而是一个向量x = (x1 .. xn), 指向某个方向，w为hyperplane的法向量，与hyperplane垂直。dot(x,w)为x在w上的投影（这里可能写错顺序了）。

而b的引入就是让平面在w的方向上前进后退。为了便于研究，我们先不考虑有b的情况。我们只考虑wx。

那么感知机算法就是：

这里解释一下。首先我们看到，红色的圆是没有被正确的分类的。这个时候，ywTx是 < 0的。这时，x是指向红色圆圈的向量。y为正或负1。w+yx的意思就是，如果，y为-1，则yx为x的反方向向量，w+yx做平行四边形法则，向量加法，让w这个法向量旋转，使得y为-1的红色圆圈更容易被分到-1的类别里去。y=1同理。

这个算法挺优美的，但是问题就是，当我们想要训练一个多层的感知机的时候，就不管作用了。