神经网络算法学习

神经网络计算原理

ReLu函数作用：值小于零则输出0，大于零则输出其本身。

softmax函数作用：得出最终的概率值。
1、输入样本向量化，变成784个值的向量，这里的每个值就是输入层。

2、隐含层可以有多个参数、也可以有多层。

3、从上一层到下一层的过程为上一层的参数值乘一个系数，得到的值为下一层（这个值先称作计算值）。

4、以识别数字为例（便于理解），我们会给输出层设置一个结果（即可能的结果，先称作设定值-这是一个类别，也可以是别的，不一定是某个数字），到达输出层以后，计算值会变成e的几次方，最后输出层下一步获得的结果为每一个输出层对应结果的比例，也就是概率。-初步猜测可能是对概率进行识别对应的。当我们使用计算值得出的概率最大时，我们取这个计算值对应的设定值为输出结果（即下图3处，通过“1”来表示正确）。最后看其对应的概率。如果其概率为最大，则说明我们此次神经网络计算的结果正确，并记下此概率作为正确的概率。（只能说明这次的神经网络计算使用的参数正确的概率最高，还需要后续优化找到最高的。）

5、最后进行反向传播，并使用损失函数（CEloss-交叉熵损失）进行验证，若此时对应的损失函数值非最小（如下图），则需要降低梯度，反向传播，更新我们层与层之间计算时对应的参数，直至得到一个损失的最小值。~~此中原理后续会通过代码来表示。~~