Pytorch-单一输出单层感知机的梯度求解

作者: 残剑天下论 | 来源:发表于2020-02-10 18:23 被阅读0次

统计学习方法2.2-4.1 笔记
深度学习-从感知机到反向传播
最基础的神经网络与反向传播
第2章由感知机导入神经网络
TensorFlow 基础(5)
TensorFlow 深度学习基本概念
李沐-动手学深度学习（八）多层感知机
感知机模型原理（二）
深度学习入门(1)感知机
学习笔记: 深度学习入门：基于 Python 的理论与实现第二

1、首先声明一下图中的变量，

最左侧灰色小球一列：

表示一个样本 $x^0$ （当然还可能有其他样本，例如 $x^{1}、x^{2}$ 等）；每个样本有 $n+1$ 个维度，表示 $n+1$ 个特征，分别是 $x_{0}^{0},x_{1}^{0},...$ ，也是感知机的输入层，是第0层。

中间的红色层：

第1层，是隐藏层。权重 $w$ 的上标都是1，表示这些权重都是第1层的权重。权重的下标有两个值，表示是上一层的哪个神经元和当前层哪个神经元之间的权重连接，例如 $w_{20}^{1}$ ，表示该权重是上一层下标为2的神经元（显然是 $x_2^{0}$ ）与当前层（即第1层）下标为0的神经元（显然是 $x_0^{1}$ ）之间的权重连接。由于第1层只有一个神经元（即下标为0 的神经元），所以所有权重下标的第二个值都是0，表示这些权重都是连向第0个神经元的。

$x_0^{1}$ ，表示第1层的第0个神经元。这个神经元的值是上一层所有神经元与第1层下标的第二个值为0的权重对应相乘并求和的结果。简单地说就是，图中的权重与第0层所有值对应相乘并求和的结果。

$O_{0}^{1}$ ，是 $x_0^{1}$ 经过sigmoid后的值。

最右边的黑色t：

表示真实标签值

紫色的E：

表示损失函数，计算 $O_{0}^{1}$ 与 $t$ 之间的损失。

2、前向过程

$x_{0}^{1} = x^{0}_{0} * w^{1}_{00} + x^{0}_{1} * w^{1}_{10} + ... + x^{0}_{i} * w^{1}_{i0} + ... + x^{0}_{n} * w^{1}_{n0} = \sum x^{0}_{i} * w^{1}_{i0}，（1）$

$O^{1}_{0} = \sigma(x^{1}_{0})，（2）$

$\text{E} = \frac{1}{2} (O^{1}_{0} - t)^2，（3）$

3、反向传播过程

$\frac{\partial E}{\partial w_{j0}} = (O_0^{1} - t) \frac{\partial O_0^{1}}{\partial w_{j0}}，（4）$

$\frac{\partial E}{\partial w_{j0}} = (O_0^{1} - t) \sigma (x_0^{1})(1 - \sigma (x_0^{1})) \frac{\partial x_0^{1}}{\partial w_{j0}}，（5）$

$\frac{\partial E}{\partial w_{j0}} = (O_0^{1} - t) \sigma (x_0^{1})(1 - \sigma (x_0^{1})) x_{j}^{0}$ ，（6）

其中，（6）中的值都是已知的，或者在前向传播中已计算过了，因此，导数求出。

import torch
import torch.nn.functional as F

x = torch.randn(1, 10)
w = torch.randn(1, 10, requires_grad=True)

y = torch.sigmoid(x @ w.t())

loss = F.mse_loss(y, torch.ones_like(y))
loss.backward()

w.grad

# ===========================
tensor([[ 7.6938e-03,  1.7396e-03,  3.2303e-03, -4.8457e-03, -4.2745e-05,
         -6.3924e-03,  1.3029e-03,  7.1305e-03, -3.3778e-03,  3.6352e-04]])

统计学习方法2.2-4.1 笔记
2.2 感知机 -- 准备知识：梯度下降法梯度下降法是求解无约束问题的最常用方法最大变化率是梯度大小，也就是梯...
深度学习-从感知机到反向传播
1 单层感知机 1.1 单层单输出下标的说明： 1、X上标表示所在层数, X下标表示每层的第#个元素。 2、W上...
最基础的神经网络与反向传播
算法原理概述：算法通过构建多层网络解决单层感知机的非线性可分无法分割问题，通过梯度下降法更新网络中的各个权值向量...
第2章由感知机导入神经网络
重点: 感知机将权重与偏置设定为参数。不改变结构，只改变参数可以使感知机实现不同的功能。单层感知机只能表示线性...
TensorFlow 基础(5)
感知机(单层神经网络) 输入层输出层: 初始化权重初始化权重设计模型损失函数通过推导我们可以得到变化率...
TensorFlow 深度学习基本概念
1. 深度学习特性：多层：单层神经网络其实就是感知机（1958年由Frank Rosenblatt提出），感知...
李沐-动手学深度学习（八）多层感知机
【总结】感知机是一个二分类的问题，是最早的AI模型之一。它的求解算法等价于使用批量大小为1的梯度下降。它不能...
感知机模型原理（二）
３. 感知机算法的原始形式在之前我们提到过感知机模型的损失函数为, 感知机的算法本质上就是求解损失函数最优的过程...
深度学习入门(1)感知机
感知机感知机基础知识感知机是神经网络（深度学习）的起源算法。感知机可以接收多个输入信息，输出一个信号。感知...
学习笔记: 深度学习入门：基于 Python 的理论与实现第二
chapter2 感知机 2.1 感知机概述感知机接收多个输入信号，输出一个信号。x1、x2是输入信号，y是输出...