美文网首页
SVM_LOSS梯度推导

SVM_LOSS梯度推导

作者: jshuzi | 来源:发表于2018-06-29 12:26 被阅读0次

首先给出损失函数的定义:

其中符号定义:

其中Xi是某一样本输入,为行向量;Wj为权值矩阵中的某一列;Yi为Xi标签值,这里也代表所在向量的索引值。

我们将Li展开后可以得到其具体表达式为:

上式每一行前后表示意义为:

现在我们把损失函数对权值矩阵求导展开得到:

为了叙述清晰,这里我们忽略max(0,...)函数,它对权重求导的影响即将小于零位置导数置0即可,结合上述两式,可以得到求导值:

也就是:

其中Xi前面的部分主要是考虑到max(0,...)的影响,计算式小于0时,该位置置0;

下面计算dLi/dwyi1,含有wyi1的部分如下所示:

需要指出的是如果考虑到max(0,...)的影响,个数一般小于C。同样的,对于Wyi2...求导结果类似:

cs231n - assignment1 - linear-svm代码实现为:

for i in range(num_train):

    scores = X[i].dot(W)

    correct_class_score = scores[y[i]]

    for j in range(num_classes):

        if j == y[i]:

            continue

        margin = scores[j] - correct_class_score + 1 # note delta = 1

        if margin > 0:

            loss += margin

            dW[:,j] += X[i].T

            dW[:,y[i]] += -X[i].T


参考:Vectorized Implementation of SVM Loss and Gradient Update

相关文章

  • SVM_LOSS梯度推导

    首先给出损失函数的定义: 其中符号定义: 其中Xi是某一样本输入,为行向量;Wj为权值矩阵中的某一列;Yi为Xi标...

  • Logistic Regression

    推导 sigmoid 推导LR损失函数 推导LR梯度下降 Softmax原理 softmax 损失函数 softm...

  • 梯度下降与反向传播

    链式法则 梯度下降与反向传播(含过程推导及证明)

  • 2018-06-28 BP算法

    BP推导——续 反向传播算法 Backpropagation Algorithm (批量)梯度下降法 (batch...

  • 梯度下降的推导

    假设房子的面积和价格的对应关系如下图所示,那么如何 面积和价格的关系呢? 假设 训练集如下:面积 : 150 ...

  • 梯度下降理论推导

    最近一段时间关于机器学习、人工智能等话题充斥着各大社区。作为一枚热爱技术的系统工程师,我迫切想去揭开它神秘的面纱。...

  • RNN梯度消失与梯度爆炸推导

    梯度消失与爆炸 假设一个只有 3 个输入数据的序列,此时我们的隐藏层 h1、h2、h3 和输出 y1、y2、y3 ...

  • ML03-逻辑回归(下部分)

    本文主题-逻辑回归(下部分):逻辑回归的应用背景逻辑回归的数学基础逻辑回归的模型与推导逻辑回归算法推导梯度下降算法...

  • ML02-逻辑回归(上部分)

    本文主题-逻辑回归(上部分):逻辑回归的应用背景逻辑回归的数学基础逻辑回归的模型与推导逻辑回归算法推导梯度下降算法...

  • 反向传播梯度求解推导

    1. 引入 反向传播是一场以误差(Error)为主导的反向传播(Back Propagation)运动,目的在于优...

网友评论

      本文标题:SVM_LOSS梯度推导

      本文链接:https://www.haomeiwen.com/subject/fuyoyftx.html