LR与SVM

作者: Manfestain | 来源:发表于2019-11-04 11:20 被阅读0次

LR

最大化似然函数:L(w) = -\sum_{i=1}^{N}\sigma(w^Tx_i + b)^{y_i}(1 - \sigma(w^tx_i + b))^{1-y_i}

决策边界:y = I[w^Tx + b \geq 0]

核函数:log(1 + exp(-\sum_{i=1}^{n}\alpha_iK(x, x_i)))w^T\Phi(x) +b = \sum_{i=1}^{n}\alpha_iK(x, x_i) = 0

实际中LR不采用核函数方法,因为SVM只依赖于支持向量,而LR考虑每个点,这样核计算量非常大

多分类:P(y=i|x) = \frac{exp(w_i^Tx + b_i)}{\sum_{k}exp(w_k^Tx + b_i)}

SVM

寻找最大间隔:min\frac{1}{2}||w||^2

s.t. y_i(w^Tx_i + b) \geq 1, i=1…N

决策边界:y = I[w^Tx + b \geq 0]


  • LR与SVM都是线性分类器(一般处理二分类问题),模型求解的就是一个超平面
  • LR和SVM的表现都受到离群点的影响
  • LR和SVM都属于判别模式

  • SVM不直接依赖于数据分布,分类平面不受一类点影响(考虑局部的边界线附近的点,支持向量)

    LR受所有数据点的影响(考虑所有数据点,需要先做不平衡处理)

  • SVM依赖于数据表达的距离度量,需要先做归一化

    LR不受限制

  • LR是对数损失函数log losss,目标是少分错(通过概率假设定义)

    SVM是合叶损失函数hinge loss(侧重线性支持向量部分),目标是使分割面到所有样本的距离最大(通过空间距离定义)

    损失函数不同是二者的本质

  • SVM的解具有稀疏性,预测效率更高,SVM以来于惩罚系数,实验中需要做CV

  • SVM的损失函数自带正则,这就是SVM是结构风险最小化算法的原因

    找到一个分类平面,让位置数据仅可能少的落在分类面错误的一边

    LR假设数据服从一个分布,加正则项区拟合这个分布(LR是经验风险最小化模型)


如何选择LR和SVM

  1. 如果Feature的数量很大,跟样本数量差不多,选用LR或者是Linear Kernel的SVM。
  2. 如果Feature的数量比较小,样本数量一般,不算大也不算小,选用SVM+Gaussian Kernel
  3. 如果Feature的数量比较小,而样本数量很多,需要手工添加一些feature变成第一种情况

在什么情况下,我们需要做高维映射呢?我们之所以要做映射,就是因为特征数量不够多。如果特征数量多,那么用现有的特征就足够了。所以情况(1)的时候,我们特征数量多。并不需要映射。

相关文章

  • LR与SVM

    LR 最大化似然函数: 决策边界: 核函数:, 实际中LR不采用核函数方法,因为SVM只依赖于支持向量,而LR考虑...

  • LR vs. SVM

    LR与SVM的联系与区别:联系: 1、LR和SVM都可以处理分类问题,且一般都用于处理线性二分类问题(在改进的情况...

  • Logistic Regression(1)

    LR 应用经验 LR-SVM-GBDT对比: LR能以概率的形式输出结果,而非只是0和1的判定。SVM的输出原本只...

  • 支持向量机(SVM)-原理

    1、支持向量机与逻辑回归模型 SVM与LR相比它的划分线并不是有0.5这个中间的平均值划分的,在LR中我们可以明显...

  • LR与SVM的异同

    原文:http://blog.sina.com.cn/s/blog_818f5fde0102vvpy.html 在...

  • LR和SVM的联系和区别

    LR和SVM的联系和区别 联系: 1、LR和SVM都可以处理分类问题,且一般都用于处理线性二分类问题(在改进的情况...

  • LR和SVM

    在大大小小的面试过程中,多次被问及这个问题:“请说一下逻辑回归(LR)和支持向量机(SVM)之间的相同点和不同点”...

  • 算法基础

    1、数据量比较大的时候,svm和lr哪个更快? svm适用于相对稀疏的数据,所以xgb的效果比svm要好。面试官也...

  • 秋招面经

    项目相关 为什么选取 XGBOOST? xgboost 相对于 svm、LR 有更好的效果。 xgboost 相对...

  • 机器学习面试题

    1. SVM、LR、决策树的对比? LR实现简单,训练速度非常快,但是模型较为简单。 决策树容易过拟合,需要进行剪...

网友评论

      本文标题:LR与SVM

      本文链接:https://www.haomeiwen.com/subject/ykgrbctx.html