美文网首页
评价指标(二)ROC和AUC

评价指标(二)ROC和AUC

作者: copain_sir | 来源:发表于2020-04-15 16:35 被阅读0次

前言

  继上篇文章评价指标(一)精确率,召回率,F1-score,除了上述三个指标,这次深入讲述何为ROCAUC,以及它们是如何工作的。

ROC

  ROC(Receiver Operating Characteristic) 翻译过来就是“受试者工作特征”,源于二战中用于敌机检测的信号雷达分析术,后来引入到机器学习的领域,当然,前提还是针对二分类问题。
首先我们得到一个混淆矩阵


对于ROC,
横轴为FPR,预测为正中但实际为负/实际负样本数的比例,对应就是
纵轴为TPR,预测为正中实际也为正/实际正样本数的比例,对应就是,其实就是Recall

描绘ROC曲线的图成为“ROC图”,描述了TPR和FPR之间的相对平衡,上图显示了A~E五个分类器的ROC图

有几个点要注意,对于一般而言
(0,0) 代表阈值为1,全部判定为负类
(1,1) 代表阈值为0,无条件判定为正类
(0,1) 理想模型,模型预测百分比正确
而在(0.5, 0.5)我们可以认为模型在瞎猜

很明显,越靠近D点,模型性能就越好,A相对于B更保守,事实上很多数据都是由大量的负类主导,由此看来或许A性能B的好;出现在右下角的任何分类器效果比随机猜测都差(如E),一般而言这块区域是空的。

如何得到ROC曲线

给定一个测试机,我们可以通过阈值threshold:大于threshold判定为正,反之为负
以论文的例子展开:测试集一共20个样本,Class为其正式的标签,Score为模型预测为正类的概率,我们根据Score对其排序


从高到低,依次Score值作为threshold,通过计算可以得到20组的(FPR, TPR),即得到一条ROC曲线。
例如:以Score=0.55作为threshold,可以得到混淆矩阵
threshold=0.55

那么TPR = 4/(4+6) = 0.4
FPR = 1/(1+9) = 0.1
最后得到坐标(0.1,0.4)

最后结果如下图:



现实任务中通常是利用有限的测试样本绘制ROC图,如果想得到平滑的曲线,可以通过增加测试样本去拟合,但一般我们不会选择这么做。
若分类器A的ROC曲线被另一个分类器B的ROC曲线完全覆盖(如下图),则B的性能绝对优于A



若分类器A的ROC曲线和分类器B的ROC曲线发生交叉(如下图),则难以判定孰优孰劣,此时如果一定要对比,就可以用AUC进行判断

AUC

AUC(Area Under ROC Curve),就是ROC曲线下面的面积
假定ROC曲线有坐标为\left\{ {\left( {{x_1},{y_1}} \right),\left( {{x_1},{y_2}} \right),...,\left( {{x_m},{y_m}} \right)} \right\}的点连续链接而形成,则AUC可估算为:
AUC = \frac{1}{2}\sum\limits_{i = 1}^{m - 1} {({x_{i + 1}} - {x_i})} * ({y_i} + {y_{i + 1}})

END

ROC曲线对于分类器是个二位的描述,简单来说我们希望能通过AUC这样单个标量去衡量模型的性能,且又不能像Recision,Recall,F1这类有时候无法正确解释的指标

相关文章

  • 4.machine_learning_eval_metric_a

    1.机器学习指标ROC与AUC 1.1ROC与AUC AUC是一种模型分类指标,且仅仅是二分类模型的评价指标。AU...

  • 评价指标(二)ROC和AUC

    前言   继上篇文章评价指标(一)精确率,召回率,F1-score,除了上述三个指标,这次深入讲述何为ROC与AU...

  • AUC与ROC

    序 分类任务不同于回归,本次记录一下分类任务中常用的评价指标AUC与ROC 混淆矩阵 在搞清楚ROC和AUC之前,...

  • 评价指标ROC、AUC

    AUC 混淆矩阵 正确率和召回率很难兼得• 准确度Accuracy:(50+35)/(35+5+10+50)=85...

  • 链路预测

    2.4评价指标 2.4.1AUC ROC曲线下的面积。信号探测理论中,ROC曲线用来评价某种分类器的分类效果。这种...

  • 2018-06-13 AUC评价指标的理解

    ROC(Receiver Operating Characteristic)曲线和AUC常被用来评价一个二值...

  • ROC和AUC

    前言 ROC(Receiver Operating Characteristic)曲线和AUC常被用来评价一个二值...

  • 2016/02/18

    ROC(Receiver Operating Characteristic)曲线和AUC常被用来评价一个二值分类器...

  • 机器学习中的常用评价指标汇总

    机器学习中的评价指标 简要介绍精度、精确率、召回率、P-R曲线、F1 值、TPR、FPR、ROC、AUC等指标,还...

  • 分类器指标

    二值分类器指标: precision,recall,F-score[^1],以及我们今天要讨论的ROC和AUC R...

网友评论

      本文标题:评价指标(二)ROC和AUC

      本文链接:https://www.haomeiwen.com/subject/dfecvhtx.html