美文网首页
2018-06-13 AUC评价指标的理解

2018-06-13 AUC评价指标的理解

作者: wingle_smile | 来源:发表于2018-06-13 17:14 被阅读0次

      ROC(Receiver Operating Characteristic)曲线和AUC常被用来评价一个二值分类器(binary classifier)的优劣,对于多分类器不适用。

一、混淆矩阵

理解AUC和ROC曲线之前,应该先清楚什么是混淆矩阵,混淆矩阵如下图所示:

图一混淆矩阵

由此引出True Positive Rate(真阳率)、False Positive(伪阳率)两个概念:

真阳率 伪阳率

TPRate的意义是所有真实类别为1的样本中,预测类别为1的比例。

FPRate的意义是所有真是类别为0的样本中,预测类别为1的比例。

二、如何画ROC曲线

       对于一个特定的分类器和测试数据集,只能得到一个分类结果,即一组FPR和TPR结果,而要得到一条ROC曲线,我们实际上需要一系列FPRateTPRate的值,那该怎么办呢?下面以一个实列来详细说明:

对于LR等预测类别为概率的分类器,假设预测结果如下:

图二 LR 分类器预测结果

       我们从高到低,依次将预测值作为阈值threshold,当测试样本属于正样本的概率大于或等于这个threshold时,认为它为正样本,否则为负样本。举例来说,当阈值取0.9时,正样本为1,其余为负样本,当阈值取0.8时,正样本为1,2。其余以此类推。每次选取一个不同的threshold,我们就可以得到一组FPRateTPRate,即ROC曲线上的一点。threshold取值越多,ROC曲线越平滑。

      AUC(Area Under Curve)被定义为ROC曲线下的面积,这个面积的数值不会大于1。ROC曲线一般都处于y=x这条直线的上方,AUC的取值范围在0.5和1之间。

AUC值的意义?

        AUC值是一个概率值,当你随机挑选一个正样本以及一个负样本,当前的分类器根据计算得到的预测值将这个正样本排在负样本前面的概率就是AUC值。AUC值越大,当前的分类算法越有可能将正样本排在负样本前面,即能够更好的分类。

为什么使用ROC曲线?

测试集中的正负样本分布不均衡时的评价指标。

参考文献:ROC和AUC介绍以及如何计算AUC

相关文章

  • 2018-06-13 AUC评价指标的理解

    ROC(Receiver Operating Characteristic)曲线和AUC常被用来评价一个二值...

  • 如何直观理解AUC评价指标?

    https://blog.csdn.net/cherrylvlei/article/details/5295872...

  • 评价指标的理解

    课程评价分学生评价和课堂时效的评价。 评价基于课程目标。基础教育的课程目标需要准确定位不能任意拔高。 评价有依赖于...

  • 对模型评价指标AUC的理解

    AUC是一种衡量机器学习模型分类性能的重要且非常常用的指标,其只能用于二分类的情况.AUC的本质含义反映的是对于任...

  • 机器学习基础:AUC

    AUC简介 AUC是Area Under Curve的首字母缩写,这里的Curve指的就是ROC曲线,AUC就是R...

  • 开篇记录面试第20天——P-R曲线和ROC曲线

    今天看了 一会评价指标的问题,终于把昨天那个AUC曲线为什么不会随正负样本比例变化而变化。首先我们明确一个概念,不...

  • 理解AUC

    1. 使用准确率评估二分类器有什么问题? 如果测试集合样本分布非常不均匀,如检查人是否患肿瘤、点击率预估,肿瘤患病...

  • 什么是AUC

    1.混淆矩阵 首先,在理解什么是AUC之前,先要理解什么是混淆矩阵,这样对我们理解AUC会有很大的帮助。混淆矩阵中...

  • 4.machine_learning_eval_metric_a

    1.机器学习指标ROC与AUC 1.1ROC与AUC AUC是一种模型分类指标,且仅仅是二分类模型的评价指标。AU...

  • 【机器学习】:理解分类模型评价指标AUC

    (Receiver Operating Characteristic) 纵轴TPR(真正例率)和横轴FPR(假正例...

网友评论

      本文标题:2018-06-13 AUC评价指标的理解

      本文链接:https://www.haomeiwen.com/subject/eqxseftx.html