理解AUC

作者: XueGuoqing01 | 来源:发表于2017-09-04 12:34 被阅读0次

1. 使用准确率评估二分类器有什么问题?

如果测试集合样本分布非常不均匀,如检查人是否患肿瘤、点击率预估,肿瘤患病率和点击率一般来说非常小。例如在预测预测是否患肿瘤这个例子中,测试样本中有5%的人患有肿瘤,这时二分类器判断都未患肿瘤那么这个分类器的准确率就是95%,这显然是不合理的。

2. 什么是AUC

那么当样本分布非常不均匀时我们该使用什么指标评价一个二分类器呢?AUC(Area Under the Curve),从字面上理解就是曲线下的面积,什么曲线?ROC(Receiver Operator Characteristic),中文译做接收者操作特征曲线。曲线的横坐标为假正例率,纵坐标为真正例率
假正例率(FPR):被预测为正例中负例数/实际负例数。
真正例率(TPR):被预测为正例中正例数/实际正例数。
根据以上定义可以得出,当分类器预测为全1时FPR、TPR全为1,当分类器预测为全0时FPR、TPR全为0。

3. AUC的意义

AUC是任取一对正负例,分类器给出正例得分大于负例得分的概率,反映了分类器的排序能力,从这个角度来说:

  • AUC=1,完美分类器,正例得分一定大于负例得分。
  • 0.5<AUC<1,正例得分大于负例得分概率大于0.5,该分类器有效果。
  • AUC=0.5,正例得分随机大于负例概率,分类器无效。
  • 0<AUC<0.5,正例得分大于负例得分概率小于0.5,比随机猜测还差。

相关文章

  • 理解AUC

    1. 使用准确率评估二分类器有什么问题? 如果测试集合样本分布非常不均匀,如检查人是否患肿瘤、点击率预估,肿瘤患病...

  • 什么是AUC

    1.混淆矩阵 首先,在理解什么是AUC之前,先要理解什么是混淆矩阵,这样对我们理解AUC会有很大的帮助。混淆矩阵中...

  • AUC的理解

    曾经面试的时候被问到过这么一个问题,怎么向一个没有任何计算机、数学、统计等基础的人介绍下什么是AUC,当时我败北了...

  • 看完理解ROC与AUC

    混淆矩阵、AUC、ROC,傻傻分不清楚?来看这篇就对了 - 知乎 对准确率、精确率、召回率、AUC、ROC的理解 ...

  • sklearn notes

    Difference between roc_auc_score() and auc() AUC is not a...

  • 理解ROC和AUC

    ROC ROC的定义 比方说在一个10000个人的数据集中,有100个人得了某种病症,你的任务是来预测哪些人得了这...

  • 二分类评估,从混淆矩阵说起

    在《理解交叉验证》一文中,我们谈到了使用 AUC 来对比不同模型的好坏,那么 AUC 是什么?它是如何衡量一个模型...

  • 2020-07-07在用for循环时如何往一个向量里面反复添加数

    auc_value<-as.numeric() auc_value<- append(auc_value, as....

  • AUC面试

    目录 混淆矩阵 ROC曲线 AUC定义 AUC计算 AUC 优点和缺点 AUC的python实现代码 1. 混淆矩...

  • 机器学习基础:AUC

    AUC简介 AUC是Area Under Curve的首字母缩写,这里的Curve指的就是ROC曲线,AUC就是R...

网友评论

      本文标题:理解AUC

      本文链接:https://www.haomeiwen.com/subject/uzzsjxtx.html