美文网首页
二分类和混淆矩阵

二分类和混淆矩阵

作者: IT孔乙己 | 来源:发表于2021-12-15 13:49 被阅读0次

二值分类器(Binary Classifier)是机器学习领域中应用最为广泛的分类器之一。在二分类的应用场景下,我们可以根据真实类别和预测类别的不同组合,将样本划分为如下四类:

  • 真正类(True Positive,简称 TP):实际为正类,且被模型预测为正类的样本。
  • 假正类(False Positive,简称 FP):实际为负类,但被模型预测为正类的样本。
  • 真负类(True Negative,简称 TN):实际为负类,且被模型预测为负类的样本。
  • 假负类(False Negative,简称 FN):实际为正类,但被模型预测为负类的样本。

显然,这四类样本是没有交集的,并且 TP+FP+TN+FN=样本总数。其中第一类和第三类是预测正确的样本,第二类和第四类是预测错误的样本。我们把样本实际为负类,但被模型预测为正类的错误称为误报(也称第 Ⅰ 类错误);把样本实际为正类,但被模型预测为负类的错误称为漏报(也称第 Ⅱ 类错误)。

TP、FP、TN 和 FN 这四类样本,一起构成了一个混淆矩阵(confusion matrix),如图 1 所示。

二分类结果的混淆矩阵

图 1:二分类结果的混淆矩阵

本质上,混淆矩阵会把实际样本分类值(true class)和模型预测分类值(predicted class)进行联列表分析。在二分类问题中,通常我们会把样本分为正类(或正例,常用“1”表示)和负类(负例,常用“-1”表示)。

对于分类而言,评估分类器最简单、最直接的标准就是分类准确率(Accuracy),即分类正确的样本数占总样本数的比例:

Accuracy=ncorrect/ntotal

针对二分类,这个准确率可具体表示为:

Accuracy=(TP+TN)/ntotal

但单纯用准确率来刻画分类算法的性能,不够严谨。有时我们还需要借助诸如查全率、查准率和 F1 分数更为细致地来评估性能。

相关文章

  • 评价-分类算法的评价指标

    二元分类评价 混淆矩阵 对于二元分类,通常可以输出混淆矩阵,看预测的情况,并从中总结出一些指标,给予评价。混淆矩阵...

  • 2018-04-21FCN结果分析

    一、混淆矩阵confusion matrix 1,混淆矩阵 2,分类器评估方法:准确率和混淆矩阵*** 使用混淆矩...

  • 混淆矩阵与精确率

    机器学习中,常使用混淆矩阵来对分类模型的效果进行衡量,本文主要讲述一下标准的二分类混淆矩阵与多分类混淆矩阵、准确率...

  • 模型评估指标

    混淆矩阵、精确率、召回率,ROC、AUC 对于二分类问题来说,所有的问题被分为0和1两类,混淆矩阵是2*2的矩阵:...

  • 分类评价指标

    1. 混淆矩阵(Confusion matrix) 定义: 混淆矩阵是数据科学、数据分析和机器学习中分类模型预测结...

  • 混淆矩阵

    摘要:不用千字,带您透析混淆矩阵。 混淆矩阵(confusion matrix)衡量的是一个分类器分类的准确程度。...

  • 混淆矩阵confusion_matrix函数

    1.混淆矩阵 混淆矩阵是机器学习中总结分类模型预测结果的情形分析表,以矩阵形式将数据集中的记录按照真实的类别与分类...

  • 数据可视化-混淆矩阵(confusion matrix)

    1. 混淆矩阵(confusion matrix)介绍 在基于深度学习的分类识别领域中,经常采用统计学中的混淆矩阵...

  • 机器学习-分类评估方法-精确率-召回率-ROC曲线-AUC指标

    一、分类评估的方法: 1、精确率2、召回率 二、概念介绍: 1、混淆矩阵:在分类任务下,预测结果(Predicte...

  • 不平衡类问题-分类的评估指标

    分类指标 1.混淆矩阵 混淆矩阵也称误差矩阵,是表示精度评价的一种标准格式,用n行n列的矩阵形式来表示。 具体评价...

网友评论

      本文标题:二分类和混淆矩阵

      本文链接:https://www.haomeiwen.com/subject/icocfrtx.html