基尼不纯度

作者: 阿发贝塔伽马 | 来源:发表于2017-10-29 23:48 被阅读100次

基尼不纯度的大概意思是 一个随机事件变成它的对立事件的概率
例如 一个随机事件X ,

    P(X=0) = 0.5 ,P(X=1)=0.5

那么基尼不纯度就为

P(X=0)*(1 - P(X=0)) +   P(X=1)*(1 - P(X=1))  = 0.5

一个随机事件Y ,

    P(Y=0) = 0.1 ,P(Y=1)=0.9

那么基尼不纯度就为

      P(Y=0)*(1 - P(Y=0)) +   P(Y=1)*(1 - P(Y=1))  = 0.18

很明显 X比Y更混乱,因为两个都为0.5 很难判断哪个发生。而Y就确定得多,Y=0发生的概率很大。而基尼不纯度也就越小。
所以基尼不纯度也可以作为 衡量系统混乱程度的 标准

相关文章

  • 基尼不纯度

    基尼不纯度的大概意思是 一个随机事件变成它的对立事件的概率例如 一个随机事件X , 那么基尼不纯度就为 一个随机事...

  • 【AI基础】基尼系数与基尼不纯度

    学过决策树的人大概都知道,构造树可以用基尼系数。那问题来了,衡量收入分配差异也可以用基尼系数,这两个基尼系数计算过...

  • 决策树之CART算法

    一、基本概念 1.cart使用基尼系数作为划分标准。基尼系数越小,则不纯度越低,区分的越彻底。 2.假设有k个类别...

  • 人工智能通识-科普-Gini基尼系数

    欢迎关注我的专栏( つ•̀ω•́)つ【人工智能通识】 经济学中的基尼系数和决策树中的基尼杂质(不纯度)是不同的概念...

  • 决策树算法梳理

    信息论基础(熵 联合熵 条件熵 信息增益 基尼不纯度) 信息熵:信息熵是度量样本集合纯度常用的一种指标。在信息论中...

  • 决策树算法梳理

    决策树算法梳理 1. 信息论基础(熵 联合熵 条件熵 信息增益 基尼不纯度) 1.1 熵 (entropy)...

  • 机器学习信仰之决策树

    ###熵、信息增益、信息增益比、基尼系数 ####熵 --- 度量随机变量的不确定性(纯度) 定义:假设随机变量X...

  • 使用信息熵来确定文本相似度

    使用场景 web请求日志 对于标称型数据我们通常用信息熵或者基尼不纯度来判定混乱程度,对于数值型问题则用方差作为判...

  • 决策树算法

    一、通俗理解熵和基尼不纯度 1.信息熵 熵度量事物的不确定性,越不确定的事物,它的熵就越大。随机变量的熵的表达式如...

  • 试试看,猫基尼

    猫基尼

网友评论

    本文标题:基尼不纯度

    本文链接:https://www.haomeiwen.com/subject/qpbupxtx.html