美文网首页
朴素贝叶斯

朴素贝叶斯

作者: 形式主义_5adc | 来源:发表于2019-02-17 15:11 被阅读0次

贝叶斯公式

朴素贝叶斯

朴素贝叶斯的一个重要假设是:属性是相互独立的。这是一个强硬的假设,但实际情况下,这项技术对于绝大部分的复杂问题仍然非常有效。

假设我们想求在A1、A2、A3属性下的,Cj的概率,用条件概率表示就是P(Cj|A1A2A3)。由贝叶斯公式可以得出:

在上面公式中,P(A1A2A3)都是固定的,所以求P(Cj|A1A2A3)等价于求P(A1A2A3|Cj)P(Cj) 最大值。

因为Ai之间是相互独立的,P(A1A2A3|Cj)=P(A1|Cj)P(A2|Cj)P(A3|Cj)

朴素贝叶斯分类器工作流程

第一阶段:准备阶段

确定特征属性,并对每个特征属性进行适当划分,然后人工对一部分数据进行分类,形成训练样本。这一阶段是唯一需要人工完成的阶段,其质量对整个过程将有重要影响,分类器的质量很大程度上由特征属性、特征属性划分及训练样本质量决定。

第二阶段:训练阶段

这个阶段就是生成分类器,主要工作是计算每个类别在训练样本中的出现频率及每个特征属性划分对每个类别的条件概率。

输入是特征属性和训练样本,输出是分类器。

第三阶段:应用阶段

这个阶段是使用分类器对新数据进行分类。输入是分类器和新数据,输出是新数据的分类结果。

sklearn中的朴素贝叶斯分类器

sklearn中提供了3个朴素贝叶斯分类算法:

高斯朴素贝叶斯:

特征变量是连续变量,符合高斯分布,比如人的身高,物体的长度。

多项式朴素贝叶斯:

特征变量是离散变量,符合多项分布,在文档分类中特征变量体现在一个单词出现的次数,或者是单词的TF-IDF值等。

伯努利朴素贝叶斯:

特征变量是布尔变量,符合0/1分布,在文档分类中特征是单词是否出现。


在多项式朴素贝叶斯中提到的TF-IDF是一个统计方法,用来评估某个词语对于一个文件集或文档库中的其中一份文件的重要程度。

TF(Term Frequency)代表词频,计算了一个单词在文档中出现的次数。

IDF(Inverse Document Frequency)是逆向文档率,是指一个单词在文档中的区分度,它认为一个单词出现在的文档数越少,就越能通过这个单词把该文档和其它文档区分开。

TF-IDF实际为TF和IDF的乘积,即TF-IDF=TF*IDF

相关文章

  • 算法笔记(7)-朴素贝叶斯算法及Python代码实现

    朴素贝叶斯算法有三种类型,分别是贝努利朴素贝叶斯、高斯贝叶斯、多项式朴素贝叶斯。 贝叶斯公式 贝努利朴素贝叶斯 适...

  • 朴素贝叶斯法

    朴素贝叶斯法 朴素贝叶斯法的学习与分类 朴素贝叶斯法的参数估计 朴素贝叶斯实现 高斯朴素贝叶斯实现 使用 skle...

  • 朴素贝叶斯(NBM)之后验概率最大化的含义 | 统计学习方法

    朴素贝叶斯 - 贝叶斯估计Python复现: 舟晓南:朴素贝叶斯(Bayes)模型python复现 - 贝叶斯估计...

  • 朴素贝叶斯算法介绍及优化

    朴素贝叶斯(Naive Bayes) 贝叶斯公式 朴素贝叶斯算法其实原理很简单,要理解朴素贝叶斯算法我们首先得知道...

  • 朴素贝叶斯法(NaiveBayes)

    朴素贝叶斯法(Naive Bayes) 朴素贝叶斯法是基于贝叶斯定力和特征条件独立假设的分类方法。 朴素贝叶斯法实...

  • 朴素贝叶斯算法

    问题 1. 什么是朴素贝叶斯 2. 怎么理解贝叶斯公式和朴素贝叶斯公式 3. 朴素贝叶斯算法流程是怎样...

  • 深度学习知识点汇总-机器学习基础(6)

    2.6 逻辑回归与朴素贝叶斯有什么区别? 逻辑回归是判别模型, 朴素贝叶斯是生成模型。 朴素贝叶斯属于贝叶斯,逻辑...

  • 朴素贝叶斯

    朴素贝叶斯 用处:朴素贝叶斯主要解决的是而分类的问题。 为什么叫朴素贝叶斯: 因为贝叶斯分类只做最原始,最简单的假...

  • sklearn-朴素贝叶斯

    朴素贝叶斯分为三种:高斯朴素贝叶斯、多项式朴素贝叶斯、伯努利朴素贝叶斯。这三种的不同之处在于求条件概率的公式不同。...

  • 第五周 - 20180507

    朴素贝叶斯的思路及实现 一、朴素贝叶斯简介 朴素贝叶斯法(Naive Bayes)是基于贝叶斯定理与特征条件独立假...

网友评论

      本文标题:朴素贝叶斯

      本文链接:https://www.haomeiwen.com/subject/kbgmeqtx.html