朴素贝叶斯分类算法预测具有属性的人是不是买电脑python
Posted
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了朴素贝叶斯分类算法预测具有属性的人是不是买电脑python相关的知识,希望对你有一定的参考价值。
它是一种基于贝叶斯定理的分类技术,具有预测者之间的独立性假设。简单地说,朴素贝叶斯分类器假定类中的特定特征的存在与任何其他特征的存在无关。例如,水果如果是红色的、圆的、直径约3英寸的,那么久可以被认为是一个苹果。即使这些特征彼此依赖或存在其他特征,朴素贝叶斯分类器将考虑所有这些属性来独立地区分这种水果是苹果的概率。朴素贝叶斯模型易于建立,特别适用于非常大的数据集。虽然简单,但朴素贝叶斯是已知的高性能甚至高度复杂的分类方法。
Bayes定理为P(C)、P(X)和P(X,C)的后验概率p(C* x)的计算提供了一种途径。请看下面的方程式:
机器学习算法:朴素贝叶斯|python与r语言代码实现
在这里,
P(C x)是给定(属性)的类(目标)的后验概率。
P(C)是类的先验概率。
P(x,c)是预测给定类的概率。
P(x)是预测器的先验概率。
例子:让我们用一个例子来理解它。下面我有一个训练数据集的天气和相应的目标变量“玩”。现在,我们需要根据天气情况来判断玩家是否想玩。让我们按照下面的步骤来执行它。
步骤1:将数据集转换为频率表
步骤二:通过发现阴暗概率=0.29和概率为0.64的概率来创建似然表。
机器学习算法:朴素贝叶斯|python与r语言代码实现
步骤三:使用朴素贝叶斯方程计算每个类的后验概率。具有最高后验概率的类是预测的结果。
问题:如果天气晴朗,玩家会想玩,这个说法是正确的吗?
我们可以用上面讨论的方法求解它,所以P(Yes | Sunny) = P( Sunny | Yes) * P(Yes) / P (Sunny)
这里我们有P (Sunny |Yes) = 3/9 = 0.33, P(Sunny) = 5/14 = 0.36, P( Yes)= 9/14 = 0.64 得出, P (Yes | Sunny) = 0.33 * 0.64 / 0.36 = 0.60,具有较高的概率。
朴素贝叶斯使用类似的方法来预测基于不同属性的不同类别的概率。该算法主要用于文本分类,存在多类问题。 参考技术A 朴素贝叶斯分类算法预测具有属性的人是否买电脑python
朴素贝叶斯分类是一类分类算法的总称,这类算法均以贝叶斯定理为基础,故统称为贝叶斯分类。而朴素朴素贝叶斯分类是贝叶斯分类中最简单,也是常见的一种
朴素贝叶斯简介
本文为那些想知道更多关于机器学习最简单和概率方法的人,朴素贝叶斯。
朴素贝叶斯是在监督机器学习的基础上,根据先验知识和独立假设,对数据集进行分类和预测。
朴素贝叶斯算法:
是对未知数据集进行决策的分类算法。它基于贝叶斯定理,该定理基于其先验知识描述事件的概率。
它被广泛用于在谷歌搜索,电子邮件排序,语言检测等各种应用中使用的文本分类。下图显示了NB如何实现预测。
它用于检查数据集的先验概率,并提供新的概率。
对于所有数据集,先验概率总是被划分为50%-50%,并且算法的工作是基于当前存在的对象来确定它属于哪个类别标签。
例如:体重和身高是决定玩家是相扑选手还是篮球选手的参数。最初,它分为平均分配的两部分。
预测NB的公式:
P(H|E)是给定预测因子(E,attributes)的类(H, target)的后验概率。
P(H)是先验概率。
P(E|H)是预测给定类概率的可能性。
P(E)是预测因子的先验概率。
如何使用朴素贝叶斯算法?
用例:在天气条件下和相应的目标变量“Play”(暗示Playing的可能性)。现在,我们需要根据天气情况对球员是否上场进行分类。让我们按照下面的步骤来执行它。
步骤1:首先我们找到表示下面图表中yes或no概率的表格
步骤2:查找每个类的后验概率。
问题:找出球员是否在Rainy状态下进行比赛的可能性?
P(Yes|Rainy) = P(Rainy|Yes) * P(Yes) / P(Rainy)
P(Rainy|Yes) = 2/9 = 0.222
P(Yes) = 9/14 = 0.64
P(Rainy) = 5/14 = 0.36
现在,P(Yes | Rainy)= 0.222 * 0.64 / 0.36 = 0.39这是较低的概率,这意味着比赛的机会很低。
使用朴素贝叶斯算法的场景:
如果你有一个中等或大型的训练数据集。
如果实例有多个属性。
给定分类参数,描述实例的属性应该是有条件独立的。
当内存和CPU资源有限时。
它的计算量更小。
朴素贝叶斯算法的利与弊?
优点:
容易实现
减少模型的复杂性
更少的CPU计算。
当数据集很小的时候表现良好。
缺点:
非常强烈的假设,由于这些结果是不好的,它被称为naively。
数据稀缺
现实生活中的问题,如无变量依赖。
当数据过大时表现不佳,假设所有特性都是独立的。
以上是关于朴素贝叶斯分类算法预测具有属性的人是不是买电脑python的主要内容,如果未能解决你的问题,请参考以下文章