当前位置:网站首页>机器学习——朴素贝叶斯
机器学习——朴素贝叶斯
2022-04-23 06:11:00 【DCGJ666】
机器学习——朴素贝叶斯
优点:
- 算法逻辑简单,易于实现
- 分类过程中时空开销小,分类准确率高,速度快
- 朴素贝叶斯模型发源于古典数学理论,有稳定的分类效率
- 对缺失数据不太敏感,算法也比较简单,常用于文本分类
- 对小规模的数据表现很好,能处理多分类任务,适合增量式训练
缺点:
- 理论上,朴素贝叶斯模型与其他分类方法相比具有最小的误差率。但是实际上并非总是如此,这是因为朴素贝叶斯模型假设属性之间相互独立,这个假设在实际应用中往往是不成立的,在属性个数比较多或者属性之间相关性较大时,分类效果不好。
- 需要知道先验概率,且先验概率很多时候是基于假设或者已有的训练数据所得的,这在某些时候可能会因为假设先验概率的原因出现分类决策上的错误。
朴素贝叶斯
朴素贝叶斯是一个基于特征条件独立假设和贝叶斯原理的一种分类算法。朴素贝叶斯通过训练数据得到X与y的联合分布;之后对于要预测的X,根据贝叶斯公式,输出后验概率最大的y。
朴素贝叶斯 是一种生成式 学习算法,其生成方法通过学习X,Y的联合分布来实现的。假设各个特征再给定y的情况下是相互独立的。
贝叶斯公式
P ( B ∣ A ) = P ( B ) P ( A ∣ B ) P ( A ) P(B \mid A)=\frac{P(B) P(A \mid B)}{P(A)} P(B∣A)=P(A)P(B)P(A∣B)
公式中,事件B的概率为P(B),事件B已发生条件下事件A的概率为P(A|B),事件A发生条件下事件B的概率为P(B|A)
朴素贝叶斯的“朴素”怎么理解
朴素贝叶斯中的朴素可以理解为是“简单,天真”的意思,因为“朴素”是假设了特征之间是同等重要,相互独立,互不影响的,但是在我们的现实社会中,属性之间并不都是互相独立的。
什么是拉普拉斯平滑法
拉普拉斯平滑法是朴素贝叶斯中处理零概率问题的一种修正方式。在进行分类的时候,可能会出现某个属性在训练集中没有与某个类同时出现过的情况,如果直接基于朴素贝叶斯分类器的表达式进行计算的话就会出现零概率现象。为了避免其他属性所携带的信息被训练集中未出现过的属性值“抹去”,所以才使用拉普拉斯估计器进行修正。具体方法是:在分子上加1, 对于先验概率,在分母上加上训练集中可能的类别数;对于条件概率,则在分母上加上第i个属性可能的取值数
朴素贝叶斯的应用
朴素贝叶斯的应用最广的应该是文档分类,垃圾文本过滤,情感分析,推荐系统,拼写校正等。
朴素贝叶斯对异常值敏不敏感
朴素贝叶斯对异常值不敏感。所以在进行数据处理时,我们可以不去除异常值,因为保留异常值可以保持朴素贝叶斯算法耳朵整体精度,而去除异常值则可能在进行预测的过程中由于失去部分异常值导致模型的泛化能力下降
先验概率与后验概率
先验概率:直接是某件事发生的概率
后验概率:已知某件事发生,导致这件事发生的概率
版权声明
本文为[DCGJ666]所创,转载请带上原文链接,感谢
https://blog.csdn.net/DCGJ666/article/details/124350182
边栏推荐
- 【点云系列】Multi-view Neural Human Rendering (NHR)
- Cancel remote dependency and use local dependency
- Android interview Online Economic encyclopedia [constantly updating...]
- Bottom navigation bar based on bottomnavigationview
- [3D shape reconstruction series] implicit functions in feature space for 3D shape reconstruction and completion
- 5种方法获取Torch网络模型参数量计算量等信息
- 第2章 Pytorch基础2
- 【点云系列】Fully-Convolutional geometric features
- Machine learning III: classification prediction based on logistic regression
- Handler进阶之sendMessage原理探索
猜你喜欢

ArcGIS License Server Administrator 无法启动解决方法
![Gephi tutorial [1] installation](/img/f7/a37be7ac1af3216b7491e500760ad6.png)
Gephi tutorial [1] installation

Binder mechanism principle

第1章 NumPy基础
![[2021 book recommendation] artistic intelligence for IOT Cookbook](/img/8a/3ff45a911becb895e6dd9e061ac252.png)
[2021 book recommendation] artistic intelligence for IOT Cookbook

第8章 生成式深度学习

MySQL数据库安装与配置详解

Cancel remote dependency and use local dependency
![[3D shape reconstruction series] implicit functions in feature space for 3D shape reconstruction and completion](/img/4d/6d5821759766a6bf1d77ad51b69e24.png)
[3D shape reconstruction series] implicit functions in feature space for 3D shape reconstruction and completion

第2章 Pytorch基础1
随机推荐
[point cloud series] sg-gan: advantageous self attention GCN for point cloud topological parts generation
Handler进阶之sendMessage原理探索
图像分类白盒对抗攻击技术总结
Android exposed components - ignored component security
PyMySQL连接数据库
[point cloud series] a rotation invariant framework for deep point cloud analysis
[Point Cloud Series] SG - Gan: Adversarial Self - attachment GCN for Point Cloud Topological parts Generation
【2021年新书推荐】Professional Azure SQL Managed Database Administration
Machine learning notes 1: learning ideas
DCMTK (dcm4che) works together with dicoogle
ArcGIS license server administrator cannot start the workaround
MySQL的安装与配置——详细教程
【动态规划】不同的二叉搜索树
【2021年新书推荐】Artificial Intelligence for IoT Cookbook
The Cora dataset was trained and tested using the official torch GCN
Chapter 3 pytoch neural network toolbox
【点云系列】Multi-view Neural Human Rendering (NHR)
读书小记——Activity
PyTorch最佳实践和代码编写风格指南
【动态规划】三角形最小路径和