当前位置:网站首页>机器学习(六)——贝叶斯分类器
机器学习(六)——贝叶斯分类器
2022-04-23 09:03:00 【一大块肉松】
贝叶斯分类器是一类分类算法的总称,均以贝叶斯定理为理论基础
一、预备知识—贝叶斯决策论
1.公式
\qquad 贝叶斯决策论是概率框架下的实施决策的基本方法。对于分类任务来说,在所有相关概率都已知的理想情况下,贝叶斯决策论考虑如何基于概率和误判损失来选择最优的类别标记。
\qquad 假设有N种输出类别,表示为 y y y={ c 1 , c 2 , c 3 . . . . . c N c_1,c_2,c_3.....c_N c1,c2,c3.....cN}
\qquad λ i j \lambda_{ij} λij表示为将一个真实属于 c j c_j cj的样本误分类为 c i c_i ci产生的损失。
\qquad 则将样本 x x x分类为 c i c_i ci所产生的期望损失,即在样本 x x x上的“条件风险”为:
上述公式可以理解为:
要想实现正确的分类,则需要最小化期望损失,上述是单个样本的期望损失,则整体的损失期望为:

\qquad 根据上式可以得知,若对每个样本最小化条件风险,则整体的风险 R ( h ) R(h) R(h),也将被最小化。这就产生了贝叶斯判定准则:为最小化总体风险,只需在每个样本上选择那个能使条件风险 R ( c ∣ x ) R(c|x) R(c∣x)最小的类别标记。

h ∗ h^* h∗称为贝叶斯最优分类器。
2.最小化分类错误率
误判损失 λ i j \lambda_{ij} λij,设置为0/1损失函数:

此时条件风险:

上式由来:
于是最小化分类错误率的贝叶斯最优分类器为:

即对每个样本 x x x,选择能使后验概率 P ( c ∣ x ) P(c|x) P(c∣x)最大的类别标记
3.后验概率
\qquad 由以上讲解可知,要求得最小化决策风险,首先要获得后验概率 P ( c ∣ x ) 。 P(c|x)。 P(c∣x)。
\qquad 从这个角度来说,机器学习的所要完成的任务是基于有限的训练样本集尽可能准确的估计出后验概率 P ( c ∣ x ) P(c|x) P(c∣x),根据生成策略不同,分成了两大模型:
判别式模型
生成式模型
所谓的判别式模型,直接建模后验概率 P ( c ∣ x ) 。 P(c|x)。 P(c∣x)。
所谓的生成式模型,:对联合概率分布 P ( c , x ) P(c,x) P(c,x)建模,再得到后验概率 P ( c ∣ x ) 。 P(c|x)。 P(c∣x)。
生成式的模型:

基于贝叶斯定理可写成:

其中: P ( c ∣ x ) : 后 验 概 率 P(c|x):后验概率 P(c∣x):后验概率
P ( c ) : 先 验 概 率 P(c):先验概率 P(c):先验概率
P ( x ∣ c ) : 似 然 概 率 P(x|c):似然概率 P(x∣c):似然概率
二、极大似然估计
根据贝叶斯定理:

求最大后验概率 P ( c ∣ x ) P(c|x) P(c∣x)转化为求最大似然 P ( x ∣ c ) P(x|c) P(x∣c)。
\qquad 设训练集为 D D D
\qquad 第 c c c类的标签记为 θ c \theta_c θc
\qquad 记由第c类的标签组成的集合为 D c D_c Dc(个人理解 D c : D_c: Dc:就是指集合中哪些特征组合起来可以得到 θ c \theta_c θc类样本)
\qquad 假设这些样本都是独立同分布的,则参数 θ c \theta_c θc对于数据集 D c D_c Dc的似然是:
上式是连乘操作,容易造成下溢,通常使用对数似然:
三、朴素贝叶斯分类器
1.定义
朴素贝叶斯分类器采用了“属性条件独立性假设”:对已知类别,假设所有的属性相互独立。
根据属性条件独立性假设,可重写贝叶斯法则:
即求最大化:
令 D c D_c Dc 表示训练集 D D D中第c类样本组成的集合,根据独立同分布的性质可计算出先验概率 P ( c ) P(c) P(c):
令 D c , x i D_{c,x_i} Dc,xi 表示 D c D_c Dc中在第 i i i个属性上取值为 x i x_i xi的样本组成的集合,则条件概率 P ( x i ∣ c ) P(x_i|c) P(xi∣c):
2.计算案例
为了避免其他属性携带的信息被训练集中未出现的属性值抹去,在估计概率时通常要进行“平滑“,常用”拉普拉多修正“。
四、半朴素贝叶斯分类器
在现实任务中,满足不了朴素贝叶斯所假设的属性条件独立,即很难成立。
由此半朴素贝叶斯分类器由此产生
\qquad 半朴素贝叶斯分类器的基本想法:适当考虑一部分属性间的相互依赖信息,从而既不需要进行完全概率联合计算,又不至于彻底忽略了比较强的属性依赖关系。
\qquad ”独依赖估计“(One-Dependent Estimation ,ODE)是半朴素贝叶斯分类器最常用的一种策略,也就是指假设每个属性在类别之外最多仅依赖于一个其他属性,即
不同的做法,可以产生不同的独依赖分类器:
SPORT
TAN
AODE
五、贝叶斯网
贝叶斯网刻画了所有属性之间所存在的依赖关系。
贝叶斯网,有称为“信念网”;
在现实任务中,贝叶斯网是未知的,需要我们根据训练集找出结构最恰当的贝叶斯网。
“评分搜索”是求解这个问题的常用方法。
\qquad 但是现实,是从训练集中搜索找到最优贝叶斯网结构是一个NP难问题,难以快速求解。
\qquad 有两种常用的策略能在有限的时间内求解近似解:
\qquad 第一种:贪心法,例如从某个网络结构出发,每次调整一条边,直到评分函数值不再降低为止;
\qquad 第二种:通过给网络结构施加约束来削减搜索空间,例如将网络结构限定为树形结构。
五、EM算法
\qquad 在前面的讨论中,我们一直假设训练样本所有属性变量的值都已被观测到,即训练样本是“完整”的。
\qquad 但在实际应用中往往会遇到“不完整”的训练样本,例如由于西瓜的根蒂已经脱落,无法看出是“蜷缩”还是“硬挺”,则训练样本的“根蒂”属性变量值未知,在这种存在”未观测“变量的情形下,是否仍然能对模型参数进行估计呢?
针对存在未知属性变量的现象,我们可以采用EM算法
EM算法是常用的估计参数隐变量的利器。
相比于之前的公式,多了 Z Z Z(隐变量集)
EM算法的基本思想:若参数 θ \theta θ已知,则可根据训练数据推断出最优隐变量 Z Z Z的值(E步);反之,若 Z Z Z已知,则可方便的对参数 θ \theta θ做极大似然估计。
六、学习资料
版权声明
本文为[一大块肉松]所创,转载请带上原文链接,感谢
https://blog.csdn.net/weixin_51547017/article/details/124336658
边栏推荐
- Complete binary search tree (30 points)
- Restore binary tree (25 points)
- Resource packaging dependency tree
- Leetcode-199 - right view of binary tree
- Data visualization: use Excel to make radar chart
- 爬虫使用xpath解析时返回为空,获取不到相应的元素的原因和解决办法
- L2-022 重排链表 (25 分)(map+结构体模拟)
- tsdf +mvs
- Notes d'apprentissage oneflow: de functor à opexprinterpreter
- valgrind和kcachegrind使用運行分析
猜你喜欢

小程序报错 :should have url attribute when using navigateTo, redirectTo or switchTab

Arbre de dépendance de l'emballage des ressources

Idea package jar file

Automatic differentiation and higher order derivative in deep learning framework

Star Trek强势来袭 开启元宇宙虚拟与现实的梦幻联动
![[C language] document operation](/img/89/b19dda13d27e37fedf6736c102245b.png)
[C language] document operation

企业微信应用授权/静默登录

LLVM之父Chris Lattner:编译器的黄金时代

共享办公室,提升入驻体验

PLC的点表(寄存器地址和点表定义)破解探测方案--方便工业互联网数据采集
随机推荐
Research purpose, construction goal, construction significance, technological innovation, technological effect
Pctp test experience sharing
PLC的点表(寄存器地址和点表定义)破解探测方案--方便工业互联网数据采集
Taxable income
L2-3 浪漫侧影 (25 分)
K210 learning notes (II) serial communication between k210 and stm32
Star Trek's strong attack opens the dream linkage between metacosmic virtual reality
Applet in wechat and app get current ()
To remember the composition ~ the pre order traversal of binary tree
Valgrind et kcachegrind utilisent l'analyse d'exécution
Valgrind and kcache grind use run analysis
Illegal character in scheme name at index 0:
Non duplicate data values of two MySQL query tables
Summary of solid problems
MySQL小練習(僅適合初學者,非初學者勿進)
Share the office and improve the settled experience
数字政府建设中政务中台中的技术创新点
Four pictures to understand some basic usage of Matplotlib
The most concerned occupations after 00: civil servants ranked second. What was the first?
根据后序和中序遍历输出先序遍历 (25 分)










