当前位置:网站首页>Chapter 14 主题模型
Chapter 14 主题模型
2022-08-07 15:01:00 【桑之未落0208】
1 LDA模型
1.1 LDA的应用方向
信息提取和搜索(语义分析);文档分类、聚类、文章摘要、社区挖掘;基于内容的图像聚类、目标识别(以及其他计算机视觉应用);生物信息数据的应用
1.2 LDA出现的原因
前文提到的“朴素贝叶斯”可以胜任许多文本分类问题,但是无法解决一词多义(花:花朵和花费)和多词一义(陛下:天子和皇上)的问题·。因此可以通过增加“主题”的方式,一定程度上解决这些问题。
针对一词多义的情况:在主题模型中一个词可能被映射到多个主题中。
针对多词一义的情况:在主题模型中多个同意思的词可能被映射到某个主题的概率很高。
2 Beta分布-Dirichlet分布
2.1 Beta分布介绍
Beta分布的概率密度为:
,其中系数B为:
PS:
函数的介绍
函数是阶乘在实数上的推广:
由此:
2.2 Beta分布的期望

2.3 共轭先验分布相关介绍
由于x为给定样本,
有时被称为“证据”,仅仅是归一化因子,如果不关心
的具体值,只考察
取何值时后验概率
最大,所以省去分母:

在贝叶斯概率理论中,如果后验概率
和先验概率
满足同样的分布律(即两者概率相等),那么先验分布和后验分布叫做共轭分布,同时,先验分布叫做似然函数的共轭先验分布。
- 二项分布和先验问题:投掷一个非均匀硬币,可以使用参数为
的伯努利模型,
为硬币正面的概率,那么结果x的分布形式为:
;两点分布/二项分布的共轭先验是Beta分布,它具有两个参数
,其分布形式为![P(\theta |\alpha ,\beta )=\left\{\begin{matrix} \frac{1}{B(\alpha ,\beta )}\theta ^{\alpha -1}(1-\theta )^{\beta -1},\theta \in [0,1]\\ 0,others \end{matrix}\right.](//img.inotgo.com/imagesLocal/202208/07/202208071501292629_15.gif)
- 先验概率和后验概率的关系:
先验概率——
Beta分布——
后验概率——
后验概率是参数为
的Beta分布,即:伯努利分布/二项分布的共轭先验是Beta分布。
分析:参数
是决定参数
的参数,即超参数;我们可以看到参数
的指数是由
共同决定的;这个指数在投硬币实验中的实践意义——投币过程中,正面朝上的次数,
和
先验的给出了在没有任何实验前提下,硬币朝上的概率分配,因此
和
可被称为“伪计数”。
2.4 共轭先验的直接推广
从Beta分布推广至Dirichlet分布:
![f(\overrightarrow{p}|\overrightarrow{\alpha })=\left\{\begin{matrix} \frac{1}{\Delta (\overrightarrow{\alpha })}\prod_{k=1}^{K}P_{k}^{\alpha _{k}-1},P_{k}\in [0,1]\\ 0,others \end{matrix}\right.](http://img.inotgo.com/imagesLocal/202208/07/202208071501292629_4.gif)
简记为:
,其中:
由Beta分布的期望可推广至Dirichlet分布的期望为:
3 Dirichlet分布分析
3.1 Dirichlet分布
公式:
是参数变量,共有K个;
定义在
维上:
且
且定义在(K-1)维的单纯形上,其他区域的概率密度为0。
3.2 对称Dirichlet分布
参数分析:

边栏推荐
猜你喜欢
随机推荐
C专家编程 第8章 为什么程序员无法分清万圣节和圣诞节 8.4 原型之痛
Acwing/3359. 更多奇怪的照片
TCP/UDP协议
【Verilog】Verilog基础知识整理
[21天学习挑战赛——内核笔记](三)——Pinctrl介绍
Open3D ICP精配准(点到面)
小技巧——postman get&&post请求的使用方式
mysql query the last data in the table
二、工业方案推荐系统
C专家编程 第8章 为什么程序员无法分清万圣节和圣诞节 8.8 软件比硬件更困难
牛客面试高频榜单(第二组)难度:简单&中等
Based on the FPGA VGA display color bar, characters, pictures
AdaptFormer学习笔记
Hash table | 1. The sum of two numbers, 454. The addition of four numbers | The most suitable `dictionary key-value` | leecode brush the notes
做一个物联网云平台到底要多少钱?
[HCIP] Small Experiment on BGP Routing Problem
C专家编程 第8章 为什么程序员无法分清万圣节和圣诞节 8.9 如何进行强制类型转换,为何要进行类型强制转换
response status code
JS——判断js对象是否存在某个属性
Niu Ke Interview High Frequency List (Group 2) Difficulty: Easy & Moderate
,其分布形式为![P(\theta |\alpha ,\beta )=\left\{\begin{matrix} \frac{1}{B(\alpha ,\beta )}\theta ^{\alpha -1}(1-\theta )^{\beta -1},\theta \in [0,1]\\ 0,others \end{matrix}\right.](http://img.inotgo.com/imagesLocal/202208/07/202208071501292629_15.gif)









