当前位置:网站首页>机器学习笔记:t-SNE
机器学习笔记:t-SNE
2022-08-10 20:24:00 【UQI-LIUWJ】
0 前言
- t-SNE(t-Distributed Stochastic Neighbor Embedding)
- 是一种非常常用的数据降维,常用于数据可视化
- t-SNE/SNE的基本原理是:
- 在高维空间构建一个概率分布拟合高维样本点间的相对位置关系
- 在低维空间,也构建 一个概率分布,拟合低维样本点之间的位置关系
- 通过学习,调整低维数据点,令两个分布接近
1 SNE 随机邻域嵌入 ( Stochastic Neighbor Embedding )
(类似于softmax)
- 如果低维映射点yi和yj成功正确地建模了高维数据点xi和xj之间的相似性,则条件概率pj|i和qj|i将相等。
受这一观察结果的启发,SNE的目标是找到一种低维数据表示法,以最小化pj|i和qj|i之间的分布距离(两个条件分布接近)
1.1 SNE主要缺点
1.1.1 距离不对称
不难发现
是不等的(分母不一样) ,这就导致了i—>j和j—>i的距离不对称。【与实际情况不符】
改进的方法是使用联合概率而不是条件概率
在实际问题中,计算所有的需要太多的计算复杂度,于是实际应用中,一般是:
1.1.2 拥挤体现
从高维到低维进行转换的过程中,低维点的距离无法建模高维点之间的位置关系,使得高维空间中距离较大的点对,在低维空间距离会变得较小比如原来红绿点之间距离很远,降维之后距离就很近了
2 T-SNE
2.1 σ的求法
最naive的方法就是随机设置了。
更有效地方法如下:
我们把
看成高斯分布,那么σ就类似于标准差
根据高斯分布的性质,我们知道,在
(k是一个常数)的区间内,概率是比较大的。
所以我们根据xi周围临近点的数量,来增减σ
那么,如何对σ进行定量的约束呢,我们设置一个固定的参数perlexity,表示分布的熵。
其中
不难发现熵(perplexity)和σi成正比,所以我们可用类似于二分查找法来确定σi
边栏推荐
- Ferritin particle-loaded raltitrexed/pemetrexed/sulfadesoxine/adamantane (scientific research reagent)
- 赎金信问题答记
- 越折腾越好用的 3 款开源 APP
- [SemiDrive source code analysis] [MailBox inter-core communication] 52 - DCF Notify implementation principle analysis and code combat
- Apple Font Lookup
- 二级指针的简单理解
- 《分布式微服务电商》专题(一)-项目简介
- (12) findContours function hierarchy explanation
- 多功能纳米酶Ag/PANI|柔性衬底纳米ZnO酶|铑片纳米酶|Ag-Rh合金纳米颗粒纳米酶|铱钌合金/氧化铱仿生纳米酶
- The servlet mapping path matching resolution
猜你喜欢
UE4 - 河流流体插件Fluid Flux
网络虚拟化
Public Key Retrieval is not allowed(不允许公钥检索)【解决办法】
YOLOv3 SPP源码分析
多功能纳米酶Ag/PANI|柔性衬底纳米ZnO酶|铑片纳米酶|Ag-Rh合金纳米颗粒纳米酶|铱钌合金/氧化铱仿生纳米酶
铱钌合金/氧化铱仿生纳米酶|钯纳米酶|GMP-Pd纳米酶|金钯复合纳米酶|三元金属Pd-M-Ir纳米酶|中空金铂合金纳米笼核-多空二氧化硅壳纳米酶
力扣150-逆波兰表达式求值——栈实现
C语言系列——猜名次、猜凶手、打印杨辉三角
Colocate Join :ClickHouse的一种高性能分布式join查询模型
[email protected])纳米酶"/>
血红素-金纳米颗粒(Heme-AuNP)复合纳米酶|金纳米颗粒核多孔空心碳纳米球壳([email protected])纳米酶
随机推荐
【毕业设计】基于STM32的天气预报盒子 - 嵌入式 单片机 物联网
Colocate Join :ClickHouse的一种高性能分布式join查询模型
echart 特例-多分组X轴
Apple Font Lookup
通用线程:POSIX 线程详解,第 2部分
Transferrin (TF) Modified Paclitaxel (PTX) Liposomes (TF-PTX-LP) | Transferrin (Tf) Modified Curcumin Liposomes
svg+元素js实现在图片上描点成框,并获取相对图片的坐标位置
转铁蛋白修饰长春新碱-粉防己碱脂质体|转铁蛋白修饰共载紫杉醇和金雀异黄素脂质体(试剂)
转铁蛋白Tf功能化β-榄香烯-雷公藤红素/紫杉醇PLGA纳米粒/雷公藤甲素脂质体(化学试剂)
C 语言 时间函数使用技巧(汇总)
优雅退出在Golang中的实现
爱丁堡大学最新《因果机器学习: 医疗健康与精准医疗应用》2022综述
一维数组动态和问题答记
opengrok搭建[通俗易懂]
uni-app 数据上拉加载更多功能
YOLOv3 SPP source analysis
LeetCode 1-10题
铁蛋白-AHLL纳米颗粒|人表皮生长因子-铁蛋白重链亚基纳米粒子(EGF-5Cys-FTH1)|铁蛋白颗粒包载氯霉素Chloramphenicol-Ferritin
【图像分类】2018-MobileNetV2
每日一R「03」Borrow 语义与引用