当前位置:网站首页>sklearn 笔记 TSNE
sklearn 笔记 TSNE
2022-08-10 20:24:00 【UQI-LIUWJ】
0 基本介绍
机器学习笔记:t-SNE_UQI-LIUWJ的博客-CSDN博客
将高维数据降维,使得高维数据各点的联合概率,和对应的低维数据各点的联合概率之间的 KL散度尽量小
对T-SNE使用不同的初始化,我们可以获得不同的结果
1 基本使用方法
class sklearn.manifold.TSNE(
n_components=2,
*,
perplexity=30.0,
early_exaggeration=12.0,
learning_rate='warn',
n_iter=1000,
n_iter_without_progress=300,
min_grad_norm=1e-07,
metric='euclidean',
metric_params=None,
init='warn',
verbose=0,
random_state=None,
method='barnes_hut',
angle=0.5,
n_jobs=None,
square_distances='deprecated')
2 参数介绍
n_components | 需要降至的维度 |
perplexity |
|
early_exaggeration |
|
learning_rate | t-SNE的学习率
除了浮点数之外,这里也可以设置learning_rate为'auto',可以被计算为max(N / early_exaggeration / 4, 50) 【N是sample size】 |
n_iter | 优化需要的最大迭代次数(至少需要250) |
n_iter_without_progress | 如果多少轮没有更好地优化进展,那么就可以终止优化。(在250轮之后开始check) 每50轮check一次优化进展,所以一般是50的倍数 |
min_grad_norm | 如果梯度的范数小于这个阈值,那么停止优化 |
metric | 如何计算两个元素i和j之间的距离
|
metric_params | 如果metric是一个可调用的函数,那么这里是额外的参数 |
init |
|
3 使用举例
import numpy as np
from sklearn.manifold import TSNE
X = np.array([[0, 0, 0], [0, 1, 1], [1, 0, 1], [1, 1, 1]])
tsne=TSNE(n_components=2).fit(X)
################################# 两种方式找低维嵌入 ###################################
X_embed=tsne.fit_transform(X)
X_embed
'''
array([[-141.00409 , 379.51575 ],
[ 32.38434 , 121.13147 ],
[-225.9871 , -52.276257],
[-399.37567 , 206.10808 ]], dtype=float32)
'''
tsne.embedding_
'''
array([[-141.00409 , 379.51575 ],
[ 32.38434 , 121.13147 ],
[-225.9871 , -52.276257],
[-399.37567 , 206.10808 ]], dtype=float32)
'''
#########################################################################################
tsne.kl_divergence_
#0.048726845532655716
#T-SNE的KL散度
tsne.n_features_in_
#3
#输入的特征个数
tsne.n_iter_
#499 迭代次数
边栏推荐
- leetcode 547.省份数量 并查集
- @Autowired注解 --required a single bean, but 2 were found出现的原因以及解决方法
- 水溶性合金量子点纳米酶|CuMoS纳米酶|多孔硅基Pt(Au)纳米酶|[email protected]纳米模拟酶|PtCo合金纳米粒子
- 你不知道的浏览器页面渲染机制
- nfs挂载服务器,解决挂载后无法更改用户id,无法修改、写文件,文件只读权限Read-only file system等问题
- 力扣150-逆波兰表达式求值——栈实现
- cordova installation error Command failed: powershell solution
- TDD、FDD是什么意思?
- Demis Hassabis:AI 的强大,超乎我们的想象
- UE4 - 河流流体插件Fluid Flux
猜你喜欢
《分布式微服务电商》专题(一)-项目简介
echart 特例-多分组X轴
[email protected]纳米模拟酶|PtCo合金纳米粒子"/>
水溶性合金量子点纳米酶|CuMoS纳米酶|多孔硅基Pt(Au)纳米酶|[email protected]纳米模拟酶|PtCo合金纳米粒子
laya打包发布apk
CMU博士论文 | 视频多模态学习:探索模型和任务复杂性
大小端的理解以及宏定义实现的理解
The 2021 ICPC Asia Shanghai Regional Programming Contest D、E
ACM MM 2022 统一归一化:加速Transformer工业部署的归一化方法
赎金信问题答记
The most complete GIS related software in history (CAD, FME, ArcGIS, ArcGISPro)
随机推荐
电脑开不了机是什么原因?
水溶性合金量子点纳米酶|CuMoS纳米酶|多孔硅基Pt(Au)纳米酶|[email protected]纳米模拟酶|PtCo合金纳米粒子
【语义分割】2017-PSPNet CVPR
Apache DolphinScheduler 3.0.0 正式版发布!
这些mysql基础命令、基础知识还记得吗?(面试,学习,复习都可以)一万三千字总结
巧用RoaringBitMap处理海量数据内存diff问题
@Autowired注解 --required a single bean, but 2 were found出现的原因以及解决方法
"POJ 3666" Making the Grade problem solution (two methods)
大小端的理解以及宏定义实现的理解
Random函数用法
opengrok搭建[通俗易懂]
参天生长大模型:昇腾AI如何强壮模型开发与创新之根?
洛谷 P1629 邮递员送信 (三种最短路)
力扣150-逆波兰表达式求值——栈实现
The servlet mapping path matching resolution
转铁蛋白Tf功能化β-榄香烯-雷公藤红素/紫杉醇PLGA纳米粒/雷公藤甲素脂质体(化学试剂)
Web3中值得关注的基础设施
电脑为什么会蓝屏的原因
铁蛋白颗粒负载雷替曲塞/培美曲塞/磺胺地索辛/金刚烷(科研试剂)
1D Array Dynamics and Question Answers