当前位置:网站首页>sklearn 笔记 TSNE
sklearn 笔记 TSNE
2022-08-10 20:24:00 【UQI-LIUWJ】
0 基本介绍
机器学习笔记:t-SNE_UQI-LIUWJ的博客-CSDN博客
将高维数据降维,使得高维数据各点的联合概率,和对应的低维数据各点的联合概率之间的 KL散度尽量小
对T-SNE使用不同的初始化,我们可以获得不同的结果
1 基本使用方法
class sklearn.manifold.TSNE(
n_components=2,
*,
perplexity=30.0,
early_exaggeration=12.0,
learning_rate='warn',
n_iter=1000,
n_iter_without_progress=300,
min_grad_norm=1e-07,
metric='euclidean',
metric_params=None,
init='warn',
verbose=0,
random_state=None,
method='barnes_hut',
angle=0.5,
n_jobs=None,
square_distances='deprecated')2 参数介绍
| n_components | 需要降至的维度 |
| perplexity |
|
| early_exaggeration |
|
| learning_rate | t-SNE的学习率
除了浮点数之外,这里也可以设置learning_rate为'auto',可以被计算为max(N / early_exaggeration / 4, 50) 【N是sample size】 |
| n_iter | 优化需要的最大迭代次数(至少需要250) |
| n_iter_without_progress | 如果多少轮没有更好地优化进展,那么就可以终止优化。(在250轮之后开始check) 每50轮check一次优化进展,所以一般是50的倍数 |
| min_grad_norm | 如果梯度的范数小于这个阈值,那么停止优化 |
| metric | 如何计算两个元素i和j之间的距离
|
| metric_params | 如果metric是一个可调用的函数,那么这里是额外的参数 |
| init |
|
3 使用举例
import numpy as np
from sklearn.manifold import TSNE
X = np.array([[0, 0, 0], [0, 1, 1], [1, 0, 1], [1, 1, 1]])
tsne=TSNE(n_components=2).fit(X)
################################# 两种方式找低维嵌入 ###################################
X_embed=tsne.fit_transform(X)
X_embed
'''
array([[-141.00409 , 379.51575 ],
[ 32.38434 , 121.13147 ],
[-225.9871 , -52.276257],
[-399.37567 , 206.10808 ]], dtype=float32)
'''
tsne.embedding_
'''
array([[-141.00409 , 379.51575 ],
[ 32.38434 , 121.13147 ],
[-225.9871 , -52.276257],
[-399.37567 , 206.10808 ]], dtype=float32)
'''
#########################################################################################
tsne.kl_divergence_
#0.048726845532655716
#T-SNE的KL散度
tsne.n_features_in_
#3
#输入的特征个数
tsne.n_iter_
#499 迭代次数边栏推荐
- 转铁蛋白(Tf)修饰去氢骆驼蓬碱磁纳米脂质体/香豆素-6脂质体/多柔比星脂质体
- 皮质-皮质网络的多尺度交流
- 报错:runtime error: reference binding to null pointer of type ‘std::vector<int, std::allocator<int>>‘
- 链表应用----约瑟夫问题
- 【图像分类】2017-MobileNetV1 CVPR
- 洛谷 P1629 邮递员送信 (三种最短路)
- opengrok搭建[通俗易懂]
- 巧用RoaringBitMap处理海量数据内存diff问题
- 这7个自动化办公模版 教你玩转表格数据自动化
- UE4 - 河流流体插件Fluid Flux
猜你喜欢

你不知道的浏览器页面渲染机制
[email protected] NPs)"/>转铁蛋白修饰蛇床子素长循环脂质体/负载三七皂苷R1的PEG-PLGA纳米粒([email protected] NPs)

铁蛋白颗粒Tf包载多肽/凝集素/细胞色素C/超氧化物歧化酶/多柔比星(定制服务)

线性结构----链表

spark学习笔记(九)——sparkSQL核心编程-DataFrame/DataSet/DF、DS、RDD三者之间的转换关系

(10) Sequence and deserialization of image data

知识图谱Knowledge Graph

【CMU博士论文】视频多模态学习:探索模型和任务复杂性,152页pdf

关于 NFT 版权保护的争议

详叙c中的分支与循环
随机推荐
三子棋的设计和代码
测试/开发程序员值这么多钱么?“我“不会愿赌服输......
二级指针的简单理解
电脑重装系统Win11格式化硬盘的详细方法
(10) Sequence and deserialization of image data
2020 ICPC Shanghai Site G
ACM MM 2022 统一归一化:加速Transformer工业部署的归一化方法
【CMU博士论文】视频多模态学习:探索模型和任务复杂性,152页pdf
【二叉树】二叉搜索树的后序遍历序列
力扣18-四数之和——双指针法
论文解读(g-U-Nets)《Graph U-Nets》
[SemiDrive source code analysis] [MailBox inter-core communication] 51 - DCF_IPCC_Property implementation principle analysis and code combat
[SWPUCTF 2021 新生赛] web
servlet映射路径匹配解析
网络虚拟化
壁仞推出全球最大算力芯片,号称以7nm超越英伟达4nm最新GPU
深度学习实战教程(一):感知器
IIC通信协议总结[通俗易懂]
烟雾、空气质量、温湿度…自己徒手做个环境检测设备
Transferrin-modified osthole long-circulating liposomes/PEG-PLGA nanoparticles loaded with notoginsenoside R1 ([email prot