当前位置:网站首页>sklearn.datasets.make_circles
sklearn.datasets.make_circles
2022-08-10 22:54:00 【xiaozheng123121】
目录
sklearn.datasets.make_circles(n_samples = 100,shuffle = True,noise = None,random_state = None,factor = 0.8)
作用:在 2d 中创建一个包含较小圆的大圆的样本集。
from sklearn.datasets import make_circles
import matplotlib.pyplot as plt
from sklearn.model_selection import train_test_split
X, y = make_circles(n_samples=1_000, factor=0.3, noise=0.05, random_state=0)
X_train, X_test, y_train, y_test = train_test_split(X, y, stratify=y, random_state=0)
_, (train_ax, test_ax) = plt.subplots(ncols=2, sharex=True, sharey=True, figsize=(8, 4))
train_ax.scatter(X_train[:, 0], X_train[:, 1], c=y_train)
train_ax.set_ylabel("Feature #1")
train_ax.set_xlabel("Feature #0")
train_ax.set_title("Training data")
test_ax.scatter(X_test[:, 0], X_test[:, 1], c=y_test)
test_ax.set_xlabel("Feature #0")
_ = test_ax.set_title("Testing data")
plt.show()
一个简单的玩具数据集,用于可视化聚类和分类算法。
参数:
n_samples : int,optional(默认值= 100)
# 生成的总点数。如果是奇数,则内圆将比外圆具有一个点。
shuffle : bool,optional(默认值= True)
# 是否洗牌样品。
noise: 双倍或无(默认=无)
# 高斯噪声的标准偏差加到数据上。
random_state : int,RandomState实例或None(默认)
# 确定数据集重排和噪声的随机数生成。传递一个int,用于跨多个函数调用的可重现输出。见术语表。
factor : 0 <double <1(默认值= .8)
# 内圈和外圈之间的比例因子。
返回值:
X : 形状数组 [n_samples,2] 生成的样本。
y : 形状数组[n_samples]
每个样本的类成员资格的整数标签(0 或 1)。
参考资料
[1] 官方链接;
边栏推荐
猜你喜欢
随机推荐
开源一夏 | 盘点那些 Golang 标星超过 20 K 的优质项目
postman+jmeter接口实例
XSLeaks 侧信道攻击 (unfinished)
高学历毕业生,该学单片机还是plc?
Mysql's partial table master-slave construction and new table
如何反弹shell
EL表达式
CFdiv2-Common Number-(奇偶数二分+规律)
线程池如何监控,才能帮助开发者快速定位线上错误?
基于深度学习的三维点云分割综述
MySQL:MySQL的集群——主从复制的原理和配置
leetcode:357. 统计各位数字都不同的数字个数
常用代码扩展点设计方式
ArcGIS中的坐标系统和投影变换
Three major logs in mysql
HGAME 2022 Week1 writeup
DC-8靶场下载及渗透实战详细过程(DC靶场系列)
Lambda
浅谈jsfuck编码
How to be a Righteous Hacker?What should you study?