当前位置:网站首页>sklearn.datasets.make_circles
sklearn.datasets.make_circles
2022-08-10 22:54:00 【xiaozheng123121】
目录
sklearn.datasets.make_circles(n_samples = 100,shuffle = True,noise = None,random_state = None,factor = 0.8)
作用:在 2d 中创建一个包含较小圆的大圆的样本集。
from sklearn.datasets import make_circles
import matplotlib.pyplot as plt
from sklearn.model_selection import train_test_split
X, y = make_circles(n_samples=1_000, factor=0.3, noise=0.05, random_state=0)
X_train, X_test, y_train, y_test = train_test_split(X, y, stratify=y, random_state=0)
_, (train_ax, test_ax) = plt.subplots(ncols=2, sharex=True, sharey=True, figsize=(8, 4))
train_ax.scatter(X_train[:, 0], X_train[:, 1], c=y_train)
train_ax.set_ylabel("Feature #1")
train_ax.set_xlabel("Feature #0")
train_ax.set_title("Training data")
test_ax.scatter(X_test[:, 0], X_test[:, 1], c=y_test)
test_ax.set_xlabel("Feature #0")
_ = test_ax.set_title("Testing data")
plt.show()
一个简单的玩具数据集,用于可视化聚类和分类算法。
参数:
n_samples : int,optional(默认值= 100)
# 生成的总点数。如果是奇数,则内圆将比外圆具有一个点。
shuffle : bool,optional(默认值= True)
# 是否洗牌样品。
noise: 双倍或无(默认=无)
# 高斯噪声的标准偏差加到数据上。
random_state : int,RandomState实例或None(默认)
# 确定数据集重排和噪声的随机数生成。传递一个int,用于跨多个函数调用的可重现输出。见术语表。
factor : 0 <double <1(默认值= .8)
# 内圈和外圈之间的比例因子。
返回值:
X : 形状数组 [n_samples,2] 生成的样本。
y : 形状数组[n_samples]
每个样本的类成员资格的整数标签(0 或 1)。
参考资料
[1] 官方链接;
边栏推荐
猜你喜欢
随机推荐
【秋招】【更新中ing】手撕代码系列
实例053:按位异或
《DevOps围炉夜话》- Pilot - CNCF开源DevOps项目DevStream简介 - feat. PMC成员胡涛
怼不过产品经理?因为你不懂DDD领域建模与架构设计
koa框架(一)
GoldenGate中使用 exp/imp 进行初始化
2021 IDEA creates web projects
Pytorch面试题面经
LeetCode Daily 2 Questions 02: Reverse the words in a string (1200 each)
Redis - 利用lua脚本控制密码错误次数超限,锁定账号
Glide监听Activity生命周期源码分析
音乐播放器(未完成版本)
完全自定义MaterialButtonToggleGroup颜色。
高精度减法
企业小程序怎么开发自己的小程序?
[MySQL] Using join buffer (Block Nested Loop) in left join due to character set in mysql
消息队列总结
常见的加密方式有哪几种,各有哪些优缺点
B站数据分析岗实习生面试记录
RecyclerView上下滑动时,不调用onBindViewHolder 导致列表的item不刷新