当前位置：网站首页>sklearn.datasets.make_circles

sklearn.datasets.make_circles

2022-08-10 22:54:00 【xiaozheng123121】

from sklearn.datasets import make_circles
import matplotlib.pyplot as plt
from sklearn.model_selection import train_test_split

X, y = make_circles(n_samples=1_000, factor=0.3, noise=0.05, random_state=0)
X_train, X_test, y_train, y_test = train_test_split(X, y, stratify=y, random_state=0)
_, (train_ax, test_ax) = plt.subplots(ncols=2, sharex=True, sharey=True, figsize=(8, 4))

train_ax.scatter(X_train[:, 0], X_train[:, 1], c=y_train)
train_ax.set_ylabel("Feature #1")
train_ax.set_xlabel("Feature #0")
train_ax.set_title("Training data")

test_ax.scatter(X_test[:, 0], X_test[:, 1], c=y_test)
test_ax.set_xlabel("Feature #0")
_ = test_ax.set_title("Testing data")
plt.show()

在这里插入图片描述

一个简单的玩具数据集，用于可视化聚类和分类算法。

参数：

n_samples ： int，optional（默认值= 100）
# 生成的总点数。如果是奇数，则内圆将比外圆具有一个点。

shuffle ： bool，optional（默认值= True）
# 是否洗牌样品。

noise： 双倍或无（默认=无）
# 高斯噪声的标准偏差加到数据上。

random_state ： int，RandomState实例或None（默认）
# 确定数据集重排和噪声的随机数生成。传递一个int，用于跨多个函数调用的可重现输出。见术语表。

factor ： 0 <double <1（默认值= .8）
# 内圈和外圈之间的比例因子。