当前位置:网站首页>使用train_test_split划分训练数据集、测试数据集
使用train_test_split划分训练数据集、测试数据集
2022-08-08 16:54:00 【泉伟】
train_test_split函数是sklearn机器学习库的一个函数,利用这个函数可以自动将数据集按照预定比例划分为测试数据集、训练数据集。
1. 安装sklearn数据库
pip install scikit-learn
2. 声明数据库
from sklearn.model_selection import train_test_split
3. 函数使用
X_tr, X_test, lab_tr, lab_test = train_test_split(X_train, labels_train,test_size=0.3, random_state = 123)
参数 | 含义 |
---|---|
X_train | 整体数据 |
labels_train | 整体数据 label |
test_size | 测试数据所占比例 |
random_state | 随机分配种子,设置一样的种子可以使得两次得到一样的结果 |
X_tr | 训练数据集 |
X_test | 测试数据集 |
lab_tr | 训练 label |
lab_test | 测试 label |
4. 例子train_test_split
import numpy as np
from sklearn.model_selection import train_test_split
X, y = np.arange(10).reshape((5, 2)), range(5)
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=0)
边栏推荐
猜你喜欢
随机推荐
字节一面:TCP 和 UDP 可以使用同一个端口吗?
它们不一样!透析【观察者模式】和【发布订阅模式】
MySQL database
Using PyGame's Bubble Sort Visualizer
一、搭建django自动化平台(实现一键执行sql)
项目管理流程包含哪些
Taro小程序跨端开发入门实战
laravel-实践
【8.7】代码源 - 【抽卡】【LCM与GCD】
L2-026 小字辈 (25 分)
文件操作和IO
JVM内存Dump原理与在线分析实战
L2-016 愿天下有情人都是失散多年的兄妹 (25 分)
Acwing第 63 场周赛【未完结】
H. Huge Boxes of Animal Toys
Charles MOCK 数据 htpps代理
函数节流与函数防抖
【20210923】选择感兴趣的研究方向?
redis介绍&命令&性能相关&缓存穿透
C1. Pokémon Army (easy version)