当前位置:网站首页>使用train_test_split划分训练数据集、测试数据集
使用train_test_split划分训练数据集、测试数据集
2022-08-08 16:54:00 【泉伟】
train_test_split函数是sklearn机器学习库的一个函数,利用这个函数可以自动将数据集按照预定比例划分为测试数据集、训练数据集。
1. 安装sklearn数据库
pip install scikit-learn
2. 声明数据库
from sklearn.model_selection import train_test_split
3. 函数使用
X_tr, X_test, lab_tr, lab_test = train_test_split(X_train, labels_train,test_size=0.3, random_state = 123)
| 参数 | 含义 |
|---|---|
| X_train | 整体数据 |
| labels_train | 整体数据 label |
| test_size | 测试数据所占比例 |
| random_state | 随机分配种子,设置一样的种子可以使得两次得到一样的结果 |
| X_tr | 训练数据集 |
| X_test | 测试数据集 |
| lab_tr | 训练 label |
| lab_test | 测试 label |
4. 例子train_test_split
import numpy as np
from sklearn.model_selection import train_test_split
X, y = np.arange(10).reshape((5, 2)), range(5)
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=0)
边栏推荐
猜你喜欢
随机推荐
基于ECS实现一分钟自动化部署【华为云至简致远】
laravel - 查询构建器2
L2-021 点赞狂魔 (25 分)
L2-025 分而治之 (25 分)
Spam accounts are a lot of trouble, and device fingerprints are quickly found
Charles MOCK 数据 htpps代理
Building and Visualizing Sudoku Games with Pygame
PNAS最新研究:81%解题率,神经网络 Codex 推开高等数学世界大门
iNFTnews | Metaverse brings new ideas for enterprise development
【论文阅读】RAL 2022: Receding Moving Object Segmentation in 3D LiDAR Data Using Sparse 4D Convolutions
9. cuBLAS Development Guide Chinese Version--Configuration of Atomic Mode in cuBLAS
元宇宙医疗或将改变医疗格局
C. Palindromifier
信号生成和可视化
L2-020 功夫传人 (25 分)
股票开户中金公司好不好,安全吗
谈谈怎么可以得到显著性图 特征图 featuremap
Subject: Ordered Queue
The situation of the solution of the equation system and the correlation transformation of the vector group
小米产品使用体验,问题分析及建议









