当前位置:网站首页>使用train_test_split划分训练数据集、测试数据集
使用train_test_split划分训练数据集、测试数据集
2022-08-08 16:54:00 【泉伟】
train_test_split函数是sklearn机器学习库的一个函数,利用这个函数可以自动将数据集按照预定比例划分为测试数据集、训练数据集。
1. 安装sklearn数据库
pip install scikit-learn
2. 声明数据库
from sklearn.model_selection import train_test_split
3. 函数使用
X_tr, X_test, lab_tr, lab_test = train_test_split(X_train, labels_train,test_size=0.3, random_state = 123)
参数 | 含义 |
---|---|
X_train | 整体数据 |
labels_train | 整体数据 label |
test_size | 测试数据所占比例 |
random_state | 随机分配种子,设置一样的种子可以使得两次得到一样的结果 |
X_tr | 训练数据集 |
X_test | 测试数据集 |
lab_tr | 训练 label |
lab_test | 测试 label |
4. 例子train_test_split
import numpy as np
from sklearn.model_selection import train_test_split
X, y = np.arange(10).reshape((5, 2)), range(5)
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=0)
边栏推荐
- MySQL 数据库
- The situation of the solution of the equation system and the correlation transformation of the vector group
- Chapter 20 Source Code File REST API Reference (2)
- L2-028 秀恩爱分得快 (25 分)
- 五、jmeter脚本的基本构成&断言
- L2-019 悄悄关注 (25 分)
- 急了,Mysql索引中最不容易记的三个知识点通透了
- 基于ECS实现一分钟自动化部署【华为云至简致远】
- Web3构架是怎么样的?
- 它们不一样!透析【观察者模式】和【发布订阅模式】
猜你喜欢
随机推荐
L2-025 分而治之 (25 分)
L2-028 秀恩爱分得快 (25 分)
Subject: Ordered Queue
垃圾账号不胜其烦,设备指纹快速发现
PNAS最新研究:81%解题率,神经网络 Codex 推开高等数学世界大门
ESP8266-Arduino编程实例-ADXL345三轴加速计驱动
The difference between B+ tree and B- tree
元宇宙医疗或将改变医疗格局
【 8.7 】 source code - card to LCM with GCD 】 【 】
4、S32K14X学习笔记:S32 Design Studio 新建和导入工程
高数_证明_基本初等函数的导数公式
L2-009 抢红包 (25 分)(结构体+自定义排序)
好用的项目工时管理系统有哪些
永续合约交易所系统开发逻辑详情
基于华为云弹性云服务器ECS(搭载openEuler的鲲鹏通用计算增强型)完成鲲鹏代码迁移工具实践【华为云至简致远】
iNFTnews | Metaverse brings new ideas for enterprise development
L2-023 图着色问题 (25 分)
题目:有序队列
通俗易懂的epoll
Acwing第 63 场周赛【未完结】