当前位置:网站首页>pytorch使用Dataloader加载自己的数据集train_X和train_Y
pytorch使用Dataloader加载自己的数据集train_X和train_Y
2022-08-10 18:23:00 【王延凯的博客】
Pytorch使用Dataloader加载自己的数据集train_X和train_Y
1.重构一个新的dataloader函数
# 定义GetLoader类,继承Dataset方法,并重写__getitem__()和__len__()方法
class GetLoader(torch.utils.data.Dataset):
# 初始化函数,得到数据
def __init__(self, data_root, data_label):
self.data = data_root
self.label = data_label
# index是根据batchsize划分数据后得到的索引,最后将data和对应的labels进行一起返回
def __getitem__(self, index):
data = self.data[index]
labels = self.label[index]
return data, labels
# 该函数返回数据大小长度,目的是DataLoader方便划分,如果不知道大小,DataLoader会一脸懵逼
def __len__(self):
return len(self.data)
2.调用
train_data= GetLoader(train_X, train_Y)
train_loader=DataLoader(dataset=train_data,batch_size=50, shuffle=True, num_workers=0)
#这里只写了train_X和train_Y的,test_X和test_Y的类似
for data,labels in train_loader:
pass # 在这里就可以正常操作啦
边栏推荐
- 6-12 二叉搜索树的操作集(30分)
- 1720. 解码异或后的数组
- pyspark columns merge into one row
- 2022-08-09 Study Notes day32-IO Stream
- 入门:人脸专集2 | 人脸关键点检测汇总(文末有相关文章链接)
- eager模式和graph模式 Tensorflow
- 搭建自己的以图搜图系统 (一):10 行代码搞定以图搜图
- 2022-08-09 学习笔记 day32-IO流
- Active users of mobile banking grew rapidly in June, hitting a half-year high
- 请问下在datastream中用flinkcdc怎么设置jdbc的参数useSSL=false呀
猜你喜欢
随机推荐
shell运算详解,看这一篇就够了!
MSE 治理中心重磅升级-流量治理、数据库治理、同 AZ 优先
Consul Introduction and Installation
人生苦短,开始用go
消息队列初见:一起聊聊引入系统mq 之后的问题
弘玑Cyclone与风变科技达成战略合作:优势互补聚焦数字化人才培养
剑指 Offer II 034. 外星语言是否排序-辅助数组法
6-10 二分查找(20分)
【HMS core】【FAQ】AR Engine、Analytics Kit、Video Editor Kit、Image Kit、Map Kit典型问题合集2
Toronto Research Chemicals霉菌毒素分析丨伏马菌素B2
1720. 解码异或后的数组
Go 语言快速入门指南:第四篇 与数据为舞之数组
装饰者模式
6-11 先序输出叶结点(15分)
Three schemes of SQL query across the table
【深度学习21天学习挑战赛】4、初尝循环神经网络(RNN)——股票预测
flex使用align-content无效
让mixin为项目开发助力【及递归优化新尝试】
JVM内存和垃圾回收-11.执行引擎
微信小程序富文本标签rich-text