当前位置:网站首页>PyTorch之CV
PyTorch之CV
2022-08-10 05:33:00 【Vector Jason】
引子:
鉴于本人方向偏于深度学习中的图像处理,在此详细说明一下该领域中常用的一些库函数和相关架构。
同时,通过前面的学习我们也发现经常会用到torchvision来调用预训练模型,加载数据集,对图片进行数据增强等操作,因此,torchvision正是主要使用的一个库函数。
torchvision.transforms:
考虑到输入数据进入神经网络的过程中,其维度具有限制条件,因此,对输入image进行归一化是必要的,这也可以理解为数学模型中常进行的数据预处理操作。此外,有时我们无法获取到足够多的数据,这将导致无法很好训练神经网络中成千上万个参数,所以,我们可以通过将图片进行翻转,缩小或放大等操作以实现数据量的扩大。
例如:
from torchvision import transforms
data_transform = transforms.Compose([
transforms.ToPILImage(), # 这一步取决于后续的数据读取方式,如果使用内置数据集则不需要
transforms.Resize(image_size),
transforms.ToTensor()
])这一段代码即表示image预处理过程,详情其余操作代码可见torchvison官方文档。
torchvision.models
了解多种多样的模型之后,我们总会有个疑问——该不会需要手敲所有代码吧?答案是否定的,在torchvison.models中提供了一些在ImageNet-1k数据集中预训练好的模型供我们使用

具体可以点击以下链接查看各个模型在该数据集之下的准确率。TorchVision中各个模型准确率对比分析
https://gitee.com/link?target=https%3A%2F%2Fpytorch.org%2Fvision%2Fstable%2Fmodels.html%23
边栏推荐
猜你喜欢
随机推荐
21天挑战杯MySQL——Day06
Mini Program Study Notes: Communication between Mini Program Components
定时器(setInterval)的开启与关闭
Collection tool class
多表查询 笔记
Bifrost micro synchronous database implementation services across the library data synchronization
shell脚本中利用sqlplus操作数据库
String常用方法
Multi-table query Notes
常用类 BigDecimal
我不喜欢我的代码
我不喜欢我的代码
[Notes] Collection Framework System Collection
数据库 笔记 创建数据库、表 备份
win12 modify dns script
卷积神经网络(CNN)实现mnist手写数字识别
优先队列
链读推荐:从瓷砖到生成式 NFT
.NET操作Excel高效低内存的开源框架 - MiniExcel
反射【笔记】


![[Notes] Collection Framework System Collection](/img/6a/f0e69ebb60a3d958ec7bda33a60995.png)






