当前位置：网站首页>PyTorch之CV

PyTorch之CV

2022-08-10 05:33:00 【Vector Jason】

引子：

鉴于本人方向偏于深度学习中的图像处理，在此详细说明一下该领域中常用的一些库函数和相关架构。

同时，通过前面的学习我们也发现经常会用到torchvision来调用预训练模型，加载数据集，对图片进行数据增强等操作，因此，torchvision正是主要使用的一个库函数。

torchvision.transforms：

考虑到输入数据进入神经网络的过程中，其维度具有限制条件，因此，对输入image进行归一化是必要的，这也可以理解为数学模型中常进行的数据预处理操作。此外，有时我们无法获取到足够多的数据，这将导致无法很好训练神经网络中成千上万个参数，所以，我们可以通过将图片进行翻转，缩小或放大等操作以实现数据量的扩大。

例如：

from torchvision import transforms
data_transform = transforms.Compose([
    transforms.ToPILImage(),   # 这一步取决于后续的数据读取方式，如果使用内置数据集则不需要
    transforms.Resize(image_size),
    transforms.ToTensor()
])

这一段代码即表示image预处理过程，详情其余操作代码可见torchvison官方文档。