当前位置：网站首页>PyTorch 12. hook的用法

PyTorch 12. hook的用法

2022-04-23 06:11:00 【DCGJ666】

PyTorch 12. hook的用法

hook
register_hook
register_forward_hook
register_backward_hook

hook

由于pytorch会自动舍弃图计算的中间结果，所以想要这些数值就需要使用钩子函数。钩子函数包括Variable的钩子和nn.Module钩子，用法相似。
在使用hook函数时，不应该修改它的输入，但是它可以返回一个替代当前梯度的新梯度，即，使用该函数会返回一个梯度值

register_hook

针对Tensor变量的hook函数

import torch

grad_list = []
def print_grad(grad):
	grad_list.append(grad)

x = torch.randn(2,1)
y = x+2
y.register_hook(print_grad)
y.backward()

在整个网络进行反向传递时，运行到钩子函数注册的变量后，会保存该变量的梯度，调用print_grad函数，将梯度添加到grad_list中

register_forward_hook

针对网络层的hook函数,具体的可视化博客，可以参考我的另一篇文档，可视化特定层

钩子函数不应该修改输入和输出，并且在使用后应及时删除，以避免每次都运行钩子增加运行负载。钩子函数主要用在获取某些中间结果的情景，如中间某一层的输出或某一层的梯度。

import torch
model = VGG()
features = torch.Tensor()
def hook(module, input, output):
	# 把这一层的输出拷贝到features中
	features.copy_(output.data)

handle = model.layer8.register_forward_hook(hook)
_ = model(input)
# 用完hook后删除
handle.remove()

register_backward_hook

首先介绍Container的概念：当Module的forward函数中只有一个Function的时候，称为Module,如果Module包含其他Module,称之为Container.

在module上注册一个backward hook。此方法目标只能用在Module上，不能用在Container上。

每次计算module的inputs的梯度时，这个hook会被调用

hook(module,grad_input,grad_output)->Tensor or None

求取模块的梯度，与register_grad类似

版权声明
本文为[DCGJ666]所创，转载请带上原文链接，感谢
https://blog.csdn.net/DCGJ666/article/details/121638159

当前位置：网站首页>PyTorch 12. hook的用法

PyTorch 12. hook的用法