当前位置:网站首页>unhandled system error, NCCL version 2.7.8
unhandled system error, NCCL version 2.7.8
2022-04-23 06:12:00 【wujpbb7】
在 宿主机上运行基于 DDP 的 pytorch 训练程序没问题,
进入 docker 后运行,出现 "unhandled system error, NCCL version 2.7.8" 的错误。
解决方法:
在 python -m torch.distributed.launch --nproc_per_node=4 ...前加上 NCCL_DEBUG=INFO
可以看到:
s215:623:649 [3] include/shm.h:48 NCCL WARN Error while creating shared memory segment nccl-shm-send-404da1ec128dc62d-0-3-2 (size 4104)
进入 docker 时,带上 --ipc=host 即可。
版权声明
本文为[wujpbb7]所创,转载请带上原文链接,感谢
https://blog.csdn.net/blueblood7/article/details/122969027
边栏推荐
- MySQL notes 5_ Operation data
- Exploration of SendMessage principle of advanced handler
- 树莓派:双色LED灯实验
- 【2021年新书推荐】Learn WinUI 3.0
- 1.2 preliminary pytorch neural network
- MySQL的安装与配置——详细教程
- 【2021年新书推荐】Professional Azure SQL Managed Database Administration
- Minesweeping games
- Machine learning II: logistic regression classification based on Iris data set
- 【点云系列】FoldingNet:Point Cloud Auto encoder via Deep Grid Deformation
猜你喜欢

【点云系列】Relationship-based Point Cloud Completion

Visual Studio 2019安装与使用

【3D形状重建系列】Implicit Functions in Feature Space for 3D Shape Reconstruction and Completion

Chapter 1 numpy Foundation

第8章 生成式深度学习

Summary of image classification white box anti attack technology

Gee configuring local development environment

Face_ Recognition face detection

机器学习 三: 基于逻辑回归的分类预测

图像分类白盒对抗攻击技术总结
随机推荐
【点云系列】Multi-view Neural Human Rendering (NHR)
Pymysql connection database
MySQL notes 1_ database
第8章 生成式深度学习
.net加载字体时遇到 Failed to decode downloaded font:
GEE配置本地开发环境
【点云系列】点云隐式表达相关论文概要
Project, how to package
Gobang games
[dynamic programming] different paths 2
机器学习笔记 一:学习思路
【 planification dynamique】 différentes voies 2
【动态规划】杨辉三角
PyMySQL连接数据库
DCMTK(DCM4CHE)与DICOOGLE协同工作
【点云系列】SO-Net:Self-Organizing Network for Point Cloud Analysis
[Point Cloud Series] SG - Gan: Adversarial Self - attachment GCN for Point Cloud Topological parts Generation
Pytorch best practices and coding style guide
Cancel remote dependency and use local dependency
Reading notes - activity