当前位置:网站首页>Résumé de la relation entre GPU, cuda et cudnn
Résumé de la relation entre GPU, cuda et cudnn
2022-04-23 11:17:00 【Bras en l'air】
GPU, CUDA,cuDNNRésumé de la relation entre les trois
CPU Et GPU

cpuEtgpuPrésentation de la structure
GPU(Processeur d'image,Graphics Processing Unit)EtCPU(CPU,Central Processing Unit)Les principales différences de conception sontGPUIl y a plus d'unités de calcul(Comme le montre la photo en vertALU),EtControlEtCacheUnit é inférieureCPUBeaucoup.,C'est parce queGPUChaque Unit é de calcul exécute le même programme lorsqu'elle effectue des calculs parallèles,Sans trop de contrôle.CacheL'Unit é est utilisée pour la mise en cache des données,CPUPeut passerCachePour réduire le nombre d'accès à la mémoire principale,C'est - à - dire réduire la latence de mémoire(memory latency).GPUMoyenneCachePetit ou pas,Parce queGPU La latence de la mémoire peut être réduite par l'informatique parallèle .Donc,CPUDeCahce Conçu principalement pour atteindre un faible délai ,Control Principalement générique , Une Unit é de contrôle logique complexe peut garantir CPU Distribuer efficacement les tâches et les instructions .Alors...CPUMaîtrise du contrôle logique, Est un calcul en série ,EtGPU Bon calcul à haute résistance , Est l'informatique parallèle .Par exemple,GPU Comme des milliers de coolies. , Tout le monde fait le même travail. ,Il n'y a pas de dépendance mutuelle,Sont indépendants, Les gens simples sont puissants. ;CPU C'est comme un chef de chantier. , Bien qu'il puisse travailler dur. ,Mais peu de gens, C'est pourquoi nous sommes généralement responsables de la répartition des tâches. , Répartition du personnel, etc. .
Comme vous pouvez le voir,GPU L'accélération est réalisée en parallèle par un grand nombre de fils , Donc, pour un travail qui ne peut pas être très parallèle, ,GPU Ça ne marchera pas. .EtCPU Est une opération en série , Nécessite une grande polyvalence , Il joue principalement le rôle de gestion centralisée et d'attribution des tâches. .
CUDA
CUDA- Oui.NVIDIALancé pour la maisonGPUUn cadre informatique parallèle pour,C'est - à - direCUDASeulement dansNVIDIADeGPUCours.,Et ce n'est que lorsque le problème de calcul à résoudre peut être beaucoup de calcul parallèleCUDALe rôle de.
cuDNN
cuDNN(CUDA Deep Neural Network library):- Oui.NVIDIALa Bibliothèque d'accélération créée pour les réseaux neuronaux profonds,C'est un réseau neuronal profondGPUBibliothèque d'accélération.Si tu veux utiliserGPUModèle d'entraînement,cuDNNCe n'est pas nécessaire,Mais cette bibliothèque d'accélération est généralement utilisée.
Résumé
En termes simples,CPU Convient au calcul en série ,Maîtrise du contrôle logique.GPUExceller dans le calcul parallèle à haute intensité,PourAIFormation à l'algorithme
CUDA - Oui.NVIDIA Un cadre dédié à la gestion des unités de calcul d'allocation
cuDNN Est utilisé dans les réseaux neuronaux profonds gpuBibliothèque d'accélération
Commande de version de requête :
ubuntu:
cuda Version
nvcc -V
cat /usr/local/cuda/version.txt
cudnn Version
cat /usr/local/cuda/include/cudnn.h | grep CUDNN_MAJOR -A 2
VoirNvidia GPUVersion
nvidia-smi
//10sAfficher une fois
watch -n 10 nvidia-smi
nvidia-smi -l
版权声明
本文为[Bras en l'air]所创,转载请带上原文链接,感谢
https://yzsam.com/2022/04/202204231116328538.html
边栏推荐
- @valid,@Validated 的学习笔记
- 使用 PHP PDO ODBC 示例的 Microsoft Access 数据库
- Typora operation skill description (I)
- 语雀文档编辑器将开源:始于但不止于Markdown
- MySQL分区表实现按月份归类
- Excel · VBA custom function to obtain multiple cell values
- Excel·VBA数组冒泡排序函数
- MIT: label every pixel in the world with unsupervised! Humans: no more 800 hours for an hour of video
- Software testers, how to mention bugs?
- Use of SVN:
猜你喜欢

数据库管理软件SQLPro for SQLite for Mac 2022.30

采用百度飞桨EasyDL完成指定目标识别

After the MySQL router is reinstalled, it reconnects to the cluster for boot - a problem that has been configured in this host before

GO接口使用

系统编程之高级文件IO(十三)——IO多路复用-select

26. Delete duplicates in ordered array

Use of SVN:

Structure of C language (Advanced)

About the three commonly used auxiliary classes of JUC

语雀文档编辑器将开源:始于但不止于Markdown
随机推荐
Mba-day5 Mathematics - application problems - engineering problems
SWAT - Introduction to Samba web management tool
Alarm scene recognition
Redis optimization series (II) redis master-slave principle and master-slave common configuration
Interprocess communication -- message queue
Jupyter Lab 十大高生产力插件
Detailed explanation of how to smoothly go online after MySQL table splitting
About the three commonly used auxiliary classes of JUC
Software testers, how to mention bugs?
PlatoFarm推出正式版游戏经济模型的特点分析
Microsoft Access database using PHP PDO ODBC sample
web三大组件(Servlet,Filter,Listener)
Learning go language 0x01: start from the official website
Learn go language 0x03: understand the dependency between variables and initialization order
Mysql排序的特性详情
Introduction to neo4j authoritative guide, recommended by Qiu Bojun, Zhou Hongxiang, Hu Xiaofeng, Zhou Tao and other celebrities
Google Earth Engine(GEE)——将原始影像进行升尺度计算(以海南市为例)
Visual common drawing (IV) histogram
@Valid, @ validated learning notes
Facing the global market, platefarm today logs in to four major global platforms such as Huobi