GPU Programming with CUDA Training Cursus

CUDA is een open standaard voor GPU programmeren waarmee een code kan worden uitgevoerd op NVIDIA GPUs, die veel worden gebruikt voor high-performance computing, kunstmatige intelligentie (AI), gaming en graphics. CUDA stelt de programmeur bloot aan de hardwaredetails en geeft volledige controle over het parallellisatieproces. Dit vereist echter ook een goed begrip van de apparaatarchitectuur, het geheugenmodel, het uitvoeringsmodel en de optimalisatietechnieken.

Deze live training onder leiding van een instructeur (online of ter plaatse) is bedoeld voor ontwikkelaars van beginner tot gemiddeld niveau die CUDA willen gebruiken om NVIDIA GPU s te programmeren en hun parallellisme te benutten.

Aan het einde van deze training zijn de deelnemers in staat om:

Zet een ontwikkelomgeving op die CUDA Toolkit, een NVIDIA GPU en Visual Studio Code bevat.
Maak een eenvoudig CUDA-programma dat vectoroptelling uitvoert op de GPU en de resultaten uit het GPU-geheugen ophaalt.
Gebruik de CUDA API om apparaatinformatie op te vragen, apparaatgeheugen toe te wijzen en toe te wijzen, gegevens tussen host en apparaat te kopiëren, kernels te starten en threads te synchroniseren.
Gebruik de CUDA C/C++-taal om kernels te schrijven die op de GPU worden uitgevoerd en gegevens te manipuleren.
Gebruik de ingebouwde functies, variabelen en bibliotheken van CUDA om algemene taken en bewerkingen uit te voeren.
Gebruik CUDA-geheugenruimten, zoals globaal, gedeeld, constant en lokaal, om gegevensoverdracht en geheugentoegang te optimaliseren.
Gebruik het CUDA-uitvoeringsmodel om de threads, blokken en rasters te beheren die het parallellisme definiëren.
Fouten opsporen en testen van CUDA-programma's met behulp van hulpprogramma's zoals CUDA-GDB, CUDA-MEMCHECK en NVIDIA Nsight.
Optimaliseer CUDA-programma's met behulp van technieken zoals coalescing, caching, prefetching en profiling.

Vorm van de cursus

Interactieve lezing en discussie.
Veel oefeningen en oefenen.
Hands-on implementatie in een live-lab omgeving.

Opties voor het aanpassen van cursussen

Om een training op maat voor deze cursus aan te vragen, neem dan contact met ons op om een afspraak te maken.
96% van de klanten stelt tevreden

Bedankt voor uw aanvraag! Een van onze medewerkers neemt binnenkort contact met u op

Bedankt voor uw boeking! Een van onze medewerkers neemt binnenkort contact met u op.

Cursusaanbod

Invoering

Wat is CUDA?
CUDA versus OpenCL versus SYCL
Overzicht van CUDA-functies en architectuur
Het opzetten van de ontwikkelomgeving

Aan de slag

Een nieuw CUDA-project maken met behulp van Visual Studio Code
Het verkennen van de projectstructuur en bestanden
Het compileren en uitvoeren van het programma
De uitvoer weergeven met printf en fprintf

CUDA-API

Inzicht in de rol van CUDA API in het hostprogramma
CUDA API gebruiken om apparaatinformatie en -mogelijkheden op te vragen
CUDA API gebruiken om apparaatgeheugen toe te wijzen en de toewijzing ongedaan te maken
CUDA API gebruiken om gegevens tussen host en apparaat te kopiëren
CUDA API gebruiken om kernels te starten en threads te synchroniseren
CUDA API gebruiken om fouten en uitzonderingen af te handelen

CUDA C/C++

Inzicht in de rol van CUDA C/C++ in het apparaatprogramma
CUDA C/C++ gebruiken om kernels te schrijven die op de GPU worden uitgevoerd en gegevens manipuleren
Gebruik van CUDA C/C++-gegevenstypen, kwalificaties, operators en expressies
Gebruik van ingebouwde CUDA C/C++-functies, zoals wiskunde, atomic, warp, etc.
Met behulp van CUDA C/C++ ingebouwde variabelen, zoals threadIdx, blockIdx, blockDim, enz.
Gebruik van CUDA C/C++-bibliotheken, zoals cuBLAS, cuFFT, cuRAND, enz.

CUDA-geheugenmodel

Het verschil begrijpen tussen host- en apparaatgeheugenmodellen
CUDA-geheugenruimten gebruiken, zoals globaal, gedeeld, constant en lokaal
CUDA-geheugenobjecten gebruiken, zoals pointers, arrays, texturen en oppervlakken
Gebruik van CUDA-geheugentoegangsmodi, zoals alleen-lezen, alleen-schrijven, lezen-schrijven, enz.
Gebruik van CUDA-geheugenconsistentiemodel en synchronisatiemechanismen

CUDA-uitvoeringsmodel

Het verschil begrijpen tussen host- en apparaatuitvoeringsmodellen
Het gebruik van CUDA-threads, blokken en rasters om het parallellisme te definiëren
Gebruik van CUDA-threadfuncties, zoals threadIdx, blockIdx, blockDim, enz.
Gebruik van CUDA-blokfuncties, zoals __syncthreads, __threadfence_block, enz.
Gebruik van CUDA-rasterfuncties, zoals gridDim, gridSync, coöperatieve groepen, enz.

Foutopsporing

Inzicht in de veelvoorkomende fouten en bugs in CUDA-programma's
Gebruik Visual Studio Code debugger om variabelen, breekpunten, call-stack, enz. te inspecteren.
CUDA-GDB gebruiken om CUDA-programma's te debuggen op Linux
CUDA-MEMCHECK gebruiken om geheugenfouten en lekken te detecteren
NVIDIA Nsight gebruiken om CUDA-programma's op Windows te debuggen en analyseren

Optimalisatie

Inzicht in de factoren die de prestaties van CUDA-programma's beïnvloeden
Het gebruik van CUDA-coalescentietechnieken om de geheugendoorvoer te verbeteren
Het gebruik van CUDA-caching en prefetching-technieken om de geheugenlatentie te verminderen
Gebruik van CUDA gedeeld geheugen en lokale geheugentechnieken om geheugentoegang en bandbreedte te optimaliseren
Gebruik van CUDA-profilering en profileringstools om de uitvoeringstijd en het gebruik van middelen te meten en te verbeteren

Samenvatting en volgende stappen

Vereisten

Een goed begrip van de C/C++-taal en parallelle programmeerconcepten
Basiskennis van computerarchitectuur en geheugenhiërarchie
Ervaring met opdrachtregelprogramma's en code-editors

Publiek

Ontwikkelaars die willen leren hoe ze CUDA kunnen gebruiken om NVIDIA GPU's te programmeren en hun parallelliteit te exploiteren
Ontwikkelaars die hoogwaardige en schaalbare code willen schrijven die op verschillende CUDA-apparaten kan worden uitgevoerd
Programmeurs die de lagere aspecten van GPU programmeren willen verkennen en hun codeprestaties willen optimaliseren

28 Uren

Leveringsopties

PRIVÉGROEPSTRAINING

Onze identiteit draait om het leveren van precies wat onze klanten nodig hebben.

Pre-cursusgesprek met uw trainer
Aanpassing van de leerervaring om uw doelen te bereiken -

Op maat gemaakte overzichten
Praktische, praktische oefeningen met gegevens / scenario's die herkenbaar zijn voor de cursisten

Training gepland op een datum naar keuze
Gegeven online, op locatie/klaslokaal of hybride door experts die ervaring uit de echte wereld delen

Private Group Prices RRP from €9120 online delivery, based on a group of 2 delegates, €2880 per additional delegate (excludes any certification / exam costs). We recommend a maximum group size of 12 for most learning events.

Neem contact met ons op voor een exacte offerte en om onze laatste promoties te horen

GPU Programming with CUDA Training Cursus

Cursusaanbod

Vereisten

Leveringsopties

PRIVÉGROEPSTRAINING

OPENBARE TRAINING

Voorlopige Aankomende Cursussen

GPU Programming with CUDA

GPU Programming with CUDA

GPU Programming with CUDA

GPU Programming with CUDA

GPU Programming with CUDA

GPU Programming with CUDA

Gerelateerde categorieën

Deze site in andere landen/regio's

Europe

Asia Pacific

North America

South America

Africa / Middle East

Other sites

GPU Programming with CUDA Training Cursus

Cursusaanbod

Vereisten

Leveringsopties

PRIVÉGROEPSTRAINING

OPENBARE TRAINING

Voorlopige Aankomende Cursussen

GPU Programming with CUDA

GPU Programming with CUDA

GPU Programming with CUDA

GPU Programming with CUDA

GPU Programming with CUDA

GPU Programming with CUDA

Gerelateerde cursussen

Developing AI Applications with Huawei Ascend and CANN

Deploying AI Models with CANN and Ascend AI Processors

GPU Programming on Biren AI Accelerators

Cambricon MLU Development with BANGPy and Neuware

Introduction to CANN for AI Framework Developers

CANN for Edge AI Deployment

Understanding Huawei’s AI Compute Stack: From CANN to MindSpore

Optimizing Neural Network Performance with CANN SDK

CANN SDK for Computer Vision and NLP Pipelines

Building Custom AI Operators with CANN TIK and TVM

Migrating CUDA Applications to Chinese GPU Architectures

Performance Optimization on Ascend, Biren, and Cambricon

Gerelateerde categorieën

GPU

Deze site in andere landen/regio's

Europe

Asia Pacific

North America

South America

Africa / Middle East

Other sites