Introductie tot GPU-programmeren Training Cursus

GPU programmeren is een techniek die gebruik maakt van de parallelle verwerkingskracht van GPUs om toepassingen te versnellen die high-performance computing vereisen, zoals kunstmatige intelligentie, gaming, graphics en wetenschappelijk computergebruik. Er zijn verschillende raamwerken en tools die GPU programmeren mogelijk maken, elk met zijn eigen voor- en nadelen. Enkele van de meest populaire zijn OpenCL, CUDA, ROCm en HIP.

Deze door een instructeur geleide, live training (op locatie of op afstand) is gericht op ontwikkelaars op beginnersniveau tot op gemiddeld niveau die de basisprincipes van GPU programmeren en de belangrijkste raamwerken en hulpmiddelen voor het ontwikkelen van GPU applicaties willen leren.

Aan het einde van deze training kunnen deelnemers:
Begrijp het verschil tussen CPU en GPU computergebruik en de voordelen en uitdagingen van GPU programmeren.
Kies het juiste raamwerk en de juiste tool voor hun GPU toepassing.
Maak een basisprogramma GPU dat vectoroptelling uitvoert met behulp van een of meer van de raamwerken en hulpmiddelen.
Gebruik de respectievelijke API's, talen en bibliotheken om apparaatinformatie op te vragen, apparaatgeheugen toe te wijzen en de toewijzing daarvan ongedaan te maken, gegevens tussen host en apparaat te kopiëren, kernels te starten en threads te synchroniseren.
Gebruik de respectieve geheugenruimten, zoals globaal, lokaal, constant en privé, om gegevensoverdrachten en geheugentoegang te optimaliseren.
Gebruik de respectieve uitvoeringsmodellen, zoals werkitems, werkgroepen, threads, blokken en rasters, om de parallelliteit te controleren.
Debug en test GPU programma's met behulp van tools zoals CodeXL, CUDA-GDB, CUDA-MEMCHECK en NVIDIA Nsight.
Optimaliseer GPU programma's met behulp van technieken zoals coalescentie, caching, prefetching en profilering.

Formaat van de cursus

Interactieve lezing en discussie.
Veel oefeningen en oefeningen.
Praktische implementatie in een live-labomgeving.

Opties voor cursusaanpassing

Als u een training op maat voor deze cursus wilt aanvragen, kunt u contact met ons opnemen om een afspraak te maken.

Bedankt voor uw aanvraag! Een van onze medewerkers neemt binnenkort contact met u op

Bedankt voor uw boeking! Een van onze medewerkers neemt binnenkort contact met u op.

Cursusaanbod

Invoering

Wat is GPU programmeren?
Waarom GPU programmeren gebruiken?
Wat zijn de uitdagingen en afwegingen van GPU programmeren?
Wat zijn de raamwerken en hulpmiddelen voor GPU programmeren?
Kies het juiste raamwerk en de juiste tool voor uw toepassing

OpenCL

Wat is OpenCL?
Wat zijn de voor- en nadelen van OpenCL?
Het opzetten van de ontwikkelomgeving voor OpenCL
Een basisprogramma OpenCL maken dat vectoroptelling uitvoert
OpenCL API gebruiken om apparaatinformatie op te vragen, apparaatgeheugen toe te wijzen en de toewijzing ongedaan te maken, gegevens tussen host en apparaat te kopiëren, kernels te starten en threads te synchroniseren
OpenCL C-taal gebruiken om kernels te schrijven die op het apparaat worden uitgevoerd en gegevens manipuleren
Gebruik OpenCL ingebouwde functies, variabelen en bibliotheken om algemene taken en bewerkingen uit te voeren
Gebruik OpenCL geheugenruimten, zoals globaal, lokaal, constant en privé, om gegevensoverdracht en geheugentoegang te optimaliseren
Het OpenCL uitvoeringsmodel gebruiken om de werkitems, werkgroepen en ND-bereiken te controleren die het parallellisme definiëren
Debuggen en testen OpenCL van programma's met behulp van tools zoals CodeXL
Het optimaliseren OpenCL van programma's met behulp van technieken zoals coalescentie, caching, prefetching en profilering

CUDA

Wat is CUDA?
Wat zijn de voor- en nadelen van CUDA?
Opzetten van de ontwikkelomgeving voor CUDA
Een basis CUDA-programma maken dat vectoroptelling uitvoert
De CUDA API gebruiken om apparaatinformatie op te vragen, apparaatgeheugen toe te wijzen en de toewijzing ongedaan te maken, gegevens tussen host en apparaat te kopiëren, kernels te starten en threads te synchroniseren
Gebruik van de CUDA C/C++-taal om kernels te schrijven die op het apparaat worden uitgevoerd en gegevens manipuleren
Ingebouwde CUDA-functies, variabelen en bibliotheken gebruiken om algemene taken en bewerkingen uit te voeren
Gebruik van CUDA-geheugenruimten, zoals globaal, gedeeld, constant en lokaal, om gegevensoverdracht en geheugentoegang te optimaliseren
Het CUDA-uitvoeringsmodel gebruiken om de threads, blokken en rasters te controleren die het parallellisme definiëren
Foutopsporing en testen van CUDA-programma's met behulp van tools zoals CUDA-GDB, CUDA-MEMCHECK en NVIDIA Nsight
Het optimaliseren van CUDA-programma's met behulp van technieken zoals coalescing, caching, prefetching en profilering

ROCm

Wat is ROCm?
Wat zijn de voor- en nadelen van ROCm?
Inrichten van de ontwikkelomgeving voor ROCm
Een basis ROCm-programma maken dat vectoroptelling uitvoert
ROCm API gebruiken om apparaatinformatie op te vragen, apparaatgeheugen toe te wijzen en de toewijzing ongedaan te maken, gegevens tussen host en apparaat te kopiëren, kernels te starten en threads te synchroniseren
ROCm C/C++-taal gebruiken om kernels te schrijven die op het apparaat worden uitgevoerd en gegevens manipuleren
Gebruik van ROCm ingebouwde functies, variabelen en bibliotheken om algemene taken en bewerkingen uit te voeren
ROCm-geheugenruimten gebruiken, zoals globaal, lokaal, constant en privé, om gegevensoverdracht en geheugentoegang te optimaliseren
Het ROCm-uitvoeringsmodel gebruiken om de threads, blokken en rasters te controleren die het parallellisme definiëren
Debuggen en testen van ROCm-programma's met behulp van tools zoals ROCm Debugger en ROCm Profiler
Het optimaliseren van ROCm-programma's met behulp van technieken zoals coalescing, caching, prefetching en profilering

HEUP

Wat is HIP?
Wat zijn de voor- en nadelen van HIP?
Opzetten van de ontwikkelomgeving voor HIP
Een basis-HIP-programma maken dat vectoroptelling uitvoert
HIP-taal gebruiken om kernels te schrijven die op het apparaat worden uitgevoerd en gegevens manipuleren
Gebruik van ingebouwde HIP-functies, variabelen en bibliotheken om algemene taken en bewerkingen uit te voeren
HIP-geheugenruimten gebruiken, zoals globaal, gedeeld, constant en lokaal, om gegevensoverdracht en geheugentoegang te optimaliseren
Gebruik van het HIP-uitvoeringsmodel om de threads, blokken en rasters te controleren die het parallellisme definiëren
Debuggen en testen van HIP-programma's met behulp van tools zoals ROCm Debugger en ROCm Profiler
Het optimaliseren van HIP-programma's met behulp van technieken zoals coalescing, caching, prefetching en profilering

Vergelijking

Vergelijking van de functies, prestaties en compatibiliteit van OpenCL, CUDA, ROCm en HIP
Evaluatie van GPU programma's met behulp van benchmarks en statistieken
Leer de best practices en tips voor GPU programmeren
Onderzoek naar de huidige en toekomstige trends en uitdagingen van GPU programmeren

Samenvatting en volgende stap

Vereisten

Een goed begrip van de C/C++-taal en parallelle programmeerconcepten
Basiskennis van computerarchitectuur en geheugenhiërarchie
Ervaring met opdrachtregelprogramma's en code-editors

Publiek

Ontwikkelaars die de basisprincipes van GPU programmeren willen leren en de belangrijkste raamwerken en tools voor het ontwikkelen van GPU applicaties
Ontwikkelaars die draagbare en schaalbare code willen schrijven die op verschillende platforms en apparaten kan worden uitgevoerd
Programmeurs die de voordelen en uitdagingen van GPU programmeren en optimaliseren willen verkennen

21 Uren

Leveringsopties

PRIVÉGROEPSTRAINING

Onze identiteit draait om het leveren van precies wat onze klanten nodig hebben.

Pre-cursusgesprek met uw trainer
Aanpassing van de leerervaring om uw doelen te bereiken -

Op maat gemaakte overzichten
Praktische, praktische oefeningen met gegevens / scenario's die herkenbaar zijn voor de cursisten

Training gepland op een datum naar keuze
Gegeven online, op locatie/klaslokaal of hybride door experts die ervaring uit de echte wereld delen

Private Group Prices RRP from €6840 online delivery, based on a group of 2 delegates, €2160 per additional delegate (excludes any certification / exam costs). We recommend a maximum group size of 12 for most learning events.

Neem contact met ons op voor een exacte offerte en om onze laatste promoties te horen

Introductie tot GPU-programmeren Training Cursus

Cursusaanbod

Vereisten

Leveringsopties

PRIVÉGROEPSTRAINING

OPENBARE TRAINING

Voorlopige Aankomende Cursussen

Introductie tot GPU-programmeren

Introductie tot GPU-programmeren

Introductie tot GPU-programmeren

Introductie tot GPU-programmeren

Gerelateerde categorieën

Deze site in andere landen/regio's

Europe

Asia Pacific

North America

South America

Africa / Middle East

Other sites

Introductie tot GPU-programmeren Training Cursus

Cursusaanbod

Vereisten

Leveringsopties

PRIVÉGROEPSTRAINING

OPENBARE TRAINING

Voorlopige Aankomende Cursussen

Introductie tot GPU-programmeren

Introductie tot GPU-programmeren

Introductie tot GPU-programmeren

Introductie tot GPU-programmeren

Gerelateerde cursussen

Ontwikkeling van AI-applicaties met Huawei Ascend en CANN

Deploying AI Models met CANN en Ascend AI-processors

GPU Programming over Biren AI Accelerators

Cambricon MLU Development with BANGPy and Neuware

Inleiding tot CANN voor AI Framework Ontwikkelaars

Deployment

Huawei’s AI Compute Stack: Van CANN tot MindSpore

Optimizing Neural Network Performance with CANN SDK

CANN SDK voor computer vision en NLP-pijplijnen

Aangepaste AI-operatoren maken met CANN TIK en TVM

Migrating CUDA Applications to Chinese GPU Architectures

Performance Optimization on Ascend, Biren, and Cambricon

Gerelateerde categorieën

GPU

Deze site in andere landen/regio's

Europe

Asia Pacific

North America

South America

Africa / Middle East

Other sites