GPU Programming - OpenCL vs CUDA vs ROCm Training Cursus

GPU programmeren is een techniek die gebruik maakt van de parallelle verwerkingskracht van GPUs om toepassingen te versnellen die high-performance computing vereisen, zoals kunstmatige intelligentie, gaming, graphics en wetenschappelijk computergebruik. Er zijn verschillende raamwerken die GPU programmeren mogelijk maken, elk met zijn eigen voor- en nadelen. OpenCL is een open standaard die kan worden gebruikt om CPU's, GPU's en andere apparaten van verschillende leveranciers te programmeren, terwijl CUDA specifiek is voor NVIDIA GPU's. ROCm is een platform dat GPU-programmering op AMD GPU's ondersteunt, en ook compatibiliteit biedt met CUDA en OpenCL.

Deze door een instructeur geleide, live training (op locatie of op afstand) is gericht op ontwikkelaars op beginnersniveau tot op gemiddeld niveau die verschillende frameworks willen gebruiken voor GPU programmeren en hun functies, prestaties en compatibiliteit willen vergelijken.

Aan het einde van deze training kunnen deelnemers:

Zet een ontwikkelomgeving op met OpenCL SDK, CUDA Toolkit, ROCm Platform, een apparaat dat OpenCL, CUDA of ROCm ondersteunt, en Visual Studio Code.
Maak een basisprogramma GPU dat vectoroptelling uitvoert met behulp van OpenCL, CUDA en ROCm, en vergelijk de syntaxis, structuur en uitvoering van elk raamwerk.
Gebruik de respectievelijke API's om apparaatinformatie op te vragen, apparaatgeheugen toe te wijzen en de toewijzing ongedaan te maken, gegevens tussen host en apparaat te kopiëren, kernels te starten en threads te synchroniseren.
Gebruik de respectieve talen om kernels te schrijven die op het apparaat worden uitgevoerd en gegevens manipuleren.
Gebruik de respectieve ingebouwde functies, variabelen en bibliotheken om algemene taken en bewerkingen uit te voeren.
Gebruik de respectieve geheugenruimten, zoals globaal, lokaal, constant en privé, om gegevensoverdrachten en geheugentoegang te optimaliseren.
Gebruik de respectieve uitvoeringsmodellen om de threads, blokken en rasters te besturen die het parallellisme definiëren.
Debug en test GPU programma's met behulp van tools zoals CodeXL, CUDA-GDB, CUDA-MEMCHECK en NVIDIA Nsight.
Optimaliseer GPU programma's met behulp van technieken zoals coalescentie, caching, prefetching en profilering.

Formaat van de cursus

Interactieve lezing en discussie.
Veel oefeningen en oefeningen.
Praktische implementatie in een live-labomgeving.

Opties voor cursusaanpassing

Als u een training op maat voor deze cursus wilt aanvragen, kunt u contact met ons opnemen om een afspraak te maken.

Bedankt voor uw aanvraag! Een van onze medewerkers neemt binnenkort contact met u op

Bedankt voor uw boeking! Een van onze medewerkers neemt binnenkort contact met u op.

Cursusaanbod

Invoering

Wat is GPU programmeren?
Waarom GPU programmeren gebruiken?
Wat zijn de uitdagingen en afwegingen van GPU programmeren?
Wat zijn de raamwerken voor GPU programmeren?
Het juiste raamwerk voor uw toepassing kiezen

OpenCL

Wat is OpenCL?
Wat zijn de voor- en nadelen van OpenCL?
Het opzetten van de ontwikkelomgeving voor OpenCL
Een basisprogramma OpenCL maken dat vectoroptelling uitvoert
OpenCL API gebruiken om apparaatinformatie op te vragen, apparaatgeheugen toe te wijzen en de toewijzing ongedaan te maken, gegevens tussen host en apparaat te kopiëren, kernels te starten en threads te synchroniseren
OpenCL C-taal gebruiken om kernels te schrijven die op het apparaat worden uitgevoerd en gegevens manipuleren
Gebruik OpenCL ingebouwde functies, variabelen en bibliotheken om algemene taken en bewerkingen uit te voeren
Gebruik OpenCL geheugenruimten, zoals globaal, lokaal, constant en privé, om gegevensoverdracht en geheugentoegang te optimaliseren
Het OpenCL uitvoeringsmodel gebruiken om de werkitems, werkgroepen en ND-bereiken te controleren die het parallellisme definiëren
Debuggen en testen OpenCL van programma's met behulp van tools zoals CodeXL
Het optimaliseren OpenCL van programma's met behulp van technieken zoals coalescentie, caching, prefetching en profilering

CUDA

Wat is CUDA?
Wat zijn de voor- en nadelen van CUDA?
Opzetten van de ontwikkelomgeving voor CUDA
Een basis CUDA-programma maken dat vectoroptelling uitvoert
De CUDA API gebruiken om apparaatinformatie op te vragen, apparaatgeheugen toe te wijzen en de toewijzing ongedaan te maken, gegevens tussen host en apparaat te kopiëren, kernels te starten en threads te synchroniseren
Gebruik van de CUDA C/C++-taal om kernels te schrijven die op het apparaat worden uitgevoerd en gegevens manipuleren
Ingebouwde CUDA-functies, variabelen en bibliotheken gebruiken om algemene taken en bewerkingen uit te voeren
Gebruik van CUDA-geheugenruimten, zoals globaal, gedeeld, constant en lokaal, om gegevensoverdracht en geheugentoegang te optimaliseren
Het CUDA-uitvoeringsmodel gebruiken om de threads, blokken en rasters te controleren die het parallellisme definiëren
Foutopsporing en testen van CUDA-programma's met behulp van tools zoals CUDA-GDB, CUDA-MEMCHECK en NVIDIA Nsight
Het optimaliseren van CUDA-programma's met behulp van technieken zoals coalescing, caching, prefetching en profilering

ROCm

Wat is ROCm?
Wat zijn de voor- en nadelen van ROCm?
Inrichten van de ontwikkelomgeving voor ROCm
Een basis ROCm-programma maken dat vectoroptelling uitvoert
ROCm API gebruiken om apparaatinformatie op te vragen, apparaatgeheugen toe te wijzen en de toewijzing ongedaan te maken, gegevens tussen host en apparaat te kopiëren, kernels te starten en threads te synchroniseren
ROCm C/C++-taal gebruiken om kernels te schrijven die op het apparaat worden uitgevoerd en gegevens manipuleren
Gebruik van ROCm ingebouwde functies, variabelen en bibliotheken om algemene taken en bewerkingen uit te voeren
ROCm-geheugenruimten gebruiken, zoals globaal, lokaal, constant en privé, om gegevensoverdracht en geheugentoegang te optimaliseren
Het ROCm-uitvoeringsmodel gebruiken om de threads, blokken en rasters te controleren die het parallellisme definiëren
Debuggen en testen van ROCm-programma's met behulp van tools zoals ROCm Debugger en ROCm Profiler
Het optimaliseren van ROCm-programma's met behulp van technieken zoals coalescing, caching, prefetching en profilering

Vergelijking

Vergelijking van de functies, prestaties en compatibiliteit van OpenCL, CUDA en ROCm
Evaluatie van GPU programma's met behulp van benchmarks en statistieken
Leer de best practices en tips voor GPU programmeren
Onderzoek naar de huidige en toekomstige trends en uitdagingen van GPU programmeren

Samenvatting en volgende stappen

Vereisten

Een goed begrip van de C/C++-taal en parallelle programmeerconcepten
Basiskennis van computerarchitectuur en geheugenhiërarchie
Ervaring met opdrachtregelprogramma's en code-editors

Publiek

Ontwikkelaars die willen leren hoe ze verschillende raamwerken voor GPU programmeren kunnen gebruiken en hun functies, prestaties en compatibiliteit willen vergelijken
Ontwikkelaars die draagbare en schaalbare code willen schrijven die op verschillende platforms en apparaten kan worden uitgevoerd
Programmeurs die de afwegingen en uitdagingen van GPU programmeren en optimaliseren willen verkennen

28 Uren

Leveringsopties

PRIVÉGROEPSTRAINING

Onze identiteit draait om het leveren van precies wat onze klanten nodig hebben.

Pre-cursusgesprek met uw trainer
Aanpassing van de leerervaring om uw doelen te bereiken -

Op maat gemaakte overzichten
Praktische, praktische oefeningen met gegevens / scenario's die herkenbaar zijn voor de cursisten

Training gepland op een datum naar keuze
Gegeven online, op locatie/klaslokaal of hybride door experts die ervaring uit de echte wereld delen

Private Group Prices RRP from €9120 online delivery, based on a group of 2 delegates, €2880 per additional delegate (excludes any certification / exam costs). We recommend a maximum group size of 12 for most learning events.

Neem contact met ons op voor een exacte offerte en om onze laatste promoties te horen

OPENBARE TRAINING

Kijk op onze public courses

Hulp nodig bij het kiezen van de juiste cursus?

Reviews (2)

Zeer interactief met diverse voorbeelden, met een goede progressie in complexiteit tussen start en einde van de training.

GPU Programming - OpenCL vs CUDA vs ROCm Training Cursus

Cursusaanbod

Vereisten

Leveringsopties

PRIVÉGROEPSTRAINING

OPENBARE TRAINING

Reviews (2)

Jenny - Andheo

Cursus - GPU Programming with CUDA and Python

Tadeusz Kaluba - Nokia Solutions and Networks Sp. z o.o.

Cursus - NVIDIA GPU Programming - Extended

Voorlopige Aankomende Cursussen

GPU Programming - OpenCL vs CUDA vs ROCm

GPU Programming - OpenCL vs CUDA vs ROCm

GPU Programming - OpenCL vs CUDA vs ROCm

GPU Programming - OpenCL vs CUDA vs ROCm

Gerelateerde categorieën

Deze site in andere landen/regio's

Europe

Asia Pacific

North America

South America

Africa / Middle East

Other sites

GPU Programming - OpenCL vs CUDA vs ROCm Training Cursus

Cursusaanbod

Vereisten

Leveringsopties

PRIVÉGROEPSTRAINING

OPENBARE TRAINING

Reviews (2)

Jenny - Andheo

Cursus - GPU Programming with CUDA and Python

Tadeusz Kaluba - Nokia Solutions and Networks Sp. z o.o.

Cursus - NVIDIA GPU Programming - Extended

Voorlopige Aankomende Cursussen

GPU Programming - OpenCL vs CUDA vs ROCm

GPU Programming - OpenCL vs CUDA vs ROCm

GPU Programming - OpenCL vs CUDA vs ROCm

GPU Programming - OpenCL vs CUDA vs ROCm

Gerelateerde cursussen

NVIDIA GPU Programming - Extended

GPU Programming with CUDA and Python

GPU Programming with OpenCL

GPU Programming with CUDA

Administration of CUDA

Developing AI Applications with Huawei Ascend and CANN

GPU Programming on Biren AI Accelerators

Cambricon MLU Development with BANGPy and Neuware

Migrating CUDA Applications to Chinese GPU Architectures

AI Inference and Deployment with CloudMatrix

Performance Optimization on Ascend, Biren, and Cambricon

Gerelateerde categorieën

GPU

Deze site in andere landen/regio's

Europe

Asia Pacific

North America

South America

Africa / Middle East

Other sites