Course Outline

Gedetailleerd trainingsoverzicht

    Inleiding tot NLP NLP begrijpen NLP Frameworks Commerciële toepassingen van NLP Gegevens van het web verzamelen Werken met verschillende API's om tekstgegevens op te halen Tekstcorpora bewerken en opslaan van inhoud en relevante metadata Voordelen van het gebruik van Python en NLTK spoedcursus Praktisch begrip van een corpus en dataset Waarom hebben we een corpus nodig? Corpusanalyse Soorten data-attributen Verschillende bestandsformaten voor corpora Een dataset voorbereiden voor NLP-toepassingen De structuur van zinnen begrijpen Componenten van NLP Natuurlijk taalbegrip Morfologische analyse - stam-, woord-, token-, spraaktags Syntactische analyse Semantische analyse Omgaan met dubbelzinnigheid Voorverwerking van tekstgegevens Corpus - onbewerkte tekst Zintokenisatie Stemming voor onbewerkte tekst Lemmisatie van onbewerkte tekst Stop woordverwijdering Corpus-onbewerkte zinnen Word tokenisatie Word lemmatisatie Werken met Term-Document/Document-Term-matrices Teksttokenisatie in n-grammen en zinnen Praktische en op maat gemaakte voorverwerking Tekstgegevens analyseren Basisfunctie van NLP-parsers en parseren van POS-tagging en taggers Naam-entiteitsherkenning N-gram Zak met woorden Statistische kenmerken van NLP Concepten van lineaire algebra voor NLP Probabilistische theorie voor NLP TF-IDF Vectorisatie Encoders en decoders Normalisatie Probabilistische modellen Geavanceerde functie-engineering en NLP Basisprincipes van word2vec Componenten van het word2vec-model Logica van het word2vec-model Uitbreiding van het word2vec-concept Toepassing van het word2vec-model Casestudy: Toepassing van een reeks woorden: automatische tekstsamenvatting met behulp van vereenvoudigde en echte Luhn-algoritmen Documentclustering, classificatie en onderwerpmodellering Documentclustering en patroonanalyse (hiërarchische clustering, k-means, clustering, etc.) Documenten vergelijken en classificeren met behulp van TFIDF, Jaccard en cosinusafstandsmetingen Documentclassificatie met behulp van Naïeve Bayes en Maximale Entropie Belangrijke tekstelementen identificeren Reductie van de dimensionaliteit: analyse van hoofdcomponenten, decompositie van singuliere waarden niet-negatieve matrixfactorisatie Onderwerpmodellering en het ophalen van informatie met behulp van latente semantische analyse Entiteitsextractie, sentimentanalyse en geavanceerde onderwerpmodellering Positief versus negatief: mate van sentiment Item Response Theorie Deel van spraaktagging en de toepassing ervan: het vinden van mensen, plaatsen en organisaties genoemd in tekst Geavanceerde onderwerpmodellering: Latente Dirichlet-toewijzing Casestudies Mining van ongestructureerde gebruikersrecensies Sentimentclassificatie en visualisatie van productrecensie Datamining zoeklogboeken voor gebruikspatronen Tekstclassificatie Onderwerpmodellering

Requirements

Kennis en bewustzijn van NLP-principes en waardering voor AI-toepassing in het bedrijfsleven

  21 Hours
 

Getuigenissen (2)

Related Courses

Smart Robots for Developers

  84 Hours

Related Categories