Course Outline

Invoering

  • Grafiekdatabases en bibliotheken

Grafiekgegevens begrijpen

  • De grafiek als datastructuur
  • Het gebruik van hoekpunten (punten) en randen (lijnen) om scenario's uit de echte wereld te modelleren

Grafiek Database gebruiken om grafiekgegevens te modelleren, persistent te maken en te verwerken

  • Lokale grafiekalgoritmen/traversals
  • neo4j, OrientDB en Titan

Oefening: Grafiekgegevens modelleren met neo4j

  • Whiteboard-gegevensmodellering

Voorbij grafiek Databases: Graph Computing

  • De eigenschappengrafiek begrijpen
  • Grafiekmodellering van verschillende scenario's (softwaregrafiek, discussiegrafiek, conceptgrafiek)

Problemen uit de echte wereld oplossen met Traversals

  • Algoritmische/gerichte wandeling over de grafiek
  • Bepalen van circulaire afhankelijkheid

Casestudy: het rangschikken van bijdragers aan discussies

  • Rangschikking op aantal en diepgang van de bijgedragen discussies
  • Een opmerking over sentiment- en conceptanalyse

Graph Computing: Lokale grafiektoolkits in het geheugen

  • Grafiekanalyse en visualisatie
  • JUNG, NetworkX en iGraph

Oefening: Grafiekgegevens modelleren met NetworkX

  • NetworkX gebruiken om een complex systeem te modelleren

Graph Computing: Grafiekframeworks voor batchverwerking

  • Gebruik maken van Hadoop voor opslag (HDFS) en verwerking (MapReduce)
  • Overzicht van iteratieve algoritmen
  • Hama, Giraph en GraphLab

Graph Computing: Grafiek-parallelle berekening

  • ETL, verkennende analyse en iteratieve grafiekberekening verenigen binnen één systeem
  • GraphX

Installatie en installatie

  • Hadoop en vonk

GraphX Exploitanten

  • Eigendom, structureel, samenvoegen, buurtaggregatie, caching en uncaching

Itereren met Pregel API

  • Argumenten doorgeven voor verzenden, ontvangen en computergebruik

Een grafiek bouwen

  • Gebruik van hoekpunten en randen in een RDD of op schijf

Het ontwerpen van Scalable-algoritmen

  • GraphX Optimalisatie

Accessing van aanvullende algoritmen

  • PageRank, verbonden componenten, driehoeken tellen

Oefening: Paginarangschikking en topgebruikers

  • Grafiekgegevens opbouwen en verwerken met behulp van tekstbestanden als invoer

Implementatie naar productie

Slotopmerkingen

Requirements

  • Een goed begrip van Java-programmering en -frameworks
  • Een algemeen begrip van Python is nuttig maar niet vereist
  • Een algemeen begrip van databaseconcepten

Publiek

  • Ontwikkelaars
  28 Hours
 

Getuigenissen (2)

Related Courses

Related Categories