Course Outline

Invoering

Principes van gedistribueerd computergebruik

    Apache-vonk Hadoop

Principes van Data Serialization

    Hoe gegevensobjecten over het netwerk worden doorgegeven Serialisatie van objecten Serialisatiebenaderingen Spaarzaamheid Protocolbuffers Apache Avro gegevensstructuurgrootte, snelheid, formaatkenmerken persistente gegevensopslag integratie met dynamische talen dynamische typeschema's beheer van niet-gelabelde gegevenswijzigingen

Data Serialization en gedistribueerde computers

    Avro als deelproject van Hadoop Java-serialisatie Hadoop-serialisatie Avro-serialisatie

Gebruik Avro met

    Hive (AvroSerDe) Varken (AvroStorage)

Bestaande RPC-frameworks porteren

Samenvatting en conclusie

Requirements

  • Een algemene bekendheid met gedistribueerd computergebruik.
 14 Hours

Getuigenissen (3)

Related Courses

Related Categories