Xebia Academy is also available in EnglishSwitch to English
Close

Cloud Technology training: Data Engineering op Google Cloud Platform

Word Professional Data Engineer op GCP. Ontwerp data processing systems, bouw end-to-end data pipelines, analyseer data en ga aan de slag met Machine Learning. Deze training is onderdeel van Google's Data Engineering traject dat leidt tot het Professional Data Engineer certificaat.

Word GCP Data Engineer

Ben jij als Developer verantwoordelijk voor Big Data transformaties? Wil je een Professional worden op het Google Cloud Platform? Tijd om de kennis en vaardigheden op te doen die je voorbereiden op het Google certificaat. Deze training leert je data processing systemen te ontwerpen en bouwen op het Google Cloud Platform. Je leert data analyseren en Machine Learning gebruiken. We behandelen gestructureerde, ongestructureerde en streaming data.

Data Engineering op GCP is perfect voor 

Deze training is perfect voor ervaren Developers die verantwoordelijk zijn voor het extraheren, laden, transformeren en valideren van data, en het ontwerpen van pipelines en architecturen voor data processing. Houd jij je bezig met Machine Learning, datastens, het visualiseren van query resultaten en het maken van rapporten, dan is deze training ook interessant voor jou.

We raden je aan eerst de Google Cloud Fundamentals: Big Data & Machine Learning training te volgen. Om het maximale uit deze dagen te halen is ervaring met een query taal zoals SQL, data modeling, het ontwikkelen van apps met bijvoorbeeld Python en Machine Learning aan te bevelen.

Wat leer je tijdens de Data Engineering training? 

Deze 4-daagse training biedt een combinatie van presentaties, demo's en hands-on labs. Je leert data processing systemen ontwerpen, end-to-end pipelines aanmaken, gegevens analyseren en Machine Learning.

Programma

Google Cloud Dataproc Overzicht

  • Creëeren en managen van clusters.
  • Gebruiken van Machine Types and Preemptible Worker Nodes.
  • Schalen en verwijderen van Clusters.
  • Lab: Hadoop Clusters met Google Cloud Dataproc.

Dataproc Jobs uitvoeren

  • Pig en Hive jobs.
  • Scheiden Storage en Compute.
  • Lab: Het uitvoeren van Hadoop en Spark Jobs met Dataproc.
  • Lab: Jobs invoeren en monitoren.

Dataproc integreren met Google Cloud Platform

  • Clusters aanpassen met 'initialization actions'.
  • BigQuery Support.
  • Lab: Google Cloud Platform Services gebruiken.

Ongestructureerde Data begrijpen Google’s Machine Learning APIs

  • Google Machine Learning APIs.
  • Veelvoorkomende ML Use Cases.
  • Een beroep doen op ML APIs.
  • Lab: Machine Learning toevoegen aan Big Data Analysis.

Serverless Data Analyze met BigQuery

  • Wat is BigQuery?
  • Queries en Functions.
  • Lab: Queries schrijven in BigQuery.
  • Data in BigQuery laden.
  • Data exporteren uit BigQuery.
  • Lab: Inladen en exporteren data.
  • Nested en repeated fields.
  • Query meerdere tabellen.
  • Lab: Complexe queries.
  • Performance en pricing.

Serverless, autoscaling data pipelines met Dataflow

  • Het Beam programming model.
  • Data pipelines in Beam Python.
  • Data pipelines in Beam Java.
  • Lab: Schrijven van een Dataflow pipeline.
  • Schaalbare Big Data processing met Beam.
  • Lab: MapReduce in Dataflow.
  • Extra data toevoegen.
  • Lab: Side inputs.
  • Stream data verwerken.
  • GCP Reference architectuur.

Starten met Machine Learning

  • Wat is machine learning (ML).
  • Effectieve ML: concepten, types.
  • ML datasets: generalization.
  • Lab: Verken en creëer ML datasets.

Bouw ML modellen met Tensorflow

  • Aan de slag met TensorFlow.
  • Lab: Gebruik tf.learn.
  • TensorFlow grafieken en loops + lab.
  • Lab: Gebruik low-level TensorFlow + early stopping.
  • Monitoren van ML training.
  • Lab: Charts en graphs van TensorFlow training.

ML modellen schalen met CloudML

  • Waarom Cloud ML?
  • Een TensorFlow model verpakken.
  • End-to-end training.
  • Lab: Rol een ML model lokaal en in de cloud uit.

Feature Engineering

  • Creëer goede features.
  • Transformeer input.
  • Synthetische features.
  • Preprocessing met Cloud ML.
  • Lab: Feature engineering.

Streaming analytics pipelines

  • Uitdagingen van stream data processing.
  • Omgaan met variërende data volumes.
  • Omgaan met 'unordered/late' data.
  • Lab: Ontwerp een streaming pipeline.

Variabele Volumes

  • Wat is Cloud Pub/Sub?
  • Hoe werkt het: Topics en Subscriptions.
  • Lab: Simulator.

Streaming pipelines implementeren

  • Uitdagingen met stream processing.
  • Verwerken van 'late data': Watermarks, Triggers, Accumulation.
  • Lab: Stream data processing pipeline voor live traffic data.

Streaming analytics en dashboards

  • Streaming analytics: van data tot besluit.
  • Query streaming data met BigQuery.
  • Wat is Google Data Studio?
  • Lab: bouw a real-time dashboard om processed data te visualiseren.

High throughput en low-latency met Bigtable

  • Wat is Cloud Spanner?
  • Ontwerp een Bigtable schema.
  • Opname in Bigtable.
  • Lab: stream naar Bigtable.

GCP Trainers

Deze Cloud Technology training wordt gegeven door Binx.io. Binx.io ontwikkelt Cloud-Based Solutions, traint en coacht teams en verzorgt Managed Cloud Services. Binx.io is Google Cloud Authorized Training Partner, en jouw trainer is een echte Cloud goeroe die graag zijn of haar ervaringen deelt om jou te helpen het meeste uit GCP te halen.

Google Certificering

Onze Google Cloud Platform trainingen volgen allemaal het door Google opgestelde curriculum. De Data Engineering op Google Cloud Platform training leert je data verwerken en analyseren op GCP. Deze training bereidt je voor op het Professional Data Engineer examen en certificaat van Google. Google raadt aan om 3+ jaar ervaring in de sector te hebben, waaronder 1+ jaar ervaring in het ontwerpen en beheren van oplossingen met behulp van GCP voordat je het examen aflegt. Het examen is niet bij deze training inbegrepen en meer informatie hoe je het kan kopen/plannen kan je hier vinden.

Google Cloud Platform Learning Journey

Jouw GCP Network Engineering Learning Journey begint met een opleiding op Foundation level. Met deze basiskennis op zak kun je de Certified Google Cloud Platform track selecteren die het beste bij jouw professionele ambities past. Deze training is nodig om Google Cloud Professional Data Engineer te worden. Sta je aan het begin van de Data Engineer track? Begin met de Google Cloud Platform Fundamentals: Big Data en Machine Learning training.

Ja, ik wil een Professional Data Engineer worden.

Na aanmelding voor deze training ontvang je een bevestigingsmail met praktische informatie. Een week voor de training vragen wij naar eventuele dieetwensen. Tot dan!

Wat moet ik nog meer weten?

  • Literatuur en een heerlijke lunch zijn inbegrepen in de prijs van de training
  • Reis- en verblijfkosten zijn niet inbegrepen
  • Je hebt voor deze training je laptop nodig
contact-us

Contact opnemen

Ons team staat voor je klaar

Stuur ons een bericht! →

Of bel +31 (0)20 760 9844