Big Data in AWS bietet eine Einführung in Cloud-basierte Big Data-Lösungen und Amazon Elastic MapReduce (EMR), die AWS-Plattform für Big Data. In diesem Kurs zeigen wir Ihnen, wie Sie Amazon EMR zum Verarbeiten von Daten mithilfe des umfassenden Angebots an Hadoop-Tools wie beispielsweise Pig und Hive einsetzen. Sie erfahren außerdem, wie Sie Big Data-Umgebungen erstellen, mit Amazon DynamoDB, Amazon Redshift und Amazon Kinesis arbeiten, und wie Sie durch Befolgen bewährter Methoden sichere und wirtschaftliche Big Data-Umgebungen einrichten.
Big Data in AWS Training
aktuelle Kurs-Termine finden Sie am Ende dieser Seite … Firmenschulungen gerne auf Anfrage!
Beschreibung
“Big Data in AWS” bietet eine Einführung in Cloud-basierte Big Data-Lösungen wie Amazon (EMR), Amazon Redshift, Amazon Kinesis und alle weiteren Komponenten der AWS-Plattform für Big Data. In diesem Kurs zeigen wir Ihnen, wie Sie Amazon EMR zum Verarbeiten von Daten mithilfe des umfassenden Angebots an Hadoop-Tools wie beispielsweise Hive und Hue einsetzen. Sie erfahren außerdem, wie Sie Big Data-Umgebungen erstellen, mit Amazon DynamoDB, Amazon Redshift, Amazon Quicksight, Amazon Athena und Amazon Kinesis arbeiten, und wie Sie durch Befolgen bewährter Methoden sichere und wirtschaftliche Big Data-Umgebungen einrichten.
Kursziele
In diesem Kurs lernen Sie Folgendes:
Integrieren von AWS-Lösungen in ein Big Data-Ökosystem
Nutzen von Apache Hadoop im Kontext von Amazon EMR
Identifizieren der Komponenten eines Amazon EMR-Clusters
Starten und Konfigurieren eines Amazon EMR-Clusters
Nutzen gängiger Programmierungs-Frameworks, die für Amazon EMR zur Verfügung stehen, wie z. B. Hive, Pig und Streaming
Nutzen von Hue zur Verbesserung der Benutzerfreundlichkeit von Amazon EMR
Verwenden von In-Memory-Analysen mit Spark auf Amazon EMR
Auswählen der geeigneten AWS-Datenspeicherungsoptionen
Erkennen der Vorteile des Einsatzes von Amazon Kinesis für die Verarbeitung von Big Data beinahe in Echtzeit
Nutzen von Amazon Redshift, um Daten effizient zu speichern und zu analysieren
Verstehen und Verwalten der Kosten und Sicherheit einer Big Data-Lösung
Optimale Sicherheit für eine Big Data-Lösung
Identifizieren von Optionen für das Einlesen, die Übertragung und die Komprimierung von Daten
Verwenden von Amazon Athena für Analysen mit Ad-hoc-Abfragen
Verwenden von Visualisierungssoftware zur Abbildung von Daten und Abfragen mit Amazon QuickSight
Registrieren von Big Data-Workflows mithilfe von AWS Data Pipeline
Zielgruppe
Dieser Kurs ist konzipiert für:
Verantwortliche für die Konzeption und Umsetzung von Big Data-Lösungen, d. h. Solutions Architects
Datenwissenschaftler und Datenanalysten, die die Services und Architekturmuster für Big Data-Lösungen auf AWS näher kennenlernen möchten
Voraussetzungen
Wir empfehlen, dass die Teilnehmer an diesem Kurs die folgenden Voraussetzungen erfüllen:
Grundkenntnisse in Big Data-Technologien einschließlich Apache Hadoop-, MapReduce-, HDFS- und SQL/NoSQL-Abfragen
Teilnehmer müssen den Kurs Big Data Technology Fundamentals absolviert haben oder eine ähnliche Erfahrung aufweisen.
Arbeitskenntnisse der wichtigen AWS-Services und Implementierung öffentlicher Clouds
Teilnehmer müssen den Kurs AWS Technical Essentials absolviert haben oder eine ähnliche Erfahrung aufweisen.
Grundlegendes Verständnis von Data Warehouses, relationalen Datenbanksystemen und Datenbank-Design
Lehrmethode
Dieser Kurs setzt sich zusammen aus:
Schulung mit Dozent
Praktischen Übungen
Kursdauer / Preis
3 Tage / € 2.685,00 zzgl. Mwst. pro Person
Kursinhalt
Hinweis: Der Kursinhalt kann je nach Standort und/oder Sprache leicht variieren.
1. Tag
Überblick über Big Data
Eingabe und Übertragung von Big Data- Daten
Speicherlösungen für Big Data
Verarbeitung und Analyse von Big Data-Daten
Übungseinheit 2: Verwenden von Amazon Athena zur Abfrage von Protokolldaten aus Amazon S3
2. Tag
Apache Hadoop und Amazon EMR
Übungseinheit 3: Speichern und Abfragen von Daten in Amazon DynamoDB
Verwenden von Amazon EMR
Hadoop-Programmierungs-Frameworks
Übungseinheit 4: Verarbeiten von Serverprotokollen mit Hive auf Amazon EMR
Web-Schnittstellen auf Amazon EMR
Übungseinheit 5: Ausführen von Pig-Skripten in Hue auf Amazon EMR
Apache Spark für Amazon EMR
Übungseinheit 6: Verarbeiten von Taxidaten (New York) mit Spark auf Amazon EMR
3. Tag
Amazon Redshift und Big Data
Visualisieren und Orchestrieren von Big Data
Übungseinheit 7: Verwenden von TIBCO Spotfire zur Visualisierung von Data
Verwalten der Big Data-Kosten
Sichern Ihrer Amazon-Bereitstellungen
Big Data-Designmuster
WICHTIG: Bitte bringen Sie zu unseren Trainings Ihr Notebook (Windows, Linux oder Mac) mit. Wenn dies nicht möglich ist, nehmen Sie bitte mit uns vorher Kontakt auf.
Kursunterlagen sind in englischer Sprache, Kurssprache des Trainers ist deutsch.