Das Seminar ‚Big Data‘ – Datentechnologien gibt einen ausführlichen Überblick über die in Hadoop verfügbaren SQL- und Nicht-SQL-orientierten Datentechnologien. Diese werden detailliert erläutert und in aufeinander abgestimmten Beispielen demonstriert.
Das Seminar kann bei Erfordernis mit dem Seminar Big Data – Einführung in das Thema kombiniert werden.
In diesem Abschnitt wird ein kurzer Überblick zu Hadoop gegeben.
Die Spanne der SQL-orientierten Komponenten für Hadoop ist groß. Sie reicht von Standard-Komponenten wie Hive über mehr oder weniger proprietäre Beiträge wie Impala oder HD Hawq bis hin zu eigenständigen Lösungen auf der Basis des hadoo-Frameworks. Der Teilnehmer lernt in diesem Abschnitt den aktuellen Entwicklungsstand verschiedener Lösungen kennen.
Es werden verschiedene Lösungsansätze demonstriert.
Die bekannteste Nicht-SQL-orientierte Komponente in Hadoop ist HBase. Darüber hinaus existieren Lösungsansätze für die unterschiedlichsten Anforderungen. Der Teilnehmer lernt in diesem Abschnitt den aktuellen Entwicklungsstand verschiedener Lösungen kennen.
Es werden verschiedene Lösungsansätze demonstriert.
Daten dieser Welt vereinigt Euch. Egal, ob relational oder nicht-relational – mit sqoop steht ein geeignetes Werkzeug zur Verfügung, um Daten zu importieren oder zu exportieren. Zudem stehen geeignete Konnektoren (ODBC, JDBC) für den „schnellen“ Datenzugriff zur Verfügung.
Es werden verschiedene Lösungsszenarien demonstriert.
Die Qual der Wahl: In diesem Abschnitt werden die vorhergehenden Ausführungen zusammengefasst und eine Entscheidungshilfe entwickelt, die den Teilnehmer besser in die Lage versetzt, die geeignete Technologie für die Lösung seiner Aufgabenstellung auszuwählen.