Big Data Anwendungen mit Hadoop
Hadoop ist eine freies, Java-basiertes Open-Source-Framework für die verteilte Verarbeitung großer Datenmengen innerhalb eines Netzwerks. Mittlerweile ist Hadoop bei vielen namhaften Firmen im Einsatz, die naturgemäß viele Petabyte an Daten zu verarbeiten haben, wie z.B. Facebook, Yahoo!, Twitter, Apple, IBM oder Amazon. Auch in Deutschland finden Lösungen auf Hadoop-Basis immer mehr Anhänger. Dieses Training richtet sich an alle, die praktisch wie theoretisch am Thema Big Data interessiert sind.
Zielgruppe:
- Datenanalysten die ihr bestehendes Data Warehouse um günstig skalierbare Bestandteile ergänzen wollen
- Software Entwickler, Datenbank Administratoren und Systemverwalter
- Studenten und Auszubildende der Informatik und angrenzender Fachrichtungen
Vorkenntnisse:
Grundkenntnisse mit der Arbeit auf der Shell sind Voraussetzung. Grundkenntnisse bzgl. Linux- bzw. Unix-Kenntnisse sind von Vorteil, möchte man die praktischen Beispiel der Schulung nachvollziehen. Da Hadoop in weiten Teilen auf Java der Firma Oracle (vormals Sun Microsystems) basiert, ist ein solides Grundwissen in dieser Programmiersprache nützlich, will man tiefer in das Thema einsteigen.
Inhalt:
- Big Data und NoSQL
- Was ist Hadoop?
- Installation von CHD3 im Pseudo-Distributed Mode
- HDFS verstehen und nutzen
- MapReduce am Beispiel von Word Count
- Hive verstehen und anwenden
- Pig verstehen und anwenden
- Datenworkfow mit sqoop
- Entwicklungsumgebungen im Vergleich
Schulungsunterlage:
- Folien der Kurzpräsentation als PDF
- VirtualBox VM mit Ubuntu und allen nötigen Tools, lauffähig unter Linux, Windows, Mac
- Quellcode der Beispiele über GitHub
Preis:
900.00 EUR netto
(1071.00 EUR inkl. MwSt.)
(beachten Sie unsere Sonderpreise für Studierende)
Termine für diese Veranstaltung:
| Datum | Dozent |
|---|---|
| 29.–30.10.2012 | Ramon Wartala |
| 06.–07.12.2012 | Ramon Wartala |
