[PDF]

Big Data Anwendungen mit Hadoop

Hadoop ist eine freies, Java-basiertes Open-Source-Framework für die verteilte Verarbeitung großer Datenmengen innerhalb eines Netzwerks. Mittlerweile ist Hadoop bei vielen namhaften Firmen im Einsatz, die naturgemäß viele Petabyte an Daten zu verarbeiten haben, wie z.B. Facebook, Yahoo!, Twitter, Apple, IBM oder Amazon.  Auch in Deutschland finden Lösungen auf Hadoop-Basis immer mehr Anhänger. Dieses Training richtet sich an alle, die praktisch wie theoretisch am Thema Big Data interessiert sind.

Zielgruppe:

  • Datenanalysten die ihr bestehendes Data Warehouse um günstig skalierbare Bestandteile ergänzen wollen
  • Software Entwickler, Datenbank Administratoren und Systemverwalter
  • Studenten und Auszubildende der Informatik und angrenzender Fachrichtungen

Vorkenntnisse:

Grundkenntnisse mit der Arbeit auf der Shell sind Voraussetzung. Grundkenntnisse bzgl. Linux- bzw. Unix-Kenntnisse sind von Vorteil, möchte man die praktischen Beispiel der Schulung nachvollziehen. Da Hadoop in weiten Teilen auf Java der Firma Oracle (vormals Sun Microsystems) basiert, ist ein solides Grundwissen in dieser Programmiersprache nützlich, will man tiefer in das Thema einsteigen.


Inhalt:

  • Big Data und NoSQL
  • Was ist Hadoop?
  • Installation von CHD3 im Pseudo-Distributed Mode
  • HDFS verstehen und nutzen
  • MapReduce am Beispiel von Word Count
  • Hive verstehen und anwenden
  • Pig verstehen und anwenden
  • Datenworkfow mit sqoop
  • Entwicklungsumgebungen im Vergleich

Schulungsunterlage:

  • Folien der Kurzpräsentation als PDF
  • VirtualBox VM mit Ubuntu und allen nötigen Tools, lauffähig unter Linux, Windows, Mac
  • Quellcode der Beispiele über GitHub
Datum:

06.–07.12.2012

Dozent:
Ramon Wartala

Ramon Wartala ist Diplom-Informatiker, er lebt in Hamburg und arbeitet als Director Technology für die Online-Marketing-Agentur Performance Media Deutschland GmbH.  Darüber hinaus verfasst er Artikel für verschiedene nationale und internationale Computermagazine und hält Vorträge zu Themen der Softwareentwicklung.

Neben den klassischen Datenbank-Anwendungen beschäftigen ihn vor allem auch solche, die mithilfe des Hadoop-Frameworks realisiert werden. Im Januar 2012 erscheint sein Buch Hadoop beim Open Source Press Verlag.

Preis:

900.00 EUR netto (1071.00 EUR inkl. MwSt.)
(beachten Sie unsere Sonderpreise für Studierende)


Jetzt anmelden für diese Schulung (oder Anmeldung per Fax-Formular.pdf)


Andere Termine für diese Veranstaltung:
Datum Dozent
29.–30.10.2012 Ramon Wartala

Zur Übersicht

Unsere Schulungen

Anmeldung

Wählen Sie Ihren Wunschtermin aus und folgen Sie den Schritten der Online-Buchung (bei TechTalks genügt eine formlose Anmeldung). Sie können auch gerne dieses FAX-Formular ausfüllen und uns zusenden. In jedem Fall erhalten Sie von uns per Post eine Anmeldebestätigung.

Anreise

Unsere Kursräume bei der CBT liegen in unmittelbarer Nähe der U-Bahn-Haltestelle "Arabellapark". Mehr Informationen auf Ort & Anreise. Schulungen beginnen am ersten Tag um 10:00 Uhr (eintägige um 9:00 Uhr), an Folgetagen um 9:00 Uhr.

Mittagessen

Zu Mittag sind Sie in einem der umliegenden Restaurants unser Gast.