Zum Inhalt springen

Big Data für Oracle Entwickler: Zweitagesveranstaltung mit Hands-On

24. September 2014 - 25. September 2014 in Köln

SIG (DEV) Development / Oracle Tools

 

 

 

 


Big Data wird immer wichtiger in der modernen IT-Welt.


Was bedeutet es aber für einen Oracle-DB-Entwickler? Was ist Big Data überhaupt? Wie lauten hier die wichtigsten Konzepte? Wofür steht NoSQL? Hat Oracle eigene Produkte in dem Bereich? Wo gibt es Berührungspunkte mit der klassischen Oracle-Datenbank? Wie kann auf Daten zugegriffen werden, die nicht relational organisiert sind? Wieso ist Performance so wichtig in der Big Data Welt? Und last but not least: Wie finde ich einen guten Einstieg in das Thema?

Die DOAG SIG Development möchte Sie beim Finden von Antworten auf diese Fragen durch eine 2-tägige Veranstaltung unterstützen. Sie werden nicht nur interessante Vorträge dazu hören – in einem Hands-On können Sie Ihre ersten Big Data Schritte selbst machen!

In einem Abendevent bieten sich viele Möglichkeiten, um in einer lockeren und angenehmen Atmosphäre miteinander ins Gespräch zu kommen!

Haben wir Ihr Interesse geweckt? Wollten Sie schon lange in das Thema Big Data eintauchen? Dann melden Sie sich schnellsten an! Wie freuen uns auf zahlreiche Anmeldungen.


Die Teilnahme an dem Hands-On erfolgt mit eigenem Rechner. Technische Voraussetzungen für den Rechner:

  • Laptop mit installierter VirtualBox www.virtualbox.org

  • Größe der gezipten VM-Maschine: 4,5 GB www.doag.org

  • Größe der entpackten VM-Maschine: 20,2 GB

  • VM-Maschine benötigt 3 GB RAM

  • empfohlener RAM des Laptops 4-8 GB

 

Voraussetzungen bzgl. des Know-How für die Teilnehmer an dem Hands-On:

  • Java Grundkenntnisse (java, javac, CLASSPATH, "public static void main()", {}")

  • Grundkenntnisse bzgl. Aufbau relationaler Datenstrukturen (z.B. Tabellen)

  • SQL-Grundkenntnisse

Agenda

Carsten Herbe metafinanz Informationssysteme GmbH

Dieser Kurs ist eine Einführung in die BigData-Verarbeitung mit Hadoop. Die Teilnehmer erhalten einen Überblick über die Systemkomponenten, das Programmierkonzept und die wichtigsten Tools und Frameworks aus dem Hadoop-Ökosystem. Es handelt sich um eine Einsteigerschulung, so dass keine Kenntnisse aus dem Bereich BigData oder Hadoop vorausgesetzt werden. Im Anschluss an das Training sind die Teilnehmer in der Lage, mit Hilfe von Hadoop einfache BigData-Problemstellungen zu bearbeiten. Theoretische Grundlagen und praktische Übungen wechseln sich in der Schulung ab.


Kapitel-1 Einführung und Organisation


Kapitel-2 Hadoop Konzepte&Architektur

1 Apache Hadoop

2 Hadoop Distributed File System (HDFS)

Übung: hdfs-exercise

3 Hadoop MapReduce 1

4 Hadoop MapReduce 2 (YARN)

5 Ausführung eines MapReduce Jobs

6 Überwachung eines MapReduce Jobs

Übung: mr-job-exercise

7 Hadoop Ökosystem

8 Hadoop Versionsübersicht


Kapitel-3 MapReduce Programmierung


1 Das MapReduce Programmiermodell

2 MapReduce by Example

3 Die Hadoop API

4 Entwicklungsumgebung

Übung: mr-programming-exercise


 Kapitel-4 Hadoop&SQL


1 Motivation Hadoop & SQL

2 Hive

3 Tabellen und Daten

4 HiveQL

5 User Defined Functions

6 Partitionierung

7 Indexes&Explain Plans

Übung: mr-hive-exercise


Kapitel-5 Hadoop&RDBMS


1 Hadoop & RDBMS

2 Sqoop

Übung: sqoop-exercise


3 Sqoop2

4 Oracle SQL Connector for HDFS

5 Oracle Loader for Hadoop

6 Fazit

 

Mathias Höreth metafinanz

Big Data führt einige neue Technologieansätze in die Unternehmens-IT ein - Hadoop

und Map Reduce sind zwei Beispiele dafür. Doch was ist, wenn die Daten, mit denen

man arbeiten möchte, nach wie vor im RDBMS Oracle liegen?

Der Vortrag stellt vor, wie Big Data Technologien auch in der Datenbank genutzt werden

können - dabei spielt die neue Oracle-Technologie In-Database-Map/Reduce eine

besondere Rolle.

 

Carsten Czarski Oracle Deutschland

Wie bekommt man Antworten auf Fragen, die man noch gar nicht explizit gestellt hat? Für die Implementierung von Datenanalysen, die über ein Standard Reporting hinausgehen, bietet sich Oracle R Enterprise (ORE) an. ORE ist speziell auf Data Mining und die Analyse großer Datenmengen ausgerichtet.

ORE ist eine von Oracle entwickelte Variante der Open-Source-Programmiersprache R. Diese wurde von Statistikern speziell für die Datenanalyse entwickelt. Inzwischen wird sie weltweit insbesondere in der Forschung, aber auch immer mehr in anderen Bereichen, z. B. der Analyse von Kundendaten, verwendet.

Im Gegensatz zu R nutzt ORE nicht nur eine Client Engine, sondern nutzt durch eine zweite R Engine auf dem Datenbankserver auch die Rechenkraft der Datenbank. Somit entfällt mit ORE der Datenexport, wodurch ORE ungleich performanter als R ist. Außerdem ist eine Parallelisierung der Anfragen möglich, was die Performance weiter steigern kann.

Moment – Datenbank? Braucht man da nicht auch noch SQL? Die ORE Client Engine wandelt in ihrem Transparency Layer Anfragen an die Datenbank in SQL um, so dass die explizite Übergabe von SQL-Befehlen entfällt. Um mit ORE Datenanalysen zu implementieren braucht man kein SQL; Kenntnisse in R reichen aus.

Mit ORE lässt sich sämtlicher nativer R Code verwenden. Auch alle über CRAN downloadbaren R Pakete sind nutzbar. Genau wie R bietet auch ORE eine große Vielfalt an graphischen Darstellungen, die einfach und schnell erstellt werden können.

 

Nadine Schoene Oracle Deutschland

Details zum Termin

Uhrzeit: 10:00 - 17:00 Uhr

Die PremiumCard ist für diese Veranstaltung gültig.

→ die vorherige Veranstaltung der Reihe

→ die nächste Veranstaltung der Reihe

Unterlagen

Peter Welker, Trivadis: BigData vs. konventionelle Technik &#150#SEM#- Entscheidungskriterien

Carsten Czarski, Oracle Deutschland: Big Data Technologien in der Oracle-Datenbank? Aber sicher!

Jan Ott, Trivadis: Big Data - Hadoop und sein Zoo - Einstieg eines Oracle Experten

Nadine Schoene, Oracle Deutschland, Dr. Michael Haupt, Oracle Labs: Mehr als Reporting - Datenanalysen mit Oracle R Enterprise

Michael Faden, Trivadis: Big Data and Fast Data - Lambda Architektur und konkrete Umsetzung

Gunther Pippèrr, GPI Consult: Die Oracle Datenbank in die Welt von Hadoop und NoSQL integrieren

Mathias Höreth, metafinanz: Big Data Hands-On

Carsten Herbe, metafinanz Informationssysteme GmbH: Einführung in Hadoop

Location

Adresse

AMERON HoteL Regent, Melatengürtel 15, 50933 Köln

Preise

Günstig reisen

Mit dem Kooperationsangebot der DOAG und der Deutschen Bahn reisen Sie kostengünstig das ganze Jahr über zu den Veranstaltungen der DOAG.

Mehr Informationen

Premium Card

Die Event-Flatrate für DOAG-Veranstaltungen: die DOAG Premium Card. Ihr Vorteil: einmal bezahlen – das ganze Jahr an vielen DOAG-Veranstaltungen teilnehmen.

Mehr Informationen

Mitglied werden

DOAG-Mitglieder erhalten ab 20 Prozent Nachlass auf die regulären Ticketpreise. Die persönliche Mitgliedschaft kostet nur 120 Euro pro Jahr. Informieren Sie sich!

Mehr Informationen

Teilnahmegebühr: SIG am 25.09.

  • 100,00 Mitglieder
  • 200,00 Nicht-Mitglieder

Ansprechpartner

Christian Schwitalla Apps Associates GmbH Zum Profil