Sprungmarken

Servicenavigation

Hauptnavigation

Sie sind hier:

Hauptinhalt

Vorlesung "Datenbanken in der Praxis: Data Warehousing"

Organisatorisches

Dozent

  • Prof. Dr. Jens Teubner

Übungsgruppen

  • Cornelia Tadros

Vorlesungstermine

  • Montags, 16-18 Uhr, OH14 / E23

Übungstermine

  • Dienstags, 14-16 Uhr, OH14/ E02
  • Dienstags, 16-18 Uhr, OH14/ E02

Im wöchentlich wechselnden Rhythmus werden die Übungsgruppen dabei als A/B-Gruppen durchgeführt, wobei die A Gruppen am 27.10 und die B Gruppen am 3.11 beginnen und dann alle zwei Wochen stattfinden. 

In den Übungen können Sie ein Übungsprojekt für das Modul INF-BSc-AF-DLI-006: Datenbanken in der Praxis DLI durchführen. Informationen dazu gibt es in der ersten Übungsstunde.

Neuigkeiten

30.05.2016

Die Ergebnisse der Klausur vom 05.04.2016 stehen seit einigen Tagen im BOSS-System. Die Klausureinsicht findet statt am Mittwoch, 15.06.2016 von 16:00 bis 17:00 Uhr im Raum OH14/304. Innerhalb dieses Zeitraums können Sie kommen, um Ihre Klausur einzusehen. Bitte bringen Sie einen Lichtbildausweis mit sowie ein klein wenig Geduld (wenn viele Kommilitonen gleichzeitig kommen, können u.U. Wartezeiten entstehen). Sollten Sie in diesem Zeitraum aus wichtigem Grund verhindert sein, so kontaktieren Sie uns bitte vorher.

Hinweis: Gemäß den Richtlinien der Universität dürfen Sie Ihre Klausur ausschließlich persönlich einsehen. Eine Vertretung durch eine andere Person, auch mit Vollmacht, ist nicht möglich.

17.03.2016

Die Klausur vom 22. Februar 2016 ist fertig korrigiert. Ihr Ergebnis können Sie über BOSS einsehen. Die Klausureinsicht findet am Montag, 21.03 von 14:00-15:00 im Raum 304 OH 14 statt. Zur Einsicht Ihrer Klausur müssen Sie sich mit einem Lichtbildausweis ausweisen können. Sollten Sie aus wichtigem Grund zur Klausureinsicht nicht erscheinen können aber dennoch gerne Ihre Klausur sehen wollen, so melden Sie sich bitte vor dem Klausureinsichtstermin per Email.

  •  Wichtige Hinweise zur zweiten Klausur am Di 05.04.2016:

Über das BOSS System sollten Sie sich bereits zur Klausur anmelden können (falls nicht, melden Sie sich bitte). Studierende aus anderen Fakultäten melden sich ggf. dort auf dem üblichen Weg an.

Die Klausur findet statt im Raum M/E29 von 12:00-13:00 Uhr statt. Bitte finden Sie sich rechtzeitig, spätestens um 11:45 Uhr vor dem Hörsaal ein. Bitte bringen Sie einen dokumentechten Stift (schwarz oder blau, bitte nicht rot) mit sowie einen Lichtbildausweis. Zugelassenes Hilfsmittel ist ein Blatt DIN A4, handbeschrieben (beidseitig). Bitte bringen Sie sonst nichts mit. Sie benötigen insbesondere kein eigenes Papier.

Bitte denken Sie daran, Ihr Mobiltelefon abzustellen.

Die Ergebnisse der Vorlesungsevaluation sind da.

Wichtige Informationen

Diese Veranstaltung können Sie voraussichtlich anrechnen lassen:

  • als Wahlvorlesung in den Bachelor-Studiengängen,
  • als Ersatz für die Veranstaltung Betriebliche Informationssysteme (üblicherweise gehalten von Herrn Jannach), die diesen Winter nicht angeboten wird, für das Modul INF-BSc-AF-DLI-006: Datenbanken in der Praxis DLI oder
  • als Wahlpflichtveranstaltung zu Datenmanagement im BSc-Studiengang Datenanalyse und Datenmanagement (Modul BD XV).

 

Beschreibung

In mittleren und großen Unternehmen werden Abläufe durch ein Datenbanksystem unterstützt, so wie bei Bestellungen, Aufträgen, Lieferungen, aber auch in der Personalverwaltung und Buchhaltung. Die erfassten Daten sind für unternehmerische Entscheidungen von besonderem Wert, können durch ihre Analyse zum Beispiel die umsatzstärksten Kunden oder Produkte ermittelt werden. Doch das Datenbanksystem ist zunächst daraufhin optimiert, Transaktionen in den Geschäftsabläufen zu unterstützen, nicht aber auf die Datenanalyse.

 

Ein Datawarehouse ist genau auf die Anforderungen der Analyse von Geschäftsdaten ausgelegt. In diesem Kurs behandeln wir die wesentlichen Phasen zur Einrichtung eines Datawarehouses nach dem Kimball Lifecycle, einer anerkannten Methode in der Praxis. Wir beginnen mit der Planung eines Datawarehouses, entwerfen ein sogenanntes Star Schema, oder im allgemeinen ein mehrdimensionales Modell, und lernen den ETL Prozess zum Laden von Daten in das Datawarehouse kennen. Anschließend beschäftigen wir uns mit der effizienten Implementierung der Analysen durch materialisierte Sichten, Indizes, Hashing, Datenkompression und Ausführungsstrategien.

 

Die Methoden aus der Vorlesung werden wir in den Übungen praxisnah anwenden, indem  wir sie für das fiktive Unternehmen Adventure Works Cycles mit den Microsoft Produkten zur Business Intelligence, also der Analyse von Geschäftsdaten, ausprobieren und umsetzen. Diese Produkte können während des gesamten Kimball Lifecycles eingesetzt werden.

 

Materialien

Vorlesungsfolien

Kap. Inhalt PDF Letzte Änderung
1 Introduction PDF 19.10.2015
2 Overview PDF 19.10.2015
3 Planning and Starting a DW Project PDF 26.10.2015
4 Modelling Your Data PDF 16.11.2015
5 Implementing a Data Warehouse Engine PDF 12.12.2015
6 ETL Process PDF 04.01.2016
7 MapReduce et al. PDF 11.01.2016

Übungsaufgaben

Nr. Ausgabe Inhalt Sonstiges
1 13.10.2015 OLAP vs. OLTP Hinweise zur Installation der Beispieldatenbanken
2 29.10.2015 Star Schema  
3 12.11.2015 ETL  
4 3.12.2015 Strategien zur Auswertung von Star Queries  
5 4.1.2016 Materialisierte Sichten und Bloom Filter
6 6.1.2016 WAH komprimierte Bitvektoren und ETL
7 12.1.2016 MapReduce

Übungsprojekte

Nr. Ausgabe Inhalt Sonstiges
1 13.10.2015 Verkaufszahlen Bericht Tabelle Date (SQL),Tabelle Date (Daten)
2   9.11.2015 Updates von Dimensionen  
3-1   23.11.2015 Cube Drill Down  
3-2   23.11.2015 Cube Drill Down  
4-1   23.11.2015 Cube Drill Across  
4-2   23.11.2015 Cube Drill Across  
4-3   23.11.2015 Cube Drill Across  
4-4   23.11.2015 Cube Drill Across  
5 18.12.2015 Materialisierte Sichten
6 18.12.2015 WAH komprimierte Bitmap Indizes
7 18.12.2015 ETL: Deduplikation Restaurant Liste
8 12.1.2016 Slice Operation mit MapReduce


Nebeninhalt

Kontakt

Prof. Dr. Jens Teubner
Tel.: 0231 755-6481
Dr. Cornelia Tadros