Sprungmarken

Servicenavigation

Hauptnavigation

Sie sind hier:

Hauptinhalt

Proseminar Database-Supported XML

Beschreibung

XML, die “Extensible Markup Language”, wird vielfach nur als “Verbesserung von HTML” oder “Markup-Sprache mit spitzen Klammern” abgetan. Dabei steckt das Akronym voll von interessanten Technologien und Konzepten. Insbesondere stellt XML ein sehr mächtiges Datenmodell (basierend auf geordneten Bäumen) zur Verfügung, dessen Flexibilität sehr viele Anwendungsfelder geradezu revolutioniert hat.

Im Rahmen dieses Proseminars schauen wir uns an, wie Datenbanktechnologie eingesetzt werden kann, um XML besonders effizient und skalierbar zu verarbeiten. Moderne Systeme können problemlos viele Gigabytes an XML-Daten in Bruchteilen von Sekunden durchforsten — allerdings nur, wenn diese Daten entsprechend gespeichert und indiziert wurden und wenn das System geeignete Zugriffs- und Optimierungsmechanismen kennt, um die Speicherstrukturen auch auszunutzen. Viele solcher Techniken werden wir uns im Proseminar anschauen.

Wir werden uns im Proseminar vor allem Techniken anschauen, die auch jenseits von XML (z.B. auch für andere semi-strukturierte Datenmodelle) einsetzbar sind. Gleichzeitig wird das Proseminar praktisch und systemorientiert ausgerichtet sein. Viele der besprochenen Techniken werden in realen, teilweise auch kommerziellen, Systemen eingesetzt.

Zum Einstieg in das Proseminar werden die ersten ein oder zwei Sitzungen im Vorlesungsstil gehalten, wobei die Grundlagen von XML vermittelt werden. Danach werden im wöchentlichen Rhythmus die Studierenden Vorträge zu einzelnen Themen halten.

Ziel des Proseminars ist das Erlernen von Präsentationstechniken sowie die (kritische) Auseinandersetzung mit wissenschaftlichen Arbeiten. Daher schließt sich an jeden Vortrag eine Diskussion an, sowohl inhaltlich als auch bezogen auf den konkreten Vortrag. Bis zum Semesterende gibt jede(r) Studierende eine in LaTeX-verfasste Ausarbeitung ab, womit das Verfassen eigener Forschungsbeiträge geübt werden soll.

Für jedes der ausgegebenen Themen werden zwei bis vier Forschungsartikel angegeben, die als Einstieg in das jeweilige Thema dienen sollen. Dieser Einstieg kann gerne auch durch weitere Artikel ergänzt werden, die die Studierenden während ihrer Einarbeitung entdecken.

Themenliste:

XML Storage

  1. Relational tree encodings, Dewey-based (05.11.2013, Özcan Yalcin)
    • Tatarinov et al. Storing and Querying Ordered XML Using a Relational Database System, SIGMOD 2002
    • O'Neil et al. ORDPATHs: Insert-Friendly XML Node Labels, SIGMOD 2004
  2. Relational tree encodings, pre/post-based (05.11.2013, Sebastian Schroer)
    • Grust. Accelerating XPath Location Steps, SIGMOD 2002
    • Grust et al. Accelerating XPath Evaluation in Any RDBMS, TODS 29(2), 2004
  3. Native XML-Speicherung (12.11.2013, Jaroslav Kniss)
    • Fiebig et al. Natix – ein natives XML-DBMS, Datenbank-Spektrum, 2001
    • Fiebig et al. Natix: A Technology Overview, Web, Web-Services, and Database Systems 2002
    • Fiebig et al. Anatomy of a Native XML Base Management System, VLDBJ 11(4), 2002
  4. Native XML-Indizierung (12.11.2013, Andreas Lang)
    • Cooper et al. A Fast Index for Semistructured Data, VLDB 2001.

XPath Querying

  1. Holistic Twig Joins (19.11.2013, Daniel Hilse)
    • Bruno et al. Holistic Twig Joins: Optimal XML Pattern Matching, SIGMOD 2002
  2. Twig Joins mit Indexunterstuetzung (19.11.2013, Denis Konak)
    • Jiang et al. Holistic Twig Joins on Indexed XML Documents, VLDB 2003.
  3. Staircase Join (26.11.2013, Mohamad Alfarhan)
    • Grust et al. Staircase Join: Teach a Relational DBMS to Watch its (Axis) Steps, VLDB 2003
    • Grust et al. Tree Awareness for Relational DBMS Kernels: Staircase Join, LNCS vol. 2818, pages 231-245, 2003.
  4. Indexunterstuetzung zur relationalen XPath-Auswertung (26.11.2013, Michael Görtz)
    • Grust et al. Why Off-The-Shelf RDBMSs are Better at XPath than You Might Expect, SIGMOD 2007.

XML Filtering/Streaming

  1. XFilter / YFilter (21.01.2013, Markus Christ)
    • Altınel et al. Efficient Filtering of XML Documents for Selective Dissemination of Information, VLDB 2000
    • Diao et al. Path Sharing and Predicate Evaluation for High-Performance XML Filtering. TODS 28(4), 2003
  2. Forward-Only XPath Processing (03.12.2013, Marvin Löbel)
    • Olteanu et al. XPath: Looking Forward, LNCS vol. 2490, pages 109-127, 2002
  3. XML Projection / Buffer Minimization (10.12.2013, Christian Schwebke)
    • Marian et al. Projecting XML Documents, VLDB 2003
    • Schmidt et al. Combined Static and Dynamic Analysis for Effective Buffer Minimization in Streaming XQuery Evaluation, ICDE 2007
  4. XML-Filterung mittels String Matching (10.12.2013, Nicolai Henczi)
    • Koch et al. XML Prefiltering as a String Matching Problem, ICDE 2008.

Database Support for XQuery

  1. XQuery on Relational Back-Ends (17.12.2013, Julian Schilling)
    • Grust et al. XQuery on SQL Hosts, VLDB 2004
    • Boncz et al. Pathfinder: XQuery–The Relational Way, VLDB 2005
    • Grust et al. Relational Algebra: Mother Tongue–XQuery: Fluent, TDM 2004
  2. Natix: A Native XML Database System (17.12.2013, Tim Lutz)
    • Fiebig et al. Anatomy of a Native XML Base Management System, VLDBJ 11(4), 2002
    • Brantner et al. Full-Fledged Algebraic XPath Processing in Natix, ICDE 2005

More XQuery

  1. XML Schema and XQuery (07.01.2014, Ngoc Duc Nguyen)
    • Teubner. Scalable XQuery Type Matching, EDBT 2008.
  2. Implementing Type Matching for XQuery (07.01.2014, Tim Grünewald)
    • Teubner. Scalable XQuery Type Matching, EDBT 2008.
  3. The XQuery Update Facility (21.01.2014, Thanh Long Quan)
    • Dokumente auf der W3C-Webseite
  4. Sortierung und Reihenfolge in XQuery (14.01.2014, Torsten Böttinger)
    • Grust et al. eXrQuy: Order Indifference in XQuery, ICDE 2007.

Termine

  • Dienstags, 16:15-17:45 Uhr, OH14, Raum E02
  • Erste Sitzung am 15. Oktober 2013

Material

  • Folien aus der Vorbesprechung vom 17. Juli 2013.


Nebeninhalt

Kontakt

Prof. Dr. Jens Teubner
Tel.: 0231 755-6481