Jump label

Service navigation

Main navigation

You are here:

Main content

Proseminar "Database-Supported XML"

Beschreibung

XML, die “Extensible Markup Language”, wird vielfach nur als “Verbesserung von HTML” oder “Markup-Sprache mit spitzen Klammern” abgetan. Dabei steckt das Akronym voll von interessanten Technologien und Konzepten. Insbesondere stellt XML ein sehr mächtiges Datenmodell (basierend auf geordneten Bäumen) zur Verfügung, dessen Flexibilität sehr viele Anwendungsfelder geradezu revolutioniert hat.

Im Rahmen dieses Proseminars schauen wir uns an, wie Datenbanktechnologie eingesetzt werden kann, um XML besonders effizient und skalierbar zu verarbeiten. Moderne Systeme können problemlos viele Gigabytes an XML-Daten in Bruchteilen von Sekunden durchforsten — allerdings nur, wenn diese Daten entsprechend gespeichert und indiziert wurden und wenn das System geeignete Zugriffs- und Optimierungsmechanismen kennt, um die Speicherstrukturen auch auszunutzen. Viele solcher Techniken werden wir uns im Proseminar anschauen.

Wir werden uns im Proseminar vor allem Techniken anschauen, die auch jenseits von XML (z.B. auch für andere semi-strukturierte Datenmodelle) einsetzbar sind. Gleichzeitig wird das Proseminar praktisch und systemorientiert ausgerichtet sein. Viele der besprochenen Techniken werden in realen, teilweise auch kommerziellen, Systemen eingesetzt.

Zum Einstieg in das Proseminar werden die ersten ein oder zwei Sitzungen im Vorlesungsstil gehalten, wobei die Grundlagen von XML vermittelt werden. Danach werden im wöchentlichen Rhythmus die Studierenden Vorträge zu einzelnen Themen halten.

Ziel des Proseminars ist das Erlernen von Präsentationstechniken sowie die (kritische) Auseinandersetzung mit wissenschaftlichen Arbeiten. Daher schließt sich an jeden Vortrag eine Diskussion an, sowohl inhaltlich als auch bezogen auf den konkreten Vortrag. Bis zum Semesterende gibt jede(r) Studierende eine in LaTeX-verfasste Ausarbeitung ab, womit das Verfassen eigener Forschungsbeiträge geübt werden soll.

Für jedes der ausgegebenen Themen werden zwei bis vier Forschungsartikel angegeben, die als Einstieg in das jeweilige Thema dienen sollen. Dieser Einstieg kann gerne auch durch weitere Artikel ergänzt werden, die die Studierenden während ihrer Einarbeitung entdecken.

Hinweise

Ergebnisse der Veranstaltungs-Evaluation

Die Ergebnisse der Veranstaltungs-Evaluation finden Sie hier zum Download.

Präsentationskurs

Zu diesem Proseminar gibt es keinen integrierten Präsentationskurs. Sie müssen daher an einem Präsentationskurs aus dem Angebot der Fakultät teilnehmen.

Hinweisdokument

In einem Hinweisdokument finden Sie relevante Informationen zum Ablauf des Proseminars.

Moodle

Zum Proseminar gibt es einen Arbeitsraum in der Moodle-Plattform der TU Dortmund. Teilnehmer sollten sich dort mit Ihrem UniMail-Account anmelden können.

Themenliste:

XML Storage

  1. Relational tree encodings, Dewey-based (19.04.2016, Roland Ihle)
    • Tatarinov et al. Storing and Querying Ordered XML Using a Relational Database System, SIGMOD 2002
    • O'Neil et al. ORDPATHs: Insert-Friendly XML Node Labels, SIGMOD 2004
  2. Relational tree encodings, pre/post-based (19.04.2016, Thomas Röhrig)
    • Grust. Accelerating XPath Location Steps, SIGMOD 2002
    • Grust et al. Accelerating XPath Evaluation in Any RDBMS, TODS 29(2), 2004
  3. Native XML-Speicherung (26.04.2016, Lukas Albrecht)
    • Fiebig et al. Natix – ein natives XML-DBMS, Datenbank-Spektrum, 2001
    • Fiebig et al. Natix: A Technology Overview, Web, Web-Services, and Database Systems 2002
    • Fiebig et al. Anatomy of a Native XML Base Management System, VLDBJ 11(4), 2002
  4. Native XML-Indizierung (26.04.2016, Danny Berkemeyer)
    • Cooper et al. A Fast Index for Semistructured Data, VLDB 2001.
  5. Semantische XML-Speicherung (21.06.2016, Inessa Azizova)
    • Shanmugasundaram et al. Relational Databases for Query XML Documents: Limitations and Opportunitites
  6. XML-Kompression 1 (03.05.2016, Daniel Nemitz)
    • Liefke, Suciu. XMill: An Efficient Compressor for XML Data, SIGMOD 2000.
  7. XML-Kompression 2 (03.05.2016, Artem Solovyev)
    • Lohrey et al. XML Tree Structure Compression Using RePair, Information Systems vol. 38(8): 1150-1167, 2013.

XPath Querying

  1. Holistic Twig Joins (10.05.2016, Robin Czarnetzki)
    • Bruno et al. Holistic Twig Joins: Optimal XML Pattern Matching, SIGMOD 2002
  2. Twig Joins mit Indexunterstuetzung (10.05.2016, Kevin Sabanovic)
    • Jiang et al. Holistic Twig Joins on Indexed XML Documents, VLDB 2003.
  3. Staircase Join (17.05.2016, Sascha Grüter)
    • Grust et al. Staircase Join: Teach a Relational DBMS to Watch its (Axis) Steps, VLDB 2003
    • Grust et al. Tree Awareness for Relational DBMS Kernels: Staircase Join, LNCS vol. 2818, pages 231-245, 2003.
  4. Indexunterstuetzung zur relationalen XPath-Auswertung (17.05.2016, Simon Szustkowski)
    • Grust et al. Why Off-The-Shelf RDBMSs are Better at XPath than You Might Expect, SIGMOD 2007.

XML Filtering/Streaming

  1. XFilter / YFilter (24.05.2016, Marco Krumrey)
    • Altınel et al. Efficient Filtering of XML Documents for Selective Dissemination of Information, VLDB 2000
    • Diao et al. Path Sharing and Predicate Evaluation for High-Performance XML Filtering. TODS 28(4), 2003
  2. Forward-Only XPath Processing (24.05.2016, Florian Schreiber)
    • Olteanu et al. XPath: Looking Forward, LNCS vol. 2490, pages 109-127, 2002
  3. XML Projection / Buffer Minimization (31.05.2016, Yannick Bungers)
    • Marian et al. Projecting XML Documents, VLDB 2003
    • Schmidt et al. Combined Static and Dynamic Analysis for Effective Buffer Minimization in Streaming XQuery Evaluation, ICDE 2007
  4. XML-Filterung mittels String Matching (31.05.2016, Hermann Foot)
    • Koch et al. XML Prefiltering as a String Matching Problem, ICDE 2008.

Database Support for XQuery

  1. XQuery on Relational Back-Ends (07.06.2016, Jan Hafemeister)
    • Grust et al. XQuery on SQL Hosts, VLDB 2004
    • Boncz et al. Pathfinder: XQuery–The Relational Way, VLDB 2005
    • Grust et al. Relational Algebra: Mother Tongue–XQuery: Fluent, TDM 2004
  2. Natix: A Native XML Database System (07.06.2016, Kurosch Pourgholam)
    • Fiebig et al. Anatomy of a Native XML Base Management System, VLDBJ 11(4), 2002
    • Brantner et al. Full-Fledged Algebraic XPath Processing in Natix, ICDE 2005

More XQuery

  1. XML Schema and Query (07.06.2016, Marcel Dominik Labrenz)
    • Teubner. Scalable XQuery Type Matching, EDBT 2008.
  2. Implementing Type Matching for XQuery (14.06.2016, Fritz Rath)
    • Teubner. Scalable XQuery Type Matching, EDBT 2008.
  3. The XQuery Update Facility (14.06.2016, Johannes Bahne)
    • Dokumente auf der W3C-Webseite
  4. Sortierung und Reihenfolge in XQuery (14.06.2016, Sören Schellhoff)
    • Grust et al. eXrQuy: Order Indifference in XQuery, ICDE 2007.
  5. XQuery in Commercial Database Products (28.06.2016, Cihad Yekta)
    • Beyer et al. System RX: One Part Relational, One Part XML, SIGMOD 2005
    • Beyer et al. DB2 Goes Hybrid: Integrating Native XML and XQuery with Relational Data and SQL, IBM Systems Journal, 45(2), 2006
    • O'Neil et al. ORDPATHs: Insert-Friendly XML Node Labels, SIGMOD 2004
    • Pal et al. XQuery Implementation in a Relational Database System, VLDB 2005
  6. XQuery and Web Services – RESTful XQuery / RESTXQ (05.07.2016 28.06.2016, Alexander Kruk)
    • Adam Retter. RESTful XQuery. XML Prague 2012.

Termine

  • Dienstags, 14:15-15:45 Uhr, OH12, Raum 2.063
  • Erste Sitzung am 12. April 2016



Sub content

Contact

Prof. Dr. Jens Teubner
Tel.: 0231 755-6481