Sprungmarken

Servicenavigation

Hauptnavigation

Sie sind hier:

Hauptinhalt

Proseminar "Database-Supported XML"

Beschreibung

XML, die “Extensible Markup Language”, wird vielfach nur als “Verbesserung von HTML” oder “Markup-Sprache mit spitzen Klammern” abgetan. Dabei steckt das Akronym voll von interessanten Technologien und Konzepten. Insbesondere stellt XML ein sehr mächtiges Datenmodell (basierend auf geordneten Bäumen) zur Verfügung, dessen Flexibilität sehr viele Anwendungsfelder geradezu revolutioniert hat.

Im Rahmen dieses Proseminars schauen wir uns an, wie Datenbanktechnologie eingesetzt werden kann, um XML besonders effizient und skalierbar zu verarbeiten. Moderne Systeme können problemlos viele Gigabytes an XML-Daten in Bruchteilen von Sekunden durchforsten — allerdings nur, wenn diese Daten entsprechend gespeichert und indiziert wurden und wenn das System geeignete Zugriffs- und Optimierungsmechanismen kennt, um die Speicherstrukturen auch auszunutzen. Viele solcher Techniken werden wir uns im Proseminar anschauen.

Wir werden uns im Proseminar vor allem Techniken anschauen, die auch jenseits von XML (z.B. auch für andere semi-strukturierte Datenmodelle) einsetzbar sind. Gleichzeitig wird das Proseminar praktisch und systemorientiert ausgerichtet sein. Viele der besprochenen Techniken werden in realen, teilweise auch kommerziellen, Systemen eingesetzt.

Zum Einstieg in das Proseminar werden die ersten ein oder zwei Sitzungen im Vorlesungsstil gehalten, wobei die Grundlagen von XML vermittelt werden. Danach werden im wöchentlichen Rhythmus die Studierenden Vorträge zu einzelnen Themen halten.

Ziel des Proseminars ist das Erlernen von Präsentationstechniken sowie die (kritische) Auseinandersetzung mit wissenschaftlichen Arbeiten. Daher schließt sich an jeden Vortrag eine Diskussion an, sowohl inhaltlich als auch bezogen auf den konkreten Vortrag. Bis zum Semesterende gibt jede(r) Studierende eine in LaTeX-verfasste Ausarbeitung ab, womit das Verfassen eigener Forschungsbeiträge geübt werden soll.

Für jedes der ausgegebenen Themen werden zwei bis vier Forschungsartikel angegeben, die als Einstieg in das jeweilige Thema dienen sollen. Dieser Einstieg kann gerne auch durch weitere Artikel ergänzt werden, die die Studierenden während ihrer Einarbeitung entdecken.

Hinweise

Präsentationskurs

Zu diesem Proseminar gibt es keinen integrierten Präsentationskurs. Sie müssen daher an einem Präsentationskurs aus dem Angebot der Fakultät teilnehmen.

Hinweisdokument

t.b.d.

Moodle

t.b.d.

Themenliste:

XML Storage

  1. Relational tree encodings, Dewey-based
    • Tatarinov et al. Storing and Querying Ordered XML Using a Relational Database System, SIGMOD 2002
    • O'Neil et al. ORDPATHs: Insert-Friendly XML Node Labels, SIGMOD 2004
  2. Relational tree encodings, pre/post-based
    • Grust. Accelerating XPath Location Steps, SIGMOD 2002
    • Grust et al. Accelerating XPath Evaluation in Any RDBMS, TODS 29(2), 2004
  3. Native XML-Speicherung
    • Fiebig et al. Natix – ein natives XML-DBMS, Datenbank-Spektrum, 2001
    • Fiebig et al. Natix: A Technology Overview, Web, Web-Services, and Database Systems 2002
    • Fiebig et al. Anatomy of a Native XML Base Management System, VLDBJ 11(4), 2002
  4. Native XML-Indizierung
    • Cooper et al. A Fast Index for Semistructured Data, VLDB 2001.
  5. Semantische XML-Speicherung
    • Shanmugasundaram et al. Relational Databases for Query XML Documents: Limitations and Opportunitites
  6. XML-Kompression 1
    • Liefke, Suciu. XMill: An Efficient Compressor for XML Data, SIGMOD 2000.
  7. XML-Kompression 2
    • Lohrey et al. XML Tree Structure Compression Using RePair, Information Systems vol. 38(8): 1150-1167, 2013.

XPath Querying

  1. Holistic Twig Joins
    • Bruno et al. Holistic Twig Joins: Optimal XML Pattern Matching, SIGMOD 2002
  2. Twig Joins mit Indexunterstuetzung
    • Jiang et al. Holistic Twig Joins on Indexed XML Documents, VLDB 2003.
  3. Staircase Join
    • Grust et al. Staircase Join: Teach a Relational DBMS to Watch its (Axis) Steps, VLDB 2003
    • Grust et al. Tree Awareness for Relational DBMS Kernels: Staircase Join, LNCS vol. 2818, pages 231-245, 2003.
  4. Indexunterstuetzung zur relationalen XPath-Auswertung
    • Grust et al. Why Off-The-Shelf RDBMSs are Better at XPath than You Might Expect, SIGMOD 2007.

XML Filtering/Streaming

  1. XFilter / YFilter
    • Altınel et al. Efficient Filtering of XML Documents for Selective Dissemination of Information, VLDB 2000
    • Diao et al. Path Sharing and Predicate Evaluation for High-Performance XML Filtering. TODS 28(4), 2003
  2. Forward-Only XPath Processing
    • Olteanu et al. XPath: Looking Forward, LNCS vol. 2490, pages 109-127, 2002
  3. XML Projection / Buffer Minimization
    • Marian et al. Projecting XML Documents, VLDB 2003
    • Schmidt et al. Combined Static and Dynamic Analysis for Effective Buffer Minimization in Streaming XQuery Evaluation, ICDE 2007
  4. XML-Filterung mittels String Matching
    • Koch et al. XML Prefiltering as a String Matching Problem, ICDE 2008.

Database Support for XQuery

  1. XQuery on Relational Back-Ends
    • Grust et al. XQuery on SQL Hosts, VLDB 2004
    • Boncz et al. Pathfinder: XQuery–The Relational Way, VLDB 2005
    • Grust et al. Relational Algebra: Mother Tongue–XQuery: Fluent, TDM 2004
  2. Natix: A Native XML Database System
    • Fiebig et al. Anatomy of a Native XML Base Management System, VLDBJ 11(4), 2002
    • Brantner et al. Full-Fledged Algebraic XPath Processing in Natix, ICDE 2005

More XQuery

  1. XML Schema and Query
    • Teubner. Scalable XQuery Type Matching, EDBT 2008.
  2. Implementing Type Matching for XQuer
    • Teubner. Scalable XQuery Type Matching, EDBT 2008.
  3. The XQuery Update Facility
    • Dokumente auf der W3C-Webseite
  4. Sortierung und Reihenfolge in XQuery
    • Grust et al. eXrQuy: Order Indifference in XQuery, ICDE 2007.
  5. XQuery in Commercial Database Products
    • Beyer et al. System RX: One Part Relational, One Part XML, SIGMOD 2005
    • Beyer et al. DB2 Goes Hybrid: Integrating Native XML and XQuery with Relational Data and SQL, IBM Systems Journal, 45(2), 2006
    • O'Neil et al. ORDPATHs: Insert-Friendly XML Node Labels, SIGMOD 2004
    • Pal et al. XQuery Implementation in a Relational Database System, VLDB 2005
  6. XQuery and Web Services – RESTful XQuery / RESTXQ
    • Adam Retter. RESTful XQuery. XML Prague 2012.

Termine

  • Dienstags, 16:15-18:45 Uhr, OH14, Raum 304
  • Erste Sitzung: t.b.d.



Nebeninhalt

Kontakt

Prof. Dr. Jens Teubner
Tel.: 0231 755-6481