Sprungmarken

Servicenavigation

Hauptnavigation

Sie sind hier:

Hauptinhalt

Projektgruppe 627: Analyse komplex strukturierter Daten

PG627: Analyse komplex strukturierter Daten

Teilnehmer

Alexander Becker, Robert Gehde, Nils Killich, Felix Krause, Lena Krieg, Thomas Krieg, Berat Oezdemir, Sebastian Peter, Andreas Roth, David Schnura, Martin Senz

Betreuer

Jens Teubner, Erich Schubert, Erik Thordsen, Maximilian Berens

Beschreibung

Viele der Erfolge der Künstlichen Intelligenz (KI) in den letzten Jahren sind möglich geworden durch große, aber gleichzeitig vergleichsweise uniforme Datenmengen; beispielsweise große Bildersammlungen oder Audioaufzeichnungen. Sie ermöglichten wesentliche Fortschritte sowohl bei der Bilderkennung als auch der Spracherkennung. Viele dieser „neuen“ Techniken — wie Convolutional Neural Networks — profitieren aber davon, dass sowohl Bild- als auch Audiodaten über eine gleichmäßige Rasterung verfügen, die mit Hilfe von GPUs auch hoch parallel verarbeitet werden können.

Versucht man nun aber, die Erfolge von KI in anderen Domänen zu wiederholen, stößt man schnell auf das Problem, dass dort selten Daten in einem derartig schön gerasterten Format vorliegen — die Verkäufe eines Supermarkts beispielsweise lassen sich schwer in eine vergleichbare Form bringen. Aber auch bei einfacheren Techniken — angefangen bei klassischen Clusteranalysen wie k-means — hat man in der Praxis oft das Problem, dass der Algorithmus Daten in einem bestimmten, idealisierten Format erwartet wird (meist in Form eines Vektorraums), sich die Daten aber nicht sinnvoll derart codieren lassen oder die statistische Validität des Ergebnisses durch die notwendige Codierung in Frage gestellt werden kann.

Zielstellung der Projektgruppe

Die Aufgabe der Projektgruppe ist die Entwicklung und Umsetzung von Analysemethoden für komplex strukturierte Daten, die Merkmale unterschiedlicher Charakteristika enthalten und gleichzeitig beispielsweise Geo-, Zeit-, Wetter-, Routen-, Zeitreihen- und Inventarinformationen enthalten. Typische Verfahren aus dem Bereich des Maschinellen Lernens erwarten, dass die Daten in einem einheitlichen Vektorformat vorliegen, was jedoch bei realen Daten meist nicht einfach zu erfüllen ist. Dann ist es notwendig hier Transformationen, Adapter und Schnittstellen zu entwickeln, um komplexe Analysen auf diesen Daten durchführen zu können, die mehrere Datenquellen gleichzeitig betreffen.

Die Projektgruppe soll gezielt Probleme bei der Analyse von solchen komplexen Daten identifizieren, verschiedene abstrakte Lösungsansätze dafür entwickeln, umsetzen und evaluieren. Dazu sollen große, von Industriepartnern zur Verfügung gestellte Realdatensätze mit weiteren Datenquellen angereichert und Prognosemodelle entwickelt werden. Damit könnte z. B. eine bessere Planung von realen Aufgaben beispielsweise in der Logistik ermöglicht werden. Der Fokus soll dabei aber auf der Entwicklung von abstrakten Lösungansätzen liegen, die sich künftig auf neue Aufgabenstellungen übertragen lassen; beispielsweise in welchen Fällen welche Codierungs- und Adaptertechniken vielversprechend sind und in welchen Szenarien mit Problemen zu rechnen ist. Die konkreten Anwendungen dienen dabei primär als Hilfsmittel, um reale Probleme zu identifizieren und Lösungen ausprobieren zu können. Insbesondere sind auch negative Ergebnisse hier von Interesse, etwa wenn erklärt werden kann, warum ein vielversprechender Ansatz doch nicht funktioniert hat, sodass das bei künftigen Problemen besser eingeschätzt werden kann.

Veranstaltungs-Evaluation

Die Ergebnisse der Veranstaltungs-Evaluation durch die Fakultät finden sich hier.



Nebeninhalt

Kontakt

Prof. Dr. Jens Teubner
Tel.: 0231 755-6481
Maximilian Berens
Tel.: 0231 755-7721