Studium

Ich habe in Ilmenau Informatik studiert und mein Praktikum in der Firma CSG absolviert.
In den folgenden Abschnitten geht es um diverse Ausarbeitungen im Rahmen meines Studiums. Auf Anfrage kann ich gerne die Dokumente per E-Mail zur Verfügung stellen.

Hauptseminare

Das erste Hauptseminar (8.Semester) beschäftigte sich mit dem Thema Web-Engineering. Nach einer Einführung in die Thematik werden dort einzelne Entwicklungsphasen im Bezug auf das spezielle Anwendungsfeld World Wide Web betrachtet.
Im zweiten Hauptseminar (9.Semester) mit dem Thema Skalierbare verteilte Dateisysteme wurde die Skalierbarkeit von verteilten Dateisystemen näher untersucht. Nach einer Einführung in das Thema werden, anhand eines ausgewählten Systems (OceanStore), auftretende Probleme und deren Lösungen erläutert. Es zeigt sich, dass sich gute Skalierbarkeit nicht ohne Einschränkungen und spezielle Annahmen erreichen lässt.
Das letzte Hauptseminar PostgreSQL Hacking habe ich im 10.Semester abgeschlossen. Dabei ging es um die Implementierung des Skyline-Operators in das Open-Source Datenbankmanagementsystem PostgreSQL.

Studienarbeit

Das Ziel meiner Studienarbeit (10.Semester) im Fachgebiet Datenbanken war die Implementierung und Evaluierung von ranking-basierten Anfrageoperatoren (Top-N und Skyline) in einem Simulator für Peer Data Management Systeme (SmurfPDMS) mit Hilfe der Programmiersprache Java.

Diplomarbeit: Verwaltung von Datenzusammenfassungen in PDMS

Durch die stetig wachsenden Datenmengen und die notwendige Datenintegration stoßen zentralisierte Data-Warehouse-Systeme schnell an ihre Grenzen. Sie skalieren schlecht und bei dem Ausfall einer Komponente fällt oft gleich das gesamte System aus. Einen Ansatz zur Lösung dieser Probleme bieten verteilte Datenbanksysteme, wie zum Beispiel die Peer Data Management Systeme (PDMS), die aus einer Menge autonomer und gleichberechtigter Knoten bestehen. Um nun Anfragen ohne globales Wissen effizient an die richtigen Knoten weiterleiten zu können, werden aktuelle Datenzusammenfassungen von den Nachbarn benötigt. Die verfügbaren Daten in einem PDMS ändern sich jedoch ständig durch das An-/Abmelden von Knoten im Netzwerk und durch neue Informationen auf den vorhandenen Knoten.

Das Ziel dieser Diplomarbeit bestand nun in der Ausarbeitung verschiedener Strategien zur Aktualisierung dieser Datenzusammenfassungen. Dies ist notwendig, da durch eine hohe Dynamik ansonsten keine zuverlässigen Routing-Entscheidungen getroffen werden können. Die Strategie für die Aktualisierung hängt von der Dynamik im Netzwerk, der Art der Datenzusammenfassung und zusätzlichen Anforderungen ab. Mit Hilfe einer Referenzimplementierung in einem bestehenden Simulator erfolgte eine Evaluierung der vorgestellten Strategien.