Visual Comparison of Clusterings
master thesis
Status | finished |
Student | Dennis Herzner |
Advisor | Simon Stusak |
Professor | Prof. Dr. Andreas Butz |
Abstract
Clustering ist ein weit verbereitetes und sehr wichtiges Verfahren der Datenanalyse, das dazu dient Datenpunkten nach Ähnlichkeit zu gruppieren. Ein simples Beispiel wäre die Strukturierung des Automobilmarktes in Gruppen sich ähnelnder Fahrzeuge. Dadurch kann ein Hersteller beispielsweise erkennen, welche Modelle der Konkurrenz direkt mit den eigenen Modellen im Wettbewerb stehen. Weitere Anwendungsszenarios wären das Erkennen von Communities in sozialen Netzwerken oder die Gruppierung von digitalen Bildern.
Clustering Ergebnisse können dabei, aufgrund einer Vielzahl unterschiedlicher Clustering-Algorithmen und deren Parameter, stark variieren. Die meisten Methoden zur Evaluierung und zum Vergleich von Clustering-Ergebnissen beschränken sich jedoch bislang auf die Berechnung einer einzelnen Zahl (meistens zwischen 0 und 1). Ziel dieser Arbeit ist es Lösungsansätze zu entwickeln, die einen visuellen Vergleich von Clustering-Ergebnissen ermöglichen. Als Grundlage für die Visualisierungs- und Interaktionskonzepte können dabei z.B. Scatterplots dienen.
Aufgaben
Clustering Ergebnisse können dabei, aufgrund einer Vielzahl unterschiedlicher Clustering-Algorithmen und deren Parameter, stark variieren. Die meisten Methoden zur Evaluierung und zum Vergleich von Clustering-Ergebnissen beschränken sich jedoch bislang auf die Berechnung einer einzelnen Zahl (meistens zwischen 0 und 1). Ziel dieser Arbeit ist es Lösungsansätze zu entwickeln, die einen visuellen Vergleich von Clustering-Ergebnissen ermöglichen. Als Grundlage für die Visualisierungs- und Interaktionskonzepte können dabei z.B. Scatterplots dienen.
Aufgaben
- Recherche verwandter Arbeiten (Information Visualization, Physical Visualizations, Tangible User Interaction)
- Entwicklung von Visualisierungs- und Interaktionskonzepten
- Planung und Implementierung eines Prototypen
- Planung und Durchführung einer Nutzerstudie
- Ausarbeitung und Vortrag