Die Clusteranalyse ist ein Verfahren zur Bildung homogener Gruppen (Cluster) aus heterogenen Daten. Ähnliche Objekte werden zusammengefasst, unähnliche in verschiedene Cluster eingeordnet.
Clusteranalyse ist eine deskriptive Methode – es gibt keinen externen Kriteriumsvariablen wie bei der Diskriminanzanalyse. Die Clusterstruktur muss interpretiert und validiert werden.
Agglomerativ (bottom-up: Jedes Objekt ist zunächst eigener Cluster, werden zusammengeführt) oder Divisiv (top-down: Alle Objekte in einem Cluster, werden aufgespalten). Dendrogramm visualisiert den Verschmelzungsprozess.
K-Means, K-Medoids. Vorgabe der Clusteranzahl k, iterative Zuordnung zu nächstgelegenen Zentroiden. Schneller als hierarchisch, aber Ergebnis hängt von Startwerten ab.
Ward-Methode zur Vorklassifikation, dann K-Means zur Optimierung. Kombiniert Vorteile beider Ansätze.