top of page
Das Bild zeigt einen Werbebanner von Amazon.

Clusteranalyse

Die Clusteranalyse ist ein Verfahren des unüberwachten Lernens, bei dem Datenpunkte ohne vorgegebene Klassen so gruppiert werden, dass Beobachtungen innerhalb eines Clusters möglichst ähnlich sind und sich deutlich von Beobachtungen anderer Cluster unterscheiden. Ziel ist es, verborgene Strukturen oder natürliche Gruppen in einem Datensatz zu erkennen, etwa Kundengruppen mit ähnlichem Verhalten. Verfahren wie das K-Means-Clustering legen dabei eine feste Anzahl von Clustern fest, während andere Ansätze (z. B. hierarchische oder latente Klassenanalysen) Cluster schrittweise aus den Daten herausbilden. (vgl. Andrae 2023, S. 20 f.)


Beispiel: Ein Unternehmen analysiert die Kaufdaten seiner Kunden, ohne vorher festzulegen, welche Kundentypen es gibt. Eine Clusteranalyse gruppiert die Personen automatisch so, dass sich etwa ein Cluster aus preisbewussten Vielkäufern, ein weiteres aus gelegentlichen Premiumkunden und ein drittes aus selten kaufenden Kunden ergibt, weil sich deren Kaufhäufigkeit, Ausgabenhöhe und Produktwahl jeweils ähneln.


Andrae, S. (2023): Ökonometrie und maschinelles Lernen. Basiswissen für Ökonomen. Wiesbaden: Springer Gabler

Kommentare


bottom of page