Multivariate Statistik

Es gibt zahlreiche Verfahren der multivariaten Statistik, weit mehr als hier besprochen werden. Die vorliegende Auswahl berücksichtigt jene Methoden, die besonders häufig in der Markt-, Meinungs- und Sozialforschung eingesetzt werden.

Clusteranalyse

Die klassische Aufgabenstellung der Clusteranalyse ist es, eine zunächst ungeordnete Stichprobe von Elementen aufgrund von Ähnlichkeitsbeziehungen in kleinere, homogene Klassen oder Gruppen zu gliedern: Cluster – a group of contigous elements of a statistical population.

In der Markt-, Meinungs- und Sozialforschung wird es sich hierbei in aller Regel um Personen handeln. Die Clusteranalyse stellt somit das ideale Instrument zur Bildung von Typen dar, beantwortet also die Frage, wie viele unterschiedliche ‘Arten von Personen’ oder ‘Teilgruppen’ in meiner Stichprobe enthalten sind.

Während die Faktorenanalyse beispielsweise eine Vielzahl von Messungen strukturiert, werden bei der Clusteranalyse die Personen selbst klassifiziert. Ergebnis der Clusteranalyse ist also stets die Zuordnung einer einzelnen Person zu einer größeren Personengruppe.

Bei einer Clusteranalyse muss zunächst entschieden werden, welche Beobachtungen oder Variablen ihre Grundlage bilden sollen. Hier gibt es die Tendenz, ‘alles’ miteinzubeziehen, in der Hoffnung, es werden sich schon irgendwie relevante Gruppen finden lassen. Davon ist dringend abzuraten. Gerade eine zurückhaltende und sorgfältige Auswahl der Klassifizierungsvariablen liefert stabile, reproduzierbare und vor allem interpretierbare Typen. So sollte eine Einstellungstypologie zum Autofahren auf Einstellungen zum Autofahren beruhen, eine Typologie zum Einkaufsverhalten auf die Art und Häufigkeit der aufgesuchten Geschäfte etc.

Ein weiterer wichtiger Schritt besteht in der Bestimmung der Anzahl der Typen oder Cluster. Gleichwohl es statistische Hinweise auf die optimale Clusteranzahl gibt, ist ihre Bestimmung vorzugsweise inhaltlich durchzuführen. Sie sollte theorie- und bedarfsgesteuert sein.

Wesentlich für die Clusteranalyse ist es also, dass es sich hierbei um ein exploratives, hypothesengenerierendes Verfahren der angewandten Statistik handelt. Fragen der Signifikanz oder Kriterien der Validität spielen im Kontext der Clusteranalyse eine untergeordnete Rolle. Im Vordergrund steht der deskriptive Charakter.

Im diesem Sinne ist die Cluseranalyse ein konstruktives, Ordnung schaffendes Verfahren. Gefundene Typen sollten eher als Prototypen interpretiert werden, also als idealtypische Konfigurationen verschiedener Eigenschaften. Typen oder Gruppen stellen Annahmen dar, bieten Hilfestellung bei konkreten Aufgaben. Das bedeutet aber nicht, dass sie festgefügte Einheiten darstellen, der Übergang zwischen ihnen ist fließend, und es ist letztlich willkürlich, wo eine Grenze gezogen wird. Außerdem sollte nie vergessen werden, dass es beliebig viele andere Ordnungsysteme gibt, mit denen man seine Stichprobe (und damit seine Grundgesamtheit) ebenfalls unterteilen könnte.

Konkrete Beispiele finden Sie im Menüpunkt Segmentieren.