Abb. 1: Wahrnehmungslandkarte mit Likert-Ratings
Abb. 2: Wahrnehmungslandkarte mit vergleichenden Ratings
Abb. 3: Logit-Analyse: Koeffizienten

Misst eine Studie tatsächlich das, was sie vorgibt zu messen? Die Frage klingt banal und zielt doch auf eines der wichtigsten Qualitätskriterien einer empirischen Untersuchung: ihre Validität. In einer Positionierungsstudie müssen Ratingskalen diesbezüglich drei Anforderungen erfüllen:

  • Sie müssen eine angemessene Trennung zwischen den Marken vorsehen, so dass verschiedene Marken auch verschiedene Ratings aufweisen. In der Psychometrik nennt man diese Eigenschaft „Diskriminanzvalidität".
  • Sie müssen an der Markenwahl orientiert sein, damit wir anhand der Attributbewertungen eine Vorhersage für die Markenwahl treffen können (Vorhersagevalidität).
  • Und schließlich müssen sie zeigen, was die Befragten von den Marken halten. Falls Marke A gegenüber Marke B als zuverlässiger empfunden wird, dann muss die mittlere Bewertung des Attributs Zuverlässigkeit bei Marke A höher liegen als bei Marke B (Augenscheinliche Validität - face validity).

Für Markenstudien werden häufig die Likert-Skala - fünfstufig von Zustimmung bis Ablehnung - oder ähnliche Skalen verwendet, um Einstellungen zu messen. Dass diese Ratingverfahren durch den „Halo"-Effekt beeinträchtigt sind, ist in Theorie und Praxis des Marketing hinlänglich bekannt. Diese Korrelationstendenz zeigt sich etwa darin, dass Befragte, die eine Marke mögen, alle Attribute tendenziell höher bewerten - und umgekehrt.

Vergleichende Skalen als Alternative

„Vergleichende" Ratingskalen nutzen einen anderen Ansatz. Hier müssen die Befragten angeben, ob eine Marke im Hinblick auf ein bestimmtes Attribut besser, gleich oder schlechter ist als andere Marken. Die Bewertung erfolgt dabei ebenfalls auf einer fünfstufigen Skala. Die Formulierungen für die Stufen dieser Skala sind - wie unten gezeigt - auf dieses Konzept abgestimmt: Gefragt wird beispielsweise, ob eine Marke „viel besser" oder „etwas schlechter" als andere Marken ist. Einzelberichte und Analysen liefern Hinweise, dass vergleichende Ratingskalen den Likert-Skalen in Bezug auf Diskriminanz- und Vorhersagevalidität überlegen sein könnten. Deshalb hat Maritz Research diese beiden Ratingverfahren vergleichend untersucht.

Dazu wurden in einer web-basierten Studie 443 Personen über die Fastfood-Marken McDonald's, Wendy's, Subway und Taco Bell befragt. Bei dieser Umfrage bewerteten die Befragten die vier Marken anhand der folgenden neun Attribute:

  • Schneller Service
  • Niedrige Preise
  • Günstige Lage
  • Gesundes Essen
  • Schmackhaftes Essen
  • Große Auswahl an Speisen
  • Sauberkeit
  • Freundliche Bedienung
  • Gute Angebote und Vergünstigungen

Zusätzlich gaben die Befragten an, welches Schnellrestaurant sie am häufigsten besuchten und wie sich ihre letzten 10 Besuche in solchen Restaurants prozentual auf die vier Ketten verteilten.

Bei 221 Befragten (Splitt I) kam für die Einschätzung von Markenattributen eine komplett verbal verankerte, klassische Likert-Skala zum Einsatz:

  • Stimme voll und ganz zu
  • Stimme zu
  • Unentschieden
  • Bin dagegen
  • Bin voll und ganz dagegen
222 Befragte im zweiten Splitt gaben ihre Einschätzung von Markenattributen anhand der folgenden vergleichenden Ratingskala ab:

  • Viel besser als andere Marken
  • Etwas besser als andere Marken
  • Etwa gleich wie bei anderen Marken
  • Etwas schlechter als andere Marken
  • Viel schlechter als andere Marken

Skalen im Vergleich


Die Diskriminanzanalyse für jede Skala liefert neun F-Statistiken, für jedes Attribut eine. Bei der vergleichenden Skala ist der Wert für die F-Statistik für jedes Attribut größer als bei der Likert-Skala, hier 22,78 zu 39,04. Die Diskriminanzvalidität ist der Prozentsatz der korrekt klassifizierten Fälle und damit ebenfalls ein Maß, das höher liegt bei einem Modell mit größerer Vorhersagevalidität. Die Klassifikationsgenauigkeit beim Likert-Rating beträgt 54,9 Prozent gegenüber 62,8 Prozent beim vergleichenden Rating. Beide Maße für die Diskriminanzvalidität legen also den Schluss nahe, dass vergleichende Ratings eine höhere Validität besitzen als die Likert-Ratings. Die beiden Wahrnehmungslandkarten weisen bei der Markenpositionierung starke Ähnlichkeiten auf, mit Subway alleine auf der rechten Seite, McDonalds im oberen linken Quadranten und Taco Bell im unteren linken Quadranten. Vier Attribute liegen auf beiden Karten vorwiegend in den ersten beiden Dimensionen: Gesundheit, Preis, Lage und Angebote. Die restlichen fünf Attribute liegen auf beiden Karten vorwiegend in der dritten Ebene, die man sich als den Raum über dem Blatt Papier vorstellen kann. Die fünf Attribute ähneln sich in diesem Aspekt, obwohl die zweidimensionale Projektion diese Ähnlichkeit verdeckt und eine Verschiedenheit abbildet, die in diesem Maße tatsächlich nicht gegeben ist. Die Ähnlichkeit der beiden Karten lässt darauf schließen, dass bei der augenscheinlichen Validität keine der beiden Ratingmethoden offensichtliche Vorteile besitzt.

Bei der Logit-Analyse liegt wiederum das vergleichende Rating vorn. Für das aus den Likert-Ratings entwickelte Modell ist R 2 =0,253 und für das aus den vergleichenden Ratings entwickelte Modell ist R 2 = 0,353. Da ein höherer Wert für R 2 ein passenderes Modell bedeutet, ermöglicht das aus den vergleichenden Ratings entwickelte Modell bessere Vorhersagen für die Markenwahl als das aus den Likert-Ratings entwickelte Modell. Wie die abgebildete Tabelle zeigt, sind nur zwei der Koeffizienten signifikante Prädiktoren für das Likert-Modell, während das aus dem vergleichenden Rating entwickelte Modell fünf signifikante Koeffizienten liefert.

Natürlich ist eine Skala, die mehr signifikante Prädiktoren für die Wahl eines Schnellrestaurants liefert (Sauberkeit, Preis und schnellen Service sowie Lage und Schmackhaftigkeit) das bessere Prognoseinstrument.

Vergleichende Skala überlegen

Die mit beiden Ratingskalen gewonnenen Ergebnisse haben ähnliche face validity. Die vergleichende Skala ist der Likert-Skala überlegen bei der Differenzierung zwischen den Marken und bei der Vorhersage der Markenwahl. Wegen dieser Vorteile empfiehlt Maritz Research die Nutzung vergleichender Ratingskalen für Attributbewertungen bei Studien über Markenwahl, Markenimage, Markenpositionierung und Markenbewertung.