Get Even More Visitors To Your Blog, Upgrade To A Business Listing >>

Was ist der Selection Bias?

Ein Selection Bias, oder Stichprobenverzerrung, tritt auf, wenn eine Stichprobe nicht komplett zufällig gewählt wurde und somit nicht mehr repräsentativ ist. Die Stichprobenverzerrung führt dazu, dass die Verteilung der Merkmale nicht dieselbe ist, wie in der Grundgesamtheit.

Was ist der Selection Bias?

Der Selection Bias bezeichnet eine Verzerrung bei der Zusammensetzung von Stichproben, die zur Verfälschung von Daten in Befragungen oder Untersuchungen führen kann. Deshalb muss man vorsichtig sein bei der Interpretation solcher Daten. Eine Verzerrung der Stichprobe ist nicht unbedingt direkt erkennbar, sondern wird erst bei genauer Untersuchung der Stichprobenermittlung deutlich.

Eine perfekte Stichprobe ist so ausgewählt, dass jede Person aus der Grundgesamtheit dieselbe Wahrscheinlichkeit besitzt in ihr vertreten zu sein. Wenn dieser Umstand nicht gegeben ist, ist die Stichprobe verzerrt. Je nachdem kann die Verzerrung stärker oder schwächer sein.

Welche Beispiele gibt es für einen Selection Bias?

Angenommen wir wollen herausfinden, wie viel Geld die Menschen im Durchschnitt für den Konsum ausgeben. Eine Befragung aller deutschen Erwachsenen wäre jedoch zu zeit- und kostenaufwändig. Deshalb entscheiden wir uns eine Stichprobe zu nehmen und gehen dazu in die Münchner Innenstadt und befragen zufällig vorbeilaufende Passanten.

Aufgrund der zufälligen Auswahl der Teilnehmer gehen wir davon aus, dass unsere Stichprobe aussagekräftig ist. Jedoch hagelt es bei der Veröffentlichung der Ergebnisse massive Kritik. Der Vorwurf: Selection Bias! Folgende Probleme ergeben sich mit unserer Auswahl:

  1. Hat wirklich jeder deutsche Erwachsene dieselbe Wahrscheinlichkeit in der Stichprobe vorzukommen? Was ist mit Erwachsenen aus Berlin oder Hamburg?
  2. Ist das Einkommensniveau von München vergleichbar mit dem deutschen Durchschnitt? Wenn nein, was hat das für Auswirkungen auf unsere Stichprobe?
  3. Was ist mit den Erwachsenen, die vor allem im Internet und E-Commerce ihre Konsumausgaben generieren? Wie würden diese Personen das Ergebnis verändern?
  4. Welche Altersgruppen treffen wir an einem Freitag Nachmittag in München an? Welche Altersgruppen sind zu dieser Zeit möglicherweise nicht verteten?

Die Fehler bei der Stichprobenerstellung müssen nicht immer so offensichtlich vorliegen, wie bei unserem Beispiel. Manchmal lassen sie sich sogar nicht verhindern und müssen bei der Interpretation der Ergebnisse mit einbezogen werden.

Ein anderes Beispiel für den Selection Bias ist bei vielen die Berufswahl. Wenn man sich hierbei lediglich auf Erfahrungen und Meinung aus dem engen Familien- und Freundeskreis verlässt, unterliegt man bereits einem Bias. Diese Auswahl deckt nämlich nur eine bestimmte Auswahl an Berufen ab und ist nicht repräsentativ für alle möglichen Berufe. Dadurch wird das Ergebnis verzerrt, da man sich über gewisse Berufsgruppen gar nicht oder nur sehr wenig informiert.

Folgende Beispiele unterliegen auch einem Bias:

  • Umfragen: Die Personen können selbst entscheiden, ob sie an einer Umfrage teilnehmen oder nicht. Dies führt gezwungenermaßen zu einer Verzerrung, da eine gewisse Personengruppe, nämlich die, die nicht an Umfragen teilnimmt, nicht in der Stichprobe vorhanden ist.
  • Art der Befragung: Auch die Art wie die Ergebnisse der Stichprobe erfasst wurden, kann Einfluss auf eine Verzerrung haben. Den meisten Menschen wird es wahrscheinlich unangenehm sein in einer direkten Befragung zuzugeben, dass sie schon einmal betrunken Auto gefahren sind. Bei einer schriftlichen Befragung hingegen könnten mehr Teilnehmer ehrlich antworten.

Welche Arten des Selection Bias gibt es?

Es gibt eine Vielzahl von Gründen für die Verzerrung von Stichproben. Hier haben wir lediglich die Arten von Stichprobenverzerrung aufgeführt, die am häufigsten vorkommen:

  • Attrition Bias tritt auf, wenn Teilnehmer die Studie oder Umfrage vorzeitig abgebrochen haben und aus diesem Grund nicht in das Endergebnis gezählt werden. Hierbei darf nicht der Fehler gemacht werden, diese Probanden einfach aus der Stichprobe zu entfernen, da bei ihnen die Behandlung beispeilsweise nicht funktioniert hat.
  • Ein ähnliches Phänomen ist der sogenannte Volunteer Bias, bei dem der Bias dadurch entsteht, dass die Teilnehmer sich aktiv bereit erklären Teil der Stichprobe zu sein. Die Einwillung zur Teilnahme kann dabei schon ein Merkmal sein, dass die Stichprobe von der Grundgesamtheit unterscheidet und somit das Ergebnis verzerrt. In der Realität lässt sich dieser Bias oft nur schwer verhindern. Er sollte jedoch bei der Ergebnisinterpretation mit einbezogen werden.
  • Der Social Bias tritt auf, wenn durch die Art der Befragung oder Studie die Wahrscheinlichkeit hoch ist, dass nicht wahrheitsgemäß geantwortet wird. Es kan dabei zu dem Problem kommen, dass nicht die wahrheitsgemäße Antwort gegeben wird, sondern die, die gesellschaftlich akzeptiert ist oder den Befragten in einem besseren Licht stehen lassen.

Wie kann der Selection Bias verhindert werden?

Der wichtigste Punkt bei der Verhinderung des Selection Bias ist erstmal das Bewusstsein über mögliche Problematiken im eigenen Experimentaufbau. Hinzu kommt, dass sich manche Stichprobenverzerrungen einfach nicht verhindern lassen. Wenn man eine groß angelegte Studie durchführen will, beispielsweise im medizinischen Bereich, dann ist man auf freiwillige Teilnehmer angewiesen und der Volunteer Bias lässt sich nicht verhindern.

Somit lassen sich auch keine allgemeinen Tipps geben, wie der Selection Bias vermieden werden kann, da dies stark vom Einzelfall abhängig ist. Wichtig ist lediglich, dass man bei der Veröffentlichung der Ergebnisse ehrlich ist und möglichst viele Informationen über die Stichprobenerstellung gibt. Hilfreich ist es hierbei auch immer schon direkt offen mögliche Probleme zu nennen und transparent zu sein.

Das solltest Du mitnehmen

  • Ein Selection Bias, oder Stichprobenverzerrung, tritt auf, wenn eine Stichprobe nicht komplett zufällig gewählt wurde und somit nicht mehr repräsentativ ist.
  • Es gibt viele verschiedene Arten von Selection Bias, wie beispielsweise der Volunteer Bias oder Attrition Bias, die abhängig vom Experiment auftreten können.
  • Mögliche Strategien zur Verhinderung von Stichprobenverzerrungen sind vom Einzelfall abhängig. Wichtig ist jedoch, dass man bei der Ergebnisveröffentlichung transparent aufzeigt, wie die Stichproben erstellt wurden.

Andere Beiträge zum Thema Selection Bias

  • Die University of Oxford hat hier eine Sammlung von Biases veröffentlicht.


This post first appeared on Data Basecamp, please read the originial post: here

Share the post

Was ist der Selection Bias?

×

Subscribe to Data Basecamp

Get updates delivered right to your inbox!

Thank you for your subscription

×