Daten in Insights umwandeln – Was hat die Drosten-Studie damit zu tun?
Die Ergebnisse der Vorab-Studie lassen vermuten, dass Kinder und Erwachsene gleich ansteckend sind – oder etwa nicht?
Worum geht es bei der Vorab-Studie? Es wird untersucht, ob sich die Virusmenge bei Kindern und Erwachsenen unterscheidet. Das Ergebnis wirkt sich darauf aus, ob man bspw. Kindergärten weiter schließt oder nicht. Dr. Christian Drosten wurde für seine Statistik-Anwendung bei dieser Vorab-Studie bezüglich der Unterschiede bei der Virusmenge bei Kindern und Erwachsenen heftig kritisiert.
Wir wollen dabei nur die Statistik betrachten und anhand der Studie zeigen, wie Insights in der Statistik generiert werden und in welche Fallen man tappen kann.
Zur Veranschaulichung verlassen wir kurz den Epidemie-Bereich und schauen uns ein typisches Szenario in der Industrie an: Wir benötigen für einen Produktionsprozess Wellen, die sauber sein müssen, da verdreckte Wellen für massive Probleme sorgen können. Daher interessiert uns, ob die Wellen von Hersteller „SauberWelle“ sauberer sind als von Hersteller „WellenRein“. Wir wollen wissen, ob sich Unterschiede statistisch nachweisen lassen.
Dafür schauen sich unsere Prüfer Peter und Michaela die Wellen an und teilen diese in Sauberkeitskategorien ein (sehr sauber, noch sauber, etwas verdreckt und sehr stark verdreckt)
Was brauchen wir in der Statistik für eine gute Aussage?
Genauso, wie Virologen nicht die gesamte Weltbevölkerung testen können, können wir im Produktionsbereich nicht immer alle Teile untersuchen. Dies ist teuer und häufig auch nicht notwendig. Wir brauchen von beiden Herstellern genügend Wellen, die wir untersuchen. Von beiden Herstellern wählen wir den Teil der Wellen, die wir auf Sauberkeit untersuchen, so „zufällig wie möglich“ aus. Wenn wir bspw. nur die Teile untersuchen, die jeweils am Freitagsabend hergestellt werden, können wir keine allgemeine Aussage treffen, da z. B. das nahende Wochenende einen Einfluss haben könnte.
Statistischer Jargon: Die Stichprobe muss die Grundgesamtheit repräsentieren.
Wir müssen bei der Beurteilung der Sauberkeit sicherstellen, dass Peter und Michael mit „gleichem Maß messen“, d.h. dass beide die gleiche Welle auch gleich beurteilen würden. Ähnlich wie einer Körperwaage, die 5 kg zu viel anzeigt: Durch diese falsche Messung verzichten wir fälschlicherweise auf das leckere Mittagessen, da wir denken, dass wir über unserem Idealgewicht sind.
Statistischer Jargon: Wir benötigen ein fähiges Messsystem.
Unterschied „nachgewiesen“ haben. Ist der Unterschied zu klein, gehen wir von einem zufälligen Unterschied aus, d.h. bei beiden Herstellern kann mal eine Welle schlechter oder besser sein. Es kann also in der Statistik vorkommen, dass zwar die untersuchten Wellen von „SauberWelle“ etwas sauberer sind, aber der Unterschied kann so gering sein, dass wir von einem Zufall ausgehen müssen.
Zurück zur StudieHierbei gab es neben dem gewählten Verfahren u.a. folgende Kritikpunkte:
Wie ist dies einzuschätzen und welchen Bereich aus unserem Szenario betrifft dies?
Die Abstriche betreffen die Messwerte, also Punkt 2 unseres Szenarios („Wir brauchen Messwerte, auf die wir uns verlassen können“). Sofern die Abstriche bei Kindern unzuverlässiger sind, ist auch das Ergebnis der Untersuchung nicht vertrauenswürdig.
Die beiden weiteren Punkte hängen miteinander zusammen – bei wenigen untersuchten Kindern brauchen wir einen sehr großen Unterschied zwischen den Gruppen, damit wir einen Unterschied statistisch nachweisen können (Punkt 3).
Daher kommt es auch zu dem erst einmal seltsam anmutenden Fall, dass trotz eines Unterschiedes in den Daten keinen Unterschied statistisch nachweisen können. Dies heißt in der Statistik allerdings leider nicht, dass es keinen Unterschied geben muss, wie es so schön heißt: „the absence of evidence is not an evidence of absence“ (siehe auch Drosten-Studie)
Fazit
Die geäußerte Kritik richtet sich auf eine Vorabstudie. Hierbei ist Kritik an der Arbeit kein Skandal, sondern gerade gewünscht, damit die eigentliche Veröffentlichung so gut wie möglich wird. All diese Kritikpunkte machen die Aussagen der Studie auch nicht grundsätzlich falsch, zeigen allerdings auf, dass uns die Erfahrung im Umgang mit der Epidemie fehlen. Es führt aber auch vor Augen, wie wichtig zuverlässige Daten als Grundlage der Statistik sind.
This post is also available in: Englisch
Reading Time: < 1 minute