Arne Bathke

Resilienz und Statistical Literacy

Wir leben in Zeiten, in denen kaum ein Unternehmen, kaum eine Institution, erfolgversprechend in die Zukunft planen kann, wenn nicht die Daten über den eigenen Betrieb und das relevante Umfeld verstanden und im Hinblick auf wesentliche Fragestellungen angemessen interpretiert werden können. Genauso wie für Unternehmungen gilt dies für Staaten – die auch den Ursprung des Namens “Statistik” liefern, über das italienische Wort Statista: eine Person mit profunder theoretischer und praktischer Erfahrung in der Kunst der Staatsführung. Die Kunst der Staatsführung ist also schon seit Jahrhunderten zumindest namentlich eng verknüpft mit kluger Erhebung, Analyse und Interpretation von Daten.

Die Covid-Pandemie hat uns gezeigt, wie zentral und im wahrsten Sinne des Wortes vital die Statistical Literacy (etwa: statistische Bildung, auch wenn das Konzept Statistical Literacy genauso wie Data Science keine perfekt in zwei Worten abbildbare Kongruenz im Deutschen besitzt) für das Wohlergehen der Gesellschaft – insbesondere in einer Krisensituation – ist, und zwar Statistical Literacy „auf allen Ebenen der Gesellschaft, von einzelnen Bürger/innen über Verbände und Organisationen bis hin zu politischen Entscheidungsträgern“.[1] Von Vorhersagen des Pandemieverlaufes zu Prognosen von Kapazitätsengpässen wichtiger Güter, von der Entwicklung von Impfstoffen und Arzneimitteln, ihrer optimalen Verteilung und der Evaluierung ihrer Wirkungen und Nebenwirkungen bis hin zur klassischen statistischen Staatskunde, einschließlich der Einschätzung der gesamtwirtschaftlichen Lage: In jedem Lebensbereich war und ist statistische Expertise essenziell.

Mithin blicken die – bedauerlicherweise viel zu wenigen – professionellen Statistiker/innen in Europa auf ein arbeitsreiches Jahr zurück. Leider aber auch auf ein Jahr, das geprägt war von zahlreichen elementaren Fehlbewertungen quantitativer Informationen – durch alle Ebenen der Gesellschaft hindurch, einschließlich der Wissenschaft selbst.[2] Diese Fehlbewertungen bestehen oft in der falschen Einschätzung der Aussagekraft und Verallgemeinerbarkeit bestimmter Daten(sätze), in der Verwendung unangemessener Methoden der Aggregation und Analyse, sowie in Interpretationen und Schlussfolgerungen, die nicht durch die Datenevidenz gesichert oder sogar grob falsch sind. Dazu zählt auch das Ignorieren der drei bekanntesten elementaren (scheinbaren) Paradoxe, denen Studierende in einführenden Statistik-Lehrveranstaltungen begegnen: Simpsons Paradox, Berksons Paradox und das Regressionsparadox.[3] Es liegt auf der Hand: Die Fehlbewertungen quantitativer Informationen haben den Ausweg aus der Krise zusätzlich erschwert oder erschweren ihn weiterhin.

Ein gutes Beispiel liefert die Debatte um Kinder, Jugendliche und Schulschließungen. Es gibt in diesem Zusammenhang viele Fragen. Zum Beispiel: In welchem Ausmaß erkranken Kinder/Jugendliche an Covid? Wie hoch ist die Viruslast bei positiv getesteten Kindern und Jugendlichen? In welchem Ausmaß sind Kinder und Jugendliche infektiös, d.h. insbesondere: Stecken sie andere Kinder und Jugendliche an, oder infizieren sie Angehörige anderer Altersgruppen? Welchen Einfluss haben Kinder und Jugendliche auf das Pandemiegeschehen insgesamt? Auf Inzidenzen unter Gleichaltrigen? Auf Inzidenzen in anderen Altersgruppen? Auf Intensivbettenbelegung? Auf Mortalität? Welche Wirkung haben Schulschließungen auf das Pandemiegeschehen? Auf Inzidenzen unter Kindern und Jugendlichen oder in anderen Altersgruppen? Auf Einlieferungen in Intensivstationen und auf Mortalität?

Jede dieser wichtigen Fragen braucht für eine zuverlässige/verlässliche Beantwortung jeweils passende Daten und valide Analysen durch Fachleute aus Statistik und Data Science, um die oben angesprochenen oder ähnliche Fehlbewertungen auszuschließen. Es bedarf aber auch – wiederum quer durch die Gesellschaft bis hin zu politischen Entscheidungsträger/inne/n – eines Grundverständnisses für das, was die Datenwissenschaften überhaupt leisten können und was nicht: ein Teilaspekt der bereits angesprochenen Statistical Literacy. In Bezug auf die Rolle von Kindern bei der pandemischen Entwicklung könnte diese dazu führen, dass die Fragen nicht durcheinandergebracht werden und dass nicht z.B. Antworten auf einzelne Teilfragen als Antworten auf gänzlich andere Teilfragen interpretiert werden.

Dass eine solche statistische Bildung prinzipiell zu erreichen ist, beweist die Entwicklung von Unternehmen und Forschungsinstitutionen in Österreich, die in den letzten fünf bis zehn Jahren durch den Einsatz moderner Statistik bzw. Data Science immer genauer in der Lage sind, für gegebene Fragestellungen die entsprechend passenden Daten zu finden bzw. zu erheben und auch angemessen auszuwerten.

Was in der Unternehmenswelt bereits jetzt unverzichtbar für das Bestehen in einem kompetitiven und sich stets verändernden Umfeld ist, mithin also für das stete Reagieren auf Herausforderungen und Veränderungen, das benötigen wir auf allen Ebenen, um als Gesellschaft weniger durch Krisen verwundbar zu sein bzw. diese besser bewältigen zu können.

Also: um als Gesellschaft resilient zu sein.

Wenn eine resiliente Gesellschaft sich dadurch auszeichnet, dass sie stets neue Herausforderungen bestehen und auf Veränderungen dynamisch reagieren kann, dann benötigt sie Statistical Literacy in Breite und Tiefe, und damit verbunden auf jeder Ebene die Fähigkeit, logisch, strukturiert und analytisch aus den richtigen Daten für die richtigen Fragen die richtigen Schlüsse zu ziehen.


 

[1] Daten und Statistik als Grundlage für Entscheidungen: Eine Diskussion am Beispiel der Corona-Pandemie. Stellungnahme der DAGStat, 22.3.2021. [https://www.dagstat.de/fileadmin/dagstat/documents/DAGStat_Covid_Stellungnahme.pdf]

[2] https://doi.org/10.32388/Z69O8A.13 liefert ein besonders originelles Beispiel.
https://osf.io/86hta/ legt eindrucksvoll dar, welche gravierenden statistischen Fehler ein prominentes Wissenschaftsteam aus Deutschland bei einer Studie zur Rolle von Kindern in der Pandemie begangen haben.
https://doi.org/10.2147/CLEP.S288677 zeigt, wie die Retraktion zweier sehr prominente Studien zur Wirksamkeit von Covid-Medikationen durch Einsatz elementarer statistischer Prinzipien hätte vermieden werden können.

[3] http://www.jerrydallal.com/LHSP/regeff.htm (ein Paradox wird es natürlich nur dann, wenn der Regressionseffekt fehlgedeutet wird, wie im unteren Teil beschrieben).

 

Zurück zur Übersicht „Virtuelles W&K-Forum“

Foto: Konrad Fersterer

Arne Bathke ist Professor für Statistik an der Universität Salzburg