Reproduktionszahl, Wachstumsfaktor, Nowcasting: Die Fachbegriffe der Corona-Pandemie und was sie bedeuten
Den “Lockerungskoeffizienten” hat noch niemand präsentiert. Dafür aber andere Kennziffern und sonstige Epidemiologe-Fachbegriffe. Wir versuchen sie zu erklären.
Auf der Pressekonferenz des Robert-Koch-Instituts (RKI) am Dienstag sprach RKI-Vizepräsident Lars Schaade im Zusammenhang des Coronavirus von der Reproduktionszahl R, die aber nicht allein relevant für Maßnahmen sei. Für ein realistisches Bild des Epidemieverlaufs werde außerdem das Nowcasting-Verfahren angewandt.
Aber nicht nur am Dienstag kamen wieder einige Fachbegriffe auf. Im Laufe der vergangenen Wochen zauberten die Epidemiologen ständig neue Begriffe aus ihrem Statistiker-Hut. Mit ihnen versuchten sie, der Bevölkerung – und vermutlich auch sich selbst - den Verlauf der Corona-Pandemie vor Augen zu führen: Wachstumsrate, Wachstumsfaktor, Verdopplungszeit, Reproduktionszahl.
Haben wir das alles verstanden? Und verstanden, was diese Kennziffern dann auch für den weiteren Verlauf bedeuten, oder zumindest bedeuten können? Und warum vor Wochen die eine Zahl die umfassend Wichtige war, später dann aber andere Zahlen an Bedeutung gewannen? Wahrscheinlich nicht. Versuchen wir es noch einmal.
Grundlage all dieser Zahlen sind die vielen individuellen Infektionen innerhalb der Bevölkerung: Ein Mensch wird vom Virus infiziert. Dieses beginnt sich zunächst unbemerkt in ihm - beziehungsweise vor allem auf seinen Schleimhäuten - zu vermehren.
Nach etwa drei bis vier Tagen beginnt - so zumindest der derzeitige Kenntnisstand - der infizierte Mensch noch symptom- und damit ahnungslos, andere Menschen anzustecken. Erst nach 5 oder 6 Tagen bemerkt die Person - wenn überhaupt - schließlich die ersten Krankheitssymptome: Halsschmerzen, Husten, Fieber. Und wenn alles gut geht, ist sie 14 Tage nach den ersten Symptomen wieder gesund. Sie kann spätestens ab jetzt – zumindest nach heutigem Wissen – keine anderen Menschen mehr infizieren. Und dass sie in absehbarer Zeit erneut von anderen infiziert wird, ist auch zumindest sehr unwahrscheinlich.
[Alle aktuellen Entwicklungen in Folge der Coronavirus-Pandemie finden Sie hier in unserem Newsblog. Über die Entwicklungen speziell in Berlin halten wir Sie an dieser Stelle auf dem Laufenden.]
Am Beginn der Epidemie konnte sich das Virus noch ungehemmt verbreiten. Mathematisch ergab sich dadurch - kombiniert mit der biologischen Tatsache, dass es vergleichsweise hochansteckend ist - für die der Gesamtzahl der Infizierten ein...
exponentielles Wachstum.
Das bedeutet schlicht, dass pro Zeiteinheit - also etwa täglich oder auch pro Woche - nicht etwa gleich viele Infizierte hinzukommen, sondern dass es bei gleichbleibenden Zeitabschnitten trotzdem jeweils mehr und mehr werden. Nur die prozentuale Steigerung bleibt hier im mathematischen Idealfall gleich. Sie wird umschrieben durch die Begriffe
Wachstumsrate beziehungsweise Wachstumsfaktor.
Doch ähnlich wie bei Zins und Zinseszins wird der zahlenmäßige Zuwachs jedes Mal mehr als beim letzten Mal. In der Realität zeigte sich, dass die bekannte Zahl der insgesamt Infizierten ab Anfang März zunahm mit einer täglichen
Wachstumsrate.
Diese lag im Mittel bei 27 Prozent. Betrug die Zahl der insgesamt bereits bekannten Infizierten an einem bestimmten Tag also zum Beispiel 1000, so war an diesem Tag mit 1000 mal 0,27 = 270 Neuinfektionen zu rechnen. Am nächsten Tag betrug die Zahl der Gesamtinfektionen folgerichtig 1270. Diese Zahl ergab sich auch ohne den Umweg über die täglichen Neuinfektionen dadurch, dass man die Gesamtzahl der bis zu einem bestimmten Tag infizierten Menschen multiplizierte mit dem mit dem
Wachstumsfaktor.
Der betrug, direkt abgeleitet aus der Wachstumsrate, 1,27. Dadurch ergab sich direkt die Gesamtzahl der Infizierten am darauffolgenden Tag - in unserem Beispiel also 1 000 mal 1,27 = 1270. Und am übernächsten Tag waren dann theoretisch 1 270 mal 1,27 = 1613 Infizierte zu erwarten. Es kommen also schon einen Tag später nicht 270, sondern 343 Neuinfizierte hinzu, errechnet aus den Gesamtzahlen der je Tag Infizierten: 1613 minus 1270 gleich 343.
Mehr zum Coronavirus:
- Angeblich Einigung bei Bund und Ländern: Bundesliga soll am 15. Mai wieder starten, auch große Geschäfte dürfen öffnen
- Newsblog zum Coronavirus: Tägliche Sterberate in den USA könnte um 70 Prozent steigen, warnen Experten
- Zwei lange Jahre voller Höhen und Tiefen: Die zweite und dritte Corona-Welle könnte schlimmer als die erste werden
- Mundschutz selber nähen: Eine Anleitung für eine Gummiband-Maske mit Schnittmuster
In Wahrheit wichen die tatsächlichen Fallzahlen von Tag zu Tag natürlich etwas ab von den berechneten. Doch die Übereinstimmung zwischen Mathematik und Realität war erstaunlich gut. Vor allem aber beseitigte die Beschreibung des Verlaufs der Corona-Pandemie mit Hilfe von Wachstumsrate bzw. Wachstumsfaktor schon früh jeden Zweifel über den Ernst der Lage. Denn das Ergebnis einer ungebremsten exponentiellen Zunahme der Infizierten mit dem Wachstumsfaktor 1,27 war furchterregend: Schon nach 30 Tagen würde das ursprüngliche Häuflein von 1000 Infizierten anschwellen auf ein Heer von 1,3 Millionen!
Um diese Gefahr zu verdeutlichten, verwendeten die Politiker und Wissenschaftler jedoch selten den Begriff „exponentielles Wachstum“. Stattdessen beschrieben sie die bedrohliche Entwicklung mit dem gleichwertigen, aber anschaulicheren Begriff der
Verdopplungszeit.
Ein Wachstumsfaktor von 1,27 entspricht einer Verdopplungszeit der Zahl der Infizierten von jeweils 2,9 Tagen – und umgekehrt. Auch dies ist im Grunde eine Zins- und Zinseszins-Rechnung, und man muss kein Mathegenie sein, um zu erkennen, wie die in kurzen Zeitabständen von 2,9 Tagen aufeinander folgenden Verdopplungen schnell zu einer riesigen Gesamtzahl von Infizierten - viele davon therapiebedürftig - geführt hätte - selbst wenn im Verlauf der Epidemie auch wieder zunehmend viele Menschen gesund geworden wären. Denn die Zahl der Genesenen steigt - abzüglich der Toten - zwar ebenfalls an, ist aber in dieser Phase einer Epidemie immer viel kleiner, als die Zahl der Neuerkrankungen.
Um solch einen exponentiellen Anstieg der Infizierten- und Erkranktenzahlen zu verhindern, wurden schrittweise die bekannten Gegenmaßnahmen beschlossen sowie Verhaltensregeln nachdrücklich empfohlen.
Die Zahlen zeigten bald darauf, welche Wirkung die Veranstaltungsverbote, Einrichtungsschließungen und dergleichen, der „Lockdown“ also, hatten. Und zusätzlich wirkten sich auch die Verhaltensänderungen von Homeoffice bis zu intensivierter Handhygiene aus: Die Verdoppelungszeiten wurden länger. Dies war gleichbedeutend damit, dass die Wachstumsrate beziehungsweise der Wachstumsfaktor kleiner wurden.
Aber die Gesamtzahl der Infizierten wuchs zunächst weiterhin exponentiell. Die Kurven, die den Anstieg der Infiziertenzahlen darstellten, wurden aber weniger steil.
Das erste Ziel war erreicht. Es lautete:
„Flatten the Curve“.
Es war gelungen, die Infektionskurve abzuflachen. Die Beschreibung dieser neuen Situation erforderte nun aber auch eine andere Kennzahl. Denn innerhalb einer nun längeren Verdopplungszeit von nunmehr 10 oder gar 15 Tagen konnte sich genau diese Verdopplungszeit auch schon wieder ändern. Zudem beschreibt die Verdopplungszeit, wie bereits erwähnt, eben das Wachstum der Gesamtzahl der Infizierten.
[Wenn Sie alle aktuellen Entwicklungen zur Coronavirus-Krise live auf Ihr Handy haben wollen, empfehlen wir Ihnen unsere runderneuerte App, die Sie hier für Apple-Geräte herunterladen können und hier für Android-Geräte.]
Da die Zahlen aber bald über 100.000 Infizierte kletterten, ließ sich deren tägliche Zunahme – und damit eine Verbesserung oder Verschlechterung der Entwicklung – zwar mathematisch durchaus noch erkennen. Aus den zunehmend großen Zahlenwerten ließen sich aber ihre Veränderungen nun deutlich schlechter herauslesen. Und auch die Zahl der Genesenen spiegelt sich in der Verdopplungszeit nicht wider, obwohl sie auch allmählich größer und damit bedeutsamer wurde.
Deshalb besannen sich die Wissenschaftler nun zunehmend auf eine andere Maßzahl der Corona-Pandemie, die
Reproduktionszahl R.
Sie beruht auf den täglich festgestellten neuen Infektionen und deren Veränderungen und beschreibt deshalb wesentlich besser, wie sich die Pandemie weiterentwickelt. Die Zahl R gibt ganz einfach an, wie viele andere Menschen ein vom Corona-Virus befallener Mensch im gesamten Verlauf seiner Infektion ansteckt. Und sie ist der mathematisch und sicher auch intuitiv einfachste aller hier erörterten Werte.
Denn aus seiner Definition ergeben sich direkt die drei möglichen, sehr klar an jenem Zahlenwert erkennbaren Zukunftsszenarien des Pandemie-Verlaufs: Ist R größer als 1, steckt ein Infizierter mehr als einen weiteren Menschen an. In diesem Fall wächst die Gesamtzahl der Infizierten exponentiell – und zwar umso schneller, je größer R ist. Ist R = 1, bleibt die Zahl der Infizierten gleich. In der Praxis bedeutet das, dass im Idealfall und wenn R bereits eine Weile konstant bei 1 lag - etwa genauso viele Patienten beispielsweise die Intensivstationen verlassen, wie neue Patienten dort einen Platz benötigen.
Ist R kleiner als 1, nimmt die Gesamtzahl der Infizierten im Laufe der Zeit ab. Denn wenn R zum Beispiel 0,7 beträgt, hinterlassen jeweils 10 Infizierte nach ihrer eigenen Genesung nur noch 7 neu Infizierte.
So einfach R den jeweiligen Verlauf der Pandemie intuitiv leicht verständlich darlegt, so schwer ist es jedoch, R jeweils zu bestimmen. Denn dazu müsste man theoretisch die jeweilige Anzahl der Neuinfektionen Tag für Tag kennen. Das ist jedoch unmöglich. Denn der Zeitpunkt der Infektion eines Menschen kann in aller Regel nicht festgestellt werden. Ersatzweise versucht das Robert-Koch-Institut RKI deshalb festzustellen, wie viele infizierte Menschen an einem bestimmten Tag die ersten Krankheitssymptome zeigten.
Denn die Zahl der erkannten Neuerkrankungen entspricht annähernd der Zahl der Neuinfektionen, die 5 oder 6 Tage zuvor stattfanden – verkleinert um die Zahl der infizierten - und infektiösen Menschen, bei denen sich keine Symptome entwickeln, oder die trotz Symptomen nicht zum Arzt gehen und sich nicht testen lassen. Deren Anteil ist unbekannt, wird aber gegenwärtig als vergleichsweise gering eingeschätzt.
Doch auch die Zuordnung der Neuerkrankungen zu den Tagen, an denen sie tatsächlich erfolgten, erweist sich als sehr schwierig. Denn in aller Regel geht ein Mensch nach den ersten Corona-Symptomen erst nach einem Tag oder sogar noch später zum Arzt. Danach verstreicht weitere Zeit bis zum Test, und danach wiederum Zeit, bis das Testergebnis vorliegt. Und dann dauert es noch einmal eine Zeitlang, bis die Behörden vor Ort die Daten gesammelt und dem RKI gemeldet haben.
[Behalten Sie den Überblick über die Corona-Entwicklung in Ihrem Berliner Kiez. In unseren Tagesspiegel-Bezirksnewslettern berichten wir über die Krise und die Auswirkungen auf Ihre Nachbarschaft. Kostenlos und kompakt: leute.tagesspiegel.de]
Die täglichen Fallzahlen, die das RKI veröffentlicht, bestehen in Wahrheit also aus den erkannten Neuerkrankungen von Patienten an ganz verschiedenen Tagen, die teilweise schon zwei oder drei Wochen zurückliegen können. Das RKI versucht nun, aus der täglich aus ganz Deutschland eintreffenden Datenflut die konkreten Tage herauszulesen, an denen die einzelnen Patienten jeweils erkrankten. Bei nicht allzu weit zurückliegenden Tagen sind aber meistens noch gar nicht alle Daten beim RKI gelandet, die die jeweiligen Neuerkrankungen an diesen Tagen beziffern würden. Manchmal melden die Behörden auch nur das Datum des positiven Tests, nicht aber das zugehörige Datum des Beginns dieser Erkrankung.
Um trotzdem auch für Tage, bei denen diese Daten noch fehlen, die jeweilige Zahl der Neuerkrankungen abzuschätzen, verwendet das RKI das sogenannte
Nowcasting.
Der Begriff wird verständlicher, wenn man ihn anlehnt an den bekannteren Begriff des “Forecasting”. Dieser bedeutet “Vorhersage”, etwa die des Wetters. Das aktuelle Wetter kennt man, wenn man aus dem Fenster schaut, weshalb kein Wetter-“Nowcasting” notwendig ist. Die aktuelle Infektionssituation kennt man aber eben nicht. Epidemie-Nowcasting ist nichts anderes als eine “Vorhersage” des nur wenige Tage zurückliegenden Infektionsgeschehens auf der Grundlage der für diese Tage bereits vorliegenden, aber noch lückenhaften Daten.
Mit Methoden der Statistik wird hierbei ausgehend von den noch nicht vollständig vorliegenden Daten trotzdem schon geschätzt, wie viele Patienten an den jeweiligen zurückliegenden Tagen aller Wahrscheinlichkeit nach tatsächlich erkrankt waren. Diese Schätzung funktioniert allerdings nicht mehr für die beiden Tage unmittelbar vor der jeweiligen Gegenwart. Denn aus dieser knapp davor liegenden Zeitspanne kann das RKI noch kaum Informationen darüber erhalten haben, wie viele Personen in ihr erkrankt waren.
Das "Now" des Nowcasting ist also jeweils mindestens 3 Tage alt. Aus den mit Nowcasting geschätzten Zahlen der täglichen Neuerkrankungen bis 3 Tage vor der jeweiligen Gegenwart berechnet das RKI dann die entsprechende Reproduktionszahl R wie folgt: Die Wissenschaftler gehen davon aus, dass beim Corona-Virus von der Ansteckung einer Person 4 Tage vergehen, bis sie die nächste Person ansteckt.
Deshalb ergibt sich die R-Zahl jeweils dadurch, dass man die durchschnittliche Anzahl der Neuerkrankungen aus einem Zeitraum von 4 Tagen teilt durch die Anzahl der durchschnittlichen Neuerkrankungen aus dem davorliegenden und ebenfalls 4 Tage langen Zeitraum.
Das so erhaltene R gilt dann für den jeweils letzten der insgesamt 8 Tage, auf denen die Berechnung beruht. Die “now- gecastete" R-Zahl am 6. Mai, wurde vom RKI mit 0,65 – wobei der tatsächliche Wert mit 95%iger Sicherheit zwischen 0,53 und 0,77 liegt. Diese "aktuelle" R-Zahl gibt den Stand der Infektionsentwicklung für das drei Tage zuvor liegende Datum an, also für den 3. Mai.
Das vom RKI geschätzte aktuell niedrige R ist jedoch trügerisch. Denn allei genommen besagt es noch nicht, dass man bereits am Ziel wäre. Dem Ziel nähert man sich erst, wenn als Folge niedriger Reproduktionszahlen auch die Anzahl der täglichen Neuerkrankungen sehr niedrig geworden ist.
Doch wie niedrig ist niedrig genug? Auch dies wurde nun schon festgelegt. Die am Mittwoch beschlossenen Lockerungen gelten nur, solange die Zahl der Neuinfektionen innerhalb einer Woche in einer Region unter 50 pro 100.000 Einwohner bzw. 35 pro 100.000 Einwohner in Großstädten wie Berlin bleibt. Im Moment liegt Berlin locker unter dieser Obergrenze. Wenn die R-Zahlen jedoch als Folge der Lockerungen wieder über 1 ansteigen würden, könnte sich das schnell wieder ändern. Die dann einsetzende gefürchtete „zweite Welle” würde einen erneuten Lockdown erfordern.