zum Hauptinhalt
Ohne aufwendige Diagnostik kann ein kurzer Sprachtest einen Verdacht auf Covid-19 anzeigen.
© imago images/Frank Sorge

Smarte Früherkennung: App prüft Stimme auf Corona

Informatiker und Mediziner der Universität Augsburg arbeiten an einem Softwaresystem, das über die Stimmfrequenz erkennen kann, ob eine Covid-19-Infektion vorliegt.

Es klingt noch etwas nach Science Fiction, aber wenn es nach Informatiker Björn Schuller von der Universität Augsburg geht, könnte bald schon das Smartphone erkennen, ob man an Covid-19 erkrankt ist. Hintergrund ist ein Forschungsprojekt, an dem der Informatiker zusammen mit Medizinern arbeitet. 

Am Ende könnte eine Computer-Anwendung oder auch eine Smartphone-App stehen, die anhand der Stimmfrequenzen und weiterer Merkmale erkennen kann, ob eine Person erkrankt ist – und zwar in Echtzeit und mit der nötigen Distanz.

Im März 2020 bereits hatte das Entwickler-Team um Schuller begonnen, Stimmaufnahmen aus dem chinesischen Wuhan auszuwerten, die sie von dortigen Kollegen erhalten hatten. Diese Analysen waren erste Lernbeispiele für die Computeranwendung. „Je mehr Stimmen wir auswerten können, umso genauer kann die App später funktionieren“, erklärt Schuller. Daher lautet das Motto der Forscher: „Jede Stimme zählt.“

Über den Vergleich von Stimmen von Erkrankten und Gesunden lernt das System. Inzwischen erhalten die Forschenden Daten aus dem Universitätsklinikum Augsburg. 

Hier besteht eine Zusammenarbeit mit Markus Wehler, dem Direktor der IV. Medizinischen Klinik sowie der Zentralen Notaufnahme der Uni-Klinik Augsburg.

[Wenn Sie aktuelle Nachrichten aus Berlin, Deutschland und der Welt live auf Ihr Handy haben wollen, empfehlen wir Ihnen unsere App, die Sie hier für Apple- und Android-Geräte herunterladen können]

Der Sprachtest soll sehr schnell durchführbar und für die Betroffenen wenig belastend sein – ein Ergebnis liege in wenigen Minuten vor. „Es ist keine Blutabnahme und kein Röntgenbild und auch sonst ist keine aufwendige Diagnostik nötig – das ist von großem Vorteil“, erklärt der Mediziner Wehler. 

Selbst wenn das Ergebnis nicht so genau sei wie bei einem Abstrich, können man dennoch Verdachtsfälle schnell herausfiltern. „Die Sprache ist hier quasi das neue Blut“, sagt der Informatiker Schuller. „Wir hoffen, mit unserer Anwendung einen Beitrag zur Früherkennung von Covid-19 leisten zu können.“ Das System lerne mit tiefen neuronalen Netzwerken wesentliche Merkmale einer Stimme zu erkennen. 

Kurzatmigkeit, Ermüdung, Husten werden erkannt

Dann werden Einflüsse von Covid-19 auf die Stimmbildung ermittelt, also beispielsweise Kurzatmigkeit, Ermüdung, Husten oder ähnliche Symptome. Technisch sei die Anwendung als Tool für Mediziner denkbar, aber auch auf einem privaten Smartphone einsetzbar, das habe das Forschungsprojekt bereits zeigen können. Zusammen mit einem Experten, der die Aufnahme kontrolliert, lasse sich die Prozedur aber leichter durchführen.  Die tiefen neuronalen Netzwerke, die das System nutzt, sind dem Gehirn von Lebewesen nachempfundene Computeralgorithmen.

[Wenn Sie alle aktuellen Entwicklungen zur Coronavirus-Krise live auf Ihr Handy haben wollen, empfehlen wir Ihnen unsere runderneuerte App, die Sie hier für Apple-Geräte herunterladen können und hier für Android-Geräte.]

Sie können ähnlich wie das menschliche Gehirn in einem hohen Maße Informationen parallel verarbeiten. „Sie bilden das Sprachsignal mit zunehmender Komplexität ab und können nach dem Anlernen mit vielen Daten neue Probleme wie Covid-19 darstellen und erkennen“, erklärt Schuller.

Strukturen von Stimmfrequenz oder Husten ändern sich bei einer Infektion.
Strukturen von Stimmfrequenz oder Husten ändern sich bei einer Infektion.
© Abbildung: Uni Augsburg

Grundsätzlich gehe es um das Erkennen von Mustern. Dazu muss abstrahiert werden, die Beobachtungen müssen auf Charakteristika reduziert werden. Tiefe neuronale Netze können das heutzutage selbst lernen. 

Dazu braucht es allerdings möglichst viele Beispiele, von kranken und gesunden, von jungen und älteren Menschen in allen Lebenslagen und Ausprägungen. Die Forscher wollen auch sicher sein, dass die Anwendung nicht nur Gesunde von Kranken unterscheiden kann, sondern auch Covid-19 von einer „normalen“ Erkältung. „Dazu ist die Datenlage noch recht überschaubar“, sagt Schuller. Ziel sei daher auch eine zweite Anwendung, die langfristig – auch über Nacht – Aufzeichnungen von Stimme, Atmung und Geräuschen der Atemwege macht. 

Damit lassen sich dann Symptome gut erkennen, die eine Erkältung von Covid-19 klarer abgrenzen – etwa trockener Husten, der für Corona spricht oder häufiges Niesen, das eher dagegen spricht.

"Gute Unterscheidung zwischen Covid-19 und Erkältung"

„Die Vermutung liegt nahe, dass sich damit eine gute Unterscheidung zwischen Covid-19 und Erkältung treffen lässt“, formuliert Schuller noch recht vorsichtig. Für eine besonders klare Abgrenzung verschiedener Erkrankungen voneinander dürfte das längerfristig arbeitende Analyse-Tool das vielversprechendere sein, schätzt Schuller. „Wenn man länger zuhört, ergibt das eine verlässlichere Datenlage.“

[Berlins Hausärzte-Chef erklärt: So können Sie Corona von Grippe unterscheiden]

Andere Forschungen zu ähnlichen Erkennungsystemen – unter anderem laufen dazu Vorhaben am Massachusetts Institute of Technology (MIT) und der University of Cambridge, an der Carnegie Mellon University Pittsburgh (CMU) wie auch von Arbeitsgruppen in Israel und Brasilien – würden zumindest bei der Symptomatik Husten bereits sehr eindeutige Ergebnisse erbringen. 

Dafür brauche das Augsburger Vorhaben aber noch eine Ausweitung der Datenlage. Auch müssen die Forscher bei der Nutzung älterer Daten darauf achten, dass es durch die Nutzung verschiedener Räume und Mikrofone nicht zur Verfälschung der Ergebnisse kommt.

Erfolgsquote derzeit bei 80 Prozent

Die Erfolgsquote der Augsburger Anwendung liegt bei der Frage nach erkrankt oder gesund vorläufigen Auswertungen zufolge mittlerweile bei über 80 Prozent. Diese Zahl sei aber noch mit Vorsicht zu genießen. „Wir sind noch mitten in der Untersuchung“, sagt Schuller. „Es bedarf einer belastbareren Datenlage, um direkt aus der Stimme eine nachhaltige Aussage treffen zu können.“ Andere Forschungsvorhaben zu ähnlichen Verfahren geben sogar noch höhere Erfolgsquoten zum Teil sogar über 90 Prozent. 

Ob sich auch asymptomatisch Infizierte beziehungsweise Infizierte vor Ausbruch der Erkrankung mit dem Sprachanalyse-System identifizieren lassen, ist unter Forschern noch umstritten. 

Björn Schuller ist der Auffassung, dass dies nach einer harten Definition von asymptomatischen Verläufen nicht möglich ist, während Forscher vom MIT das für möglich halten. Die Frage ist hier natürlich, was „asymptomatisch“ bedeutet, ob es nur um von der Medizin anerkannte Symptome geht und ab welcher Schwelle einzelne Menschen überhaupt Symptome an sich selbst wahrnehmen.

„Letztlich muss die Sprachproduktion, die bestimmten motorischen, physiologischen und kognitiven Einflüssen unterliegt, betroffen sein – sonst ist auch nichts zu hören“, erklärt Schuller. Andere Covid-Symptome wie etwa Darmbeschwerden ließen sich nicht so eindeutig an der Sprache erkennen, nur etwa über Müdigkeit oder Übelkeit.

Schließlich sei es aber unbedingt notwendig, bei einer von der Anwendung ermittelten Infektion auch einen PCR-Test zum Abklären folgen zu lassen. „Ich sehe das nicht als Konkurrenz validerer Verfahren, sondern wir wollen eine Vordiagnose ermöglichen“, betont der Informatiker. 

Hinzu komme die Möglichkeit, dass sich über die Anwendung auch Ausbreitungsmuster bereits schnell erkennen lassen. Wenn sich in einem Pflegeheim am Ein- und Ausgang bei einer erhöhten Zahl von Personen ein Verdacht zeige, könnte man dort schnell ein Cluster erkennen. Hinzu komme die Option, auch mit virtuellen Sprachassistenten wie Alexa einen Ausbruch in einem Haushalt schnell erkennen zu können. 

Eins der wichtigsten Anliegen von Schuller sind in diesem Zusammenhang Fragen der Ethik und Privatsphäre. Am Lehrstuhl für Digitale Gesundheit habe man eine individuelle Gesundheitsverfolgung per Armband oder in der Hosentasche zum Ziel. „Das ist natürlich datentechnisch höchst kritisch, weil es um personenbezogenen Daten geht, die Aufschluss über den Gesundheitszustand geben.“ 

Daher wolle man Lösungen entwickeln, bei denen die Daten nicht auf einem Server, sondern beim Nutzer bleiben. Zudem sei ein extrem sicheres Verfahren entwickelt worden, bei dem die Daten ohne Rückverfolgung zum Nutzer für einen Abgleich zur Verfügung stehen. Ein anderes Problem sei die Angreifbarkeit von Künstlicher Intelligenz. So könnten etwa Verfahren bei einer Eingangskontrolle zum Erkennen Infizierter gestört werden. Auch hier müsse man Sicherheitsebenen einziehen. 

Angesichts der Pandemie drängt die Zeit

Das Projekt zur Sprachanalyse von Covid-19 ist noch nicht abgeschlossen. „Wir beschäftigen uns neben der Verbesserung der Zuverlässigkeit mit besserer Erklärbarkeit“, so Projektleiter Schuller. Ziel soll letztlich sein, das Projekt in eine reale Anwendung zu überführen. 

„Um für uns alle einen Mehrwert in dieser herausfordernden Zeit zu schaffen.“ Das kann nicht die Forschung erbringen, hier brauche es einen Partner aus der Wirtschaft. Natürlich drängt im Angesicht der Pandemie nun die Zeit. „Das hat aber auch den Vorteil, dass gegenwärtig eine andere Energie da ist, das Thema voranzubringen“, sagt Schuller. 
Der Forscher hat bereits Erfahrungen mit Stimmanalysen an der Schnittstelle zwischen Informatik und Medizin. 2012 hat er mit seinen Kolleg*innen Kehlkopfkrebs erkennbar gemacht, und die Erfahrungen dann 2013 auf Autismus ausgeweitet, 2015 kam Parkinson und 2016 Erkältung hinzu. 

Geplant ist auch die Diagnostik von großen Krankheitsbildern wie Depressionen und Epilepsie. Eines der Verfahren zur Covid-19-Erkennung durch Sprache ist bereits bei der Fachtagung „Interspeech“ vorgestellt worden und durch einen Peer Review gegangen. Dabei ging es allerdings nicht um die Frage krank oder gesund, sondern um den Schweregrad der Erkrankung.

Zur Startseite