Big Data in der Onkologie: Große Daten, große Chancen, hohe Hürden
Krebstherapien könnten durch Verarbeitung großer Mengen biologischer Information deutlich besser werden.
Die klassische Krebstherapie ist ein Zerstörungswerk. Operationen, bei denen Tumoren entfernt werden, sind noch der gezielteste Teil davon, weil die Zerstörung wirklich nur am Ort der OP stattfindet. Bei Bestrahlung wird versucht, sich auf von Krebszellen befallenes Gewebe zu beschränken, doch fast immer wird auch gesundes getroffen. Und herkömmliche Chemotherapien sind Zellgifte, die im ganzen Körper wirken. Viel besser sind Verfahren, die wirklich nur Krebszellen treffen, und das auch noch effektiv. Damit das funktionieren kann, muss man diese Zellen und ihre Eigenschaften bei einem bestimmten Patienten sehr genau kennen. Viele Daten, oder auch „Big Data“, sind dafür notwendig. Onkologen und Informatiker wollen so aus den genetischen Profilen individueller Krebspatienten perfekt passende Therapien ableiten.
Die Chance liegt im Unterschied
Digitalisierung schreitet in der Medizin auf den verschiedensten Feldern voran, von schlichter Zugänglichmachung von Patientendaten bis zum Einsatz Künstlicher Intelligenz (KI). "Big Data" soll in der Onkologie wesentlich dazu beitragen herauszufinden, worin sich verschiedene Krebsarten ähneln und worin sie sich unterscheiden. Auch, welche molekularen Tricks Tumorzellen nutzen und welche Veränderungen bei welcher Krebsart auftreten, könnte man so besser und individueller verstehen. Dafür müssen Datenmengen aus Studien zu Genen, Proteinen und Stoffwechselprodukten in Tumorzellen zusammengeführt und mit Kenntnissen zu den Prozessen in gesunden Zellen zusammengeführt werden. Auch Ergebnisse klinischer Untersuchungen mit Patienten fließen ein. „Es ist nötig, das Krebsgenom eines Patienten, gewonnen aus Tumorgewebe, mit dem einer normalen Zelle aus dessen Blut zu vergleichen“, sagt der Bioinformatiker Roland Eils. Er arbeitete lange Jahre am Deutschen Krebsforschungszentrum (DKFZ) in Heidelberg und ist seit Kurzem Professor für Digitale Gesundheit am „Berliner Institut für Gesundheitsforschung“ und der Charité.
Die normale Zelle, sagt Eils, diene als „Referenz für unser vererbtes Genom, um die genetischen Veränderungen im Krebs von den vererbten Veränderungen des Patienten zu unterscheiden“. Die dabei anfallenden Datenmengen sind riesig. „Allein in meinem Labor am DKFZ fielen in den letzten Jahren täglich elf Terabyte Daten an, das ist fast so viel wie das tägliche weltweite Datenaufkommen bei Twitter.“
Risikogene
Um das genetische Profil einer Tumorzelle zu erfassen, ist es nötig, deren Erbgut-Sequenz, also die Abfolge der Basen Guanin, Adenosin, Thymin und Cytosin (G,A,T, C), zu „lesen“. Von ihr ist abhängig, welche Proteine in den Zellen produziert werden können. Diese Abfolge wird per Genom-Sequenzierung ermittelt. Die Techniken dafür sind in den vergangenen Jahren immer besser, schneller und kostengünstiger geworden. Gut 13 Jahre hatte es gedauert und mehrere Milliarden Dollar gekostet, bis 2003 im Rahmen des Humangenomprojektes (HGP) erstmals wenige fast komplette Gensequenzen von Menschen auf diese Weise gelesen worden waren. Heute reichen einige Stunden oder Tage aus, und die 1000-Dollar-Marke ist nicht mehr fern.
Inzwischen ist auch deutlich mehr über die Bedeutung und Funktion vieler der gut 20 000 Gene bekannt, die sich in den drei Milliarden Paaren jener Basen finden. Wie wichtig es ist, ihre Bedeutung zu kennen, wird an den zwei bekanntesten Risiko-Genen - BRCA1 und BRCA2 - für familiären Brustkrebs deutlich. BRCA steht schlicht für „breast cancer“, also Brustkrebs. „Liegt eine der beiden Genveränderungen vor, ist das Brustkrebsrisiko um das Zehnfache erhöht, und Frauen mit einem veränderten BRCA-Gen erkranken zudem häufiger an Eierstockkrebs“, sagt Christian Singer, Leiter des Zentrums für familiären Brust- und Eierstockkrebs an der Medizinischen Universität Wien. Die Risiko-Gene zu kennen, bedeute für die betroffenen Frauen eine Chance, den Krebs zu verhindern beziehungsweise besonders früh zu entdecken. Bekannt ist das Beispiel der Schauspielerin Angelina Jolie. Sie ist Trägerin dieser Risiko-Gene und hat sich deshalb vorsorglich Brüste und Eierstöcke entfernen lassen.
Die nächste Generation
Wesentlichen Anteil daran, dass eine Genomsequenzierung deutlich schneller und kostengünstiger geworden ist, habe das „Next Generation Sequencing“ (NGS), sagt Eils. Es basiert auf der Idee, Millionen Erbgut-Fragmente nicht nacheinander, sondern gleichzeitig zu sequenzieren. Das ist kostengünstiger und geht deutlich schneller. So ist es möglich, das gesamte Erbgut oder die Gesamtheit jener Genabschnitte, die die Bauanleitung für ein Protein darstellen und in denen nahezu alle krankheitsverursachenden Mutationen zu finden sind, komplett zu analysieren. Die NGS liefert laut Singer allerdings auch viele Daten ohne echte Bedeutung. Hier gelte es, richtig einzuordnen. „Bei Big Data werden mitunter Mutationen gefunden, die das Brustkrebsrisiko gerade einmal um den Faktor 1,1 erhöhen, also minimal, aber es gibt Frauen, die das so beunruhigt, dass sie eine Brustamputation in Erwägung ziehen“, sagt Singer. Das sei medizinisch aber nicht gerechtfertigt.
Mehr Daten sind also nicht unbedingt gleichbedeutend mit mehr Wissen, mehr Sicherheit oder auch nur der Möglichkeit genauerer Aussagen. Und ein gefundener Zusammenhang ist nicht unbedingt auch gleich ein ursächlicher. Singer sagt, die Daten müssten „intelligent aufbereitet“ werden: „Wie werte ich die Daten aus, welche Schlüsse ziehe ich daraus und was möchte ich im Hinblick auf eine Therapie eigentlich wissen?“, seien dabei entscheidende Fragen. Von der wissenschaftlich fundierten Betrachtung der Daten hänge die Zuverlässigkeit von Diagnosen und Therapien ab. „Der Umgang mit Big Data ist noch ein Problem“, resümiert Singer. Er und seine Kollegen seien noch immer „Zauberlehrlinge“. Eils sieht die Situation ähnlich: „Bislang gibt es keine Standards für Krebs-Genom-Daten, weder in der Forschung noch in der Klinik, weshalb nicht garantiert ist, dass die wirklich krankheitsrelevanten Daten extrahiert werden“, warnt der Berliner Bioinformatiker. Eine schrittweise Standardisierung der Bioinformatikverfahren sei nötig.
Muster erkennen und nutzen
Dazu kommt, dass der genetische Code aus G,A,T und C nicht alles ist. Denn der epigenetische Code wirkt wie eine Art Überbau. Von ihm ist abhängig, wann und wie oft welche Gene abgelesen werden. So bestimmt der epigenetische Code die Produktion der im Genom codierten Proteine und damit den Stoffwechsel mit.
Als epigenetische Modifikationen werden kleine Molekülreste, etwa Methyl- oder Acetylgruppen, bezeichnet, die an Genabschnitten angehängt sind und diese aktivieren oder hemmen können. Bislang bereitete das Lesen des epigenetischen Codes Schwierigkeiten. Gängige Sequenzier-Technologien sind nicht in der Lage, diese Anhängsel am Erbmaterial zu erkennen und epigenetische Muster auszulesen. Die Nanopore-Technologie - ebenfalls eine Methode zum Lesen von Erbgut-Abschnitten - dagegen kann inzwischen etwa Methylgruppen miterkennen.
Wichtig wird es bei der Basensequenz und auch bei epigenetischen Markierungen sein, in den riesigen Datenmengen therapeutisch nutzbare Muster der Mechanismen, die Tumorwachstum verursachen oder begünstigen, zu entdecken. So wäre es möglich, ein vertieftes Verständnis von Entstehung und Fortschreiten von Tumoren zu gewinnen“, sagt Eils. NGS versetze Mediziner in die Lage, molekulare Charakteristiken von Tumoren in Breite und Tiefe sowie die molekularen Treiber individueller Krebserkrankungen aufzudecken: Für einzelne Tumor-Arten könne man auch „molekulare Profile erstellen und eine Tumorart in Untergruppen einteilen.“
Die Genomsequenzierung des Tumorgewebes ergibt idealerweise ein detaillierteres Profil der Gene und schon geschehenen krankheitsrelevanten Mutationen. Ein Beispiel: Patienten mit einem Melanom haben oftmals eine krebsverursachende Mutation im BRAF-Gen. Es gibt mittlerweile sogenannte BRAF-Inhibitoren, die das mutierte Gen blockieren. Australische Forscher haben nun Hinweise gefunden, dass eine bestimmte seltene Untergruppe von Eierstockkrebs ebenfalls durch ein mutiertes BRAF-Gen bedingt ist. Das Mittel gegen Melanom könnte in diesem seltenen Fall helfen. „Allerdings ist so etwas nur erfolgversprechend, wenn es sich um genau dieselbe Mutation im BRAF-Gen handelt“, sagt Singer.
Ziel: Individuelle Therapien
Das Ziel sei letztendlich, eine für jeden Krebspatienten individuelle Therapie zu finden. Das sei weder billig noch einfach. „Wir fangen gerade erst an zu verstehen, wie die Antwort der Tumorzellen auf eine Therapie durch seine Mikro-Umgebung beeinflusst wird“, sagt Eils. Denn jene Mikro-Umgebung mit Faktoren wie etwa Stoffwechselprodukten dort oder auch pH-Wert, ist neben Genen und Epigenetik der Tumorzellen ein weiterer wichtiger Faktor. „Wenn wir dieses Know-how haben, können wir genauer vorhersagen, wie ein Patient behandelt werden sollte und wie er auf die Behandlung ansprechen wird.“
Technisch sei vieles bereits machbar, sagt Eils, „aber wer finanziert das Ganze?“. Die Kosten für die Genomsequenzierung selbst seien durchaus tragbar. „Aber die Kosten für daraus abgeleitete neue zielgerichtete Therapien sind oftmals höher als für herkömmliche Chemotherapien“. Dafür seien sie aber auch wirksamer und die Folgekosten geringer.
Ein weiteres Problem ist der Datenschutz. Das genetische Profil eines Menschen ist wie sein Fingerabdruck einzigartig und kann ihn identifizieren, wenn irgendwo Name und genetischer Fingerabdruck zusammen abgespeichert sind. Und Daten können immer, wenn sie in die falschen Hände geraten, auch missbraucht werden. Trotz aller Hürden und Vorbehalte aber, sagt Eils, sei die Entwicklung der genombasierten Diagnostik „alternativlos und muss zu einer individualisierten Therapie passend zu Tumor und Mutation führen.“
Professor Roland Eils ist auch wissenschaftlicher Direktor des in Partnerschaft mit dem Tagesspiegel veranstalteten Kongresses Future Medicine 2018.