Speaker #1: [Barbara Strobl] Der Code des Lebens wird präsentiert von GHGA. Dem Deutschen Humangenom-Phänomarchiv. Viel Spaß bei der heutigen Folge: Die menschliche Zelle: eine Anleitung, viele Aufgaben. In der heutigen Podcast Folge geht es um die menschliche Zelle. Wir erklären warum es verschiedene Zellen gibt, warum man einen Atlas für Zellen braucht und warum KI, also künstliche Intelligenz, helfen kann unsere Zellen besser zu verstehen. In den vergangenen Podcast Episoden habe ich immer wieder unterschiedliche Gleichnisse für die DNA verwendet und auch heute habe ich wieder ein Beispiel dafür: Stellen wir uns also vor wir haben ein Kochbuch und dieses Kochbuch ist unsere DANN. Je nachdem welches von den Rezepten im Kochbuch man tatsächlich zubereitet, steht natürlich ein komplett anderes Gericht auf unserem Teller. Es kann sein, dass man ein Gericht besonders gern mag und deshalb gleich die dreifache Menge davon kocht oder es kann sein, dass man unterschiedliche Rezepte zubereitet und so ein Fünfgängemenü zubereitet. Die Anleitung ist also immer die Gleiche, das ist das Kochbuch, was dabei herauskommt variiert aber je nachdem welchen Teil der Anleitung man tatsächlich verwendet. Und genauso ist es mit unserer DNA. In jeder unserer Zellen haben wir genau die gleiche DNA also die gleiche Anleitung und trotzdem kommen ganz unterschiedliche Zellen heraus und das ist, weil jede Zelle auch unterschiedliche Gene verwendet. Mehr zur menschlichen Zelle erklärt uns unser heutiger Gast Professor Fabian Theis. Fabian, könntest du bitte dich und deine Forschung vorstellen.
Speaker #2: [Prof. Dr. Fabian Theis] Hallo, ich heiße Fabian Theis und ich bin Professor für Computerbiologie hier an der TU München und am Helmholtz Zentrum München. Helmholtz Munich machen wir große Modelle für biologische Datenanalysen von Molekülen bis hin zu phänotypischer Variation. Komisches Wort „phänotypische Variation“ - im Prinzip: Ähnlichkeiten über Patienten, solche Sachen und da gibt es mittlerweile so große Daten in unserem Feld, dass man da wirklich verschiedenste Arten Künstliche Intelligenz, machine learning Methoden braucht. Das ist das wo wir Experten sind für.
Speaker #1: [Barbara Strobl] Und was motiviert dich an der Schnittstelle zwischen Computerwissenschaften und Biologie zu forschen?
Speaker #2: [Prof. Dr. Fabian Theis] Ja da gibt's immer so zwei Sachen. Ich finde zum einen, was ich super spannend schon immer irgendwie fand, ist die Tatsache, dass man halt einfach auf großen Daten rumspielen kann, also wirklich einfach das rein Methodische. Da komme ich her. Ich habe ursprünglich Mathe und Physik gemacht und da wirklich einfach mich mit methodischen Themen auseinandergesetzt. Ich habe aber da mich dafür interessiert einfach mit so ganz großen Datenmengen Muster finden. Maschinelles Lernen, das ist das was wir machen also KI, das heißt eigentlich Sinn in Unordnung reinbringen. Wenn man so will, das finde ich echt spannend, der ist, vielleicht das letzte Jahrhundert so das Jahrhundert der Physik gewesen. Ja ganz viele Revolutionen, Nobelpreiserichtungen, - keine Ahnung: von der Kernphysik bis zu, dass man Raketen auf Mond gebracht hat oder was. Und die Sprache, die man dafür gebraucht hat, war die Mathematik, offensichtlich. Ja weißt du, wenn ich jetzt irgendwie einen Ball schmeiße, dann kann ich halt ausrechnen wo der hinfliegt. In der Biologie, was viele vielleicht auch so bisschen sagen jetzt: „Das große Problem des 20. Jahrhundert, die Biologie oder Biomedizin.“. Da ist es halt nicht ganz so klar, weil wir so ein komplexes System sind: unser Körper, unsere Zellen, - weil alles da so komplex interagiert, dass es da einfache, klare komplett richtige Gleichungen gibt. Wir sind komplexe Systeme. Dafür braucht man eben statistische Methoden und wenn man so will kann man sagen, dass da das machine learning oder die KI eben die Sprache dafür sein könnte um eben diese Komplexität zu entwirren. Deswegen interessiere ich mich für data science. Das ist der rein methodische Teil. Dann kommt natürlich der anwendungsorientierte Teil. Ich find’s halt einfach super fascinating, dass wir als Menschen aus einer einzigen befruchteten Eizelle entstanden sind. Diese ganze Komplexität die wir sind aus einem Ding. Ja wie geht denn das? Alle unsere Zellen haben das gleiche Programm aber machen diese verschiedenen Sachen die Zellen in unserem Körper tun. Natürlich wenn wir dann krank werden, sind es auch wieder Prozesse die auf der zellulären Ebene ablaufen die man irgendwie doch verstehen müsste. Ich habe mich ja schon immer irgendwie für Computer interessiert, - hat man schon immer Spaß gemacht seit meiner Kindheit, und wenn man so will, sind diese Zellen jetzt so biologische Äquivalente. Die sind auch so kleine Computer, die äußere Einflüsse nehmen und dann irgendwie Entscheidungen treffen ob sie weiterwachsen, ob sie absterben und so und das quasi zu verstehen, dafür auch Modell zu entwickeln, - das finde ich total spannend. Und wenn man das kann, dann löst man natürlich auch alle möglichen Anwendungsprobleme.
Speaker #1: [Barbara Strobl] Du hast jetzt mehrfach die Zelle erwähnt. Vielleicht gehen wir noch mal kurz einen Schritt zurück. Könntest du uns kurz erklären: Wie sieht so eine Zelle eigentlich aus?
Speaker #2: [Prof. Dr. Fabian Theis] Wir haben vielleicht alle von uns schon irgendwann mal in so ein Mikroskop reingeschaut, vielleicht von Zwiebelzellen oder sowas. Zellen sind, wenn man so will, die kleinste Einheit des Lebens ja. Das heißt die Biochemie, die da funktioniert, ist eben in so eine Membran gewickelt und das sind eben kleine Einheiten die sich vervielfältigen können, die sie teilen können, sich kopieren können und dann eben multizelluläre Organismen auch ausmachen. Und da können dann eben Zellen verschiedene Spezifikation, also bestimmte Aufgaben, übernehmen die dann das gesamte Ding dann halt am Leben hält. Und wenn man so in das Mikroskop reinschaut dann sieht man vielleicht Pflanzenzellen die bisschen größer sind aber so Menschliche oder so Zellen von Wirbeltieren die sind so eine Größenordnung von ein paar Mikrometer groß, - also verschiedene Formen ganz, ganz unterschiedliche Größen, ganz Kleine. Meistens haben die einen Nukleus drin, - vor allem die dann, also einen Zellkern haben, wo dann die DNA eingepackt ist, die dann abgelesen wird und dann Routine macht, die dann irgendwelche Aufgaben ausführen. Das ist echt so eine ganz kleine, sehr komplexe Maschine.
Speaker #1: [Barbara Strobl] Die menschliche Zelle ist also sehr klein. Sie ist mit dem bloßen Auge nicht sichtbar. Die Zellen sind die Grundbausteine unseres Körpers, - also jedes Gewebe und alle Organe bestehen aus vielen verschiedenen Zellen. Beispiele sind Nervenzellen, Hautzellen oder Muskelzellen. Alle Zellen haben einen Zellkern und darin liegt die DANN. Die einzige Ausnahme dafür sind die roten Blutkörperchen. Das heißt aber, dass alle Zellen die gleiche Anleitung haben. Wie kommt es dann dazu, dass sie unterschiedliche Aufgaben im Körper erfüllen können. Also wie kann es sein, dass man mit einer Anleitung zu unterschiedlichen Funktionen kommt?
Speaker #2: [Prof. Dr. Fabian Theis] Ja, das ist echt faszinierend, oder? Die DNA sind uns allen gleich, bis auf kleine Mutationen die manchmal korrigiert werden, manchmal auch nicht, - eigentlich ist die überall dieselbe. So 2 Milliarden Basenpaare, wenn man so will „Zeilen“, lang. Wenn man es ausrollt, das Programm von der Zelle, dann ist es glaub so 2 m hoch oder sowas: In jedem kleinen Zellkern so ein komplexes Ding drin. Und überall das Gleiche, - aber verschiedene Sachen sind eben verschieden aktiv in verschiedenen Zellen. Das ist so diese, das nenn ich Wunder oder die Cleverness der sogenannten Genregulation, dass halt unterschiedliche Programme in unterschiedlichen Zellen benutzt und aktiv werden und „an“ sind. Zum Beispiel diese pluripotente Stammzelle, also diese Eizelle, die dann eben alles macht was wir sind und noch bisschen was drüber hinaus, was dann so bei der Geburt dann wegkommt und auch vorher. Das hat noch ganz viele Programme aktiv und dann, werden da zum Beispiel dann erstmal so die drei Keimblätter gemacht, was das Innere ist, Ektoderm und auch so Blutsachen. Und diese immer weitere Differenzierung, das ist echt ein faszinierender Prozess. Manche Leute vergleichen das, - das heißt auch manchmal „Waddington‘s landscape“ mit wirklich so einer Landschaft. Wie man sich das so vorstellen kann: du hast ja die Zugspitze, da sitzt da oben die Eizelle drauf. Die hat dann alle Möglichkeiten noch die sie machen kann. Die rollt dann sozusagen runter in verschiedene Täler. Und einmal rollt sie in das eine Teile, da wird sie der eine Zelltyp, manchmal ins Andere, ins Dritte. Weil sie sich eben teilen kann kommen sozusagen verschiedene Zelltypen auch raus und das Runterrollen bedeutet dann, dass da halt manche Programme angehen. Es gibt verschiedene biochemische Prozesse wie das geht, das nennt man auch oft „Epigenomik“, - aber ohne da jetzt zu sehr drauf einzugehen, - wenn du quasi überall in den Zellen nur die DNA auslesen würdest, würdest du nicht merken was die eigentlich machen. Aber wenn du ausliest was die produzieren, die DNA, das Programm der Zelle, das wird abgelesen: sogenannte messenger RNAs mRNA, - sicher ganz viele schon gehört nach der Covid-Krise mit den mRNA vaccines, mit diesen messenger RNAs sind eben kleine Stückchen von einsträngiger RNA eben dann, die dann eben zu Proteinen weiter abgelesen wird. Weil diese Dinger, die kann man halt auch lesen und die sind unterschiedlich. Das heißt, du kannst pro Zelle viele von diesen mRNAs messen. Damit weißt du dann was die macht. Das heißt du kann sogar diesen Zellzustand, oder was die Zelle eben da gerade macht, durch Messungen vieler dieser mRNAs machen. Und das ist dann sehr, sehr unterschiedlich zwischen den einzelnen Zellen, obwohl die alle die gleiche DANN haben.
Speaker #1: [Barbara Strobl] Wiederholen wir nochmal schnell die Grundlagen der Genetik. In unserem Zellkern ist die DANN, - das ist die volle Anleitung. Von gewissen Abschnitten der DNA werden dann Kopien gemacht. Das ist dann die mRNA und das ist dann die Anleitung für die Proteine. Wenn wir das jetzt auf das Gleichnis vom Anfang übertrage, also das Kochbuch, dann ist eben das Kochbuch die DNA die in jeder Zelle komplett vorhanden ist. Die mRNA wäre dann sozusagen eine Kopie von dem jeweiligen Rezept das man vorhat zu kochen. Und das fertig-gekochte Gericht, das entspricht dann den Proteinen der Zellen, - also das ist sozusagen die Aufgabe die diese Zelle hat. Fabian hat es in seiner Erklärung hier gerade Programm genannt. Wenn man sich jetzt also das gesamte Kochbuch, also die gesamte DNA ansieht, dann weiß man nicht wirklich was diese Zelle für Aufgaben hat. Wenn man sich aber nur die Kopien der Rezepte, also die mRNA-Abschnitte ansieht, dann weiß man was diese Zelle machen wird. Aber woher weiß die Zelle wohin sie überhaupt möchte? Also wenn man sich diese Waddington‘s landscape vorstellt, woher weiß die Zelle in welches Tal sie rollen möchte und welche Aufgaben sie später erfüllen möchte?
Speaker #2: [Prof. Dr. Fabian Theis] Diese Frage, - ja also wenn man so will, ist das tatsächlich eine der „Holy Grails“ in der Zellbiologie. Wie funktioniert denn tatsächlich diese Entscheidung? Was ist denn der kausale Grund, dass die eine Zelle das macht die andere Zelle das macht? Selbst wenn du jetzt diesen Zustand kennst. Was ist der Kausal dahinter? Also was treibt es an? Da kann man eine ganze Reihe von speziellen Antworten geben. Wir wissen z.B., dass für bestimmten einen Subzelltyp an Blutzellen irgendein Transkriptionsfaktor, ein bestimmtes Gen an ist. Das heißt dann GATA 1 oder sowas. Das macht dann das was das Gegenüber PU.1 anderes macht. Da gibt es so verschiedene Gene, die verschiedene Sachen machen. Aber so eine allgemeine Beschreibung, wie das was wir mit unseren KI-Methoden im Prinzip machen wollen. Wir möchten eigentlich feststellen, dass wenn ich eine Zelle nehme, ich deren Zustand vielleicht noch ein bisschen mehr messe, dass ich dann wirklich vorher sagen kann: Was macht die als nächstes? Und die Wahrscheinlichkeit ist natürlich nicht perfekt fürs Vorhersagen. Das heißt ich kann z.B. von der Stammzelle kann ich nicht sagen: Was macht die als nächste Zelle? Sondern ich kann sagen: Zu 30 % macht es die, zu 20 % die, zu 30 % was Anderes oder sowas. Also mit Wahrscheinlichkeiten muss man dann arbeiten, um dann eben sagen zu können, dass das insgesamt dann so eine Population an Zellen machen kann.
Speaker #1: [Barbara Strobl] Also verstehe ich das richtig: Das ist bis heute noch nicht endgültig geklärt?
Speaker #2: [Prof. Dr. Fabian Theis] Absolut nicht, absolut. Also es ist wirklich, nicht nur nicht nur ein Holy Grail, sondern echt ein hartes, offenes Problem, - meiner Meinung nach vielleicht sogar das Problem, wie man auch in menschliche Gesundheit also auch nicht-zellulär, eine ganze Reihe von Antworten finden kann. Und wenn man natürlich Medikamente entwickeln möchte, dann möchten wir wissen wie die auf Zellen wirken. Wenn ich jetzt ein Modell habe, das die Antwort einer Zelle auf eine sogenannte Perturbation, also eine Veränderung, vorhersagen kann, dann habe ich im Prinzip schon das Problem gelöst, weil ich gucken kann: Was machen den die verschiedenen Sachen? Das heißt so ein Modell zu bauen, das ist alles andere als gelöst. Da gibt's erste Schritte dahinter, aber das ist ein richtig schweres Problem und auch ein sehr schönes und spannendes, wo ganz viele Leute auch dran arbeiten, - was uns auch sehr busy hält.
Speaker #1: [Barbara Strobl] Und trifft das dann auch auf die Embryogenese zu? Also wenn sich die menschlichen Zellen kurz nach der Befruchtung anfangen zu differenzieren. Weiß man hier auch nicht wirklich, wie diese Zellen diese Entscheidung treffen, welche Art von Zelle sie jeweils werden?
Speaker #2: [Prof. Dr. Fabian Theis] Guter Punkt. Was ich jetzt gesagt habe, was nicht bekannt ist, ist wie man sozusagen das in der größten Allgemeinheit beschreiben kann. Für ganz, ganz viele so bestimmte Übergänge, bestimmte Differenzierungsfragen oder auch bestimmte Fragen was in der Krankheit passiert, gibt es natürlich sehr, sehr viel Information. Das ist das Schöne an der Biologie: Es gibt unheimlich viele Paper, es gibt unheimlich viele wissenschaftliche Erkenntnisse, Wissen und Fortschritt, der immer den ein oder anderen Aspekt beleuchtet. Zum Beispiel wenn wir jetzt gerade über Embryogenese reden: In einfachen Organismen ist es sogar komplett „ausgemapt“, wie wir sagen, also komplett aufgelöst. Also das größte Reich des Lebens sind Einzeller. In Einzellern sind viele von den Fragen irgendwie anders. Also die differenzieren ja nicht, - weiß du die vervielfältigen sich halt aber auch da kann man sagen: Wann ist denn der Zustand da, wann so ein E. coli Bakterium jetzt bleibt und wann es plötzlich halt in Proliferation geht. Das kann man z.B. sagen, wenn halt genug Essen dann unter ist, dann macht es diese eine oder diese andere Art von biochemischen pathways an um sich dann eben das Essen zu nehmen und dann zu vervielfältigen. In mehrzellulären Organismen ist das zum Teil auch bekannt, also z.B. in einer bestimmten Sorte von Fadenwürmern, die ganz bekannt ist, die heißt C. elegans, - das ist eins der bekannten Modellsysteme, - da haben wirklich Forscher schon alle möglichen Differenzierungsschritte ausgeschrieben. Da kommen dann ein paar tausend Neurone raus, die der Wurm dann am Schluss im Gehirn hat. Das nicht viel, - ist ein total kleines Ding. Und da weiß man wirklich was Schritt für Schritt passiert. Da ist es sogar deterministisch. Bei komplexeren Organismen, so wie Mäusen, Affen oder wir, - da ist es so, dass da viel statistisch auch nur passiert. Also da kann man quasi nicht der Reihe nach alles detailliert hinschreiben. Aber auch da sind ganz viele von den Übergängen natürlich ausgemerkt und beschrieben. Ebenso auch in bestimmten Krankheiten dann und so weiter. Aber wie gesagt: In der Allgemeinheit, - da ist es nicht bekannt und natürlich auch nicht in dieser Verknüpfung mit kausalen Veränderungen. Kausal heißt, wenn ich irgendwie was mit Absicht hervorrufen möchte, dass ich dann wirklich eine Änderung mache. Was muss ich denn da wirklich machen? Was muss ich da drauf schmeißen um dann das in eine andere Richtung zu bringen, weil ich halt eine Krankheit behandeln möchte oder so? Und das ist noch offen.
Speaker #1: [Barbara Strobl] Vieles weiß man heute also schon. So ganz generell, wie sich eine Zelle entscheidet, was sie für Aufgaben erfüllen wird, das weiß man eben noch nicht? Aber wie viele unterschiedliche Möglichkeiten gibt es denn hier überhaupt? Also aus wie viel unterschiedlichen Zelltypen besteht der Mensch?Speaker #2: [00:14:02] [Prof. Dr. Fabian Theis] Sehr gute Frage, - kann man lang drüber diskutieren. Ich bin ja in diesem Menschlichen Zellatlas Projekt, Human Cell Atlas Projekt unterwegs, - bin auch im Organizing Committee und baue da für manche Organe Atlanten mit, mit ganz vielen Kollegen, - riesiges internationales Projekt. Und bei unseren ersten Treffen ist auch immer die Diskussion aufkommen, jetzt erstmal nicht wie viele, sondern eher mal: „Was ist ein Zelltyp überhaupt?“. Wie definiert man das? Weil was du nicht definieren kannst, kannst du auch schlecht zählen. Das heißt, wie kann man da eine Übersicht kriegen? Wenn man z.B. bei Wikipedia guckt, - das ist typischerweise was man vielleicht erstmal macht, wenn man wissen möchte: Wie viele gibt es z.B. von Gehirnzellen? Da stehen da vielleicht, weiß nicht ob es jetzt noch so ist, aber vor paar Jahren was so, - da stehen dann irgendwie 9 oder 10 verschiedene Zelltypen drin. Zwei Sorten von Neuronen, da gibt's ja noch irgendwelche Gliazellen und so zählt man ein bisschen auf, was da so drin ist. Turns out, wenn man dann eine andere Art von Bestimmung macht, was so eine Zelle kann, z.B. eben diese mRNA-Zellen, von den ich da gerade gesprochen habe. Wenn man alle auf einmal zählt die so da sind, dann nennt man das ein Transkriptom, also nicht nur ein Transkript. Und wenn man die dann nach Ähnlichkeiten gruppiert, kriegen Kollegen gerade über 1000 verschiedene Zelltypen im Gehirn raus, die relevant sind. Meistens ist es so, dass es halt so Obergruppen gibt wie Immunzellen, dann Epithelzellen, - also verschiedene Sorten von groben Zellen. Und dann zoomt man rein und dann kommen da immer wieder Untertypen. Was man also eigentlich jetzt gerade glaubt ist, dass halt, - es gibt sozusagen den Raum aller Zellen, wenn man z.B. den mit Transkript und anderen Sachen misst, dann sind da halt irgendwelche Punkte drin. Und in bestimmten Regionen sind dann ganz viele von diesen Punkten, das sind ganz viele von den Zellen da und wenn die dann ganz viele sind, dann nennt man das halt Zelltyp. Wo man dann Rand macht, den kann man eben ganz grob machen oder man zoomt da rein, dann kriegt man wieder Untertyp und Untertyp. Das ist so, wie wenn man uns Menschen irgendwie hinstellt, ganz viel auf einmal. Dann kannst auch fragen: Wie viele Typen von Menschen gibt's denn?“. Der Eine oder Andere sagt: „Da gibt’s erstmal junge, mittelalte, alte.“, oder sowas. Oder ein Anderer sagt dann: „Da gibt's welche die Männer oder Frauen sind.“. Aber immer gibt's wieder was dazwischen, - in allen von diesen Dingern auch. Das heißt diese Subauflösung ist halt auch bei den Zellen nicht sehr eindeutig. Was wir halt machen ist dann ganz konkret für Organe, dass wir dann solche Kategorien eben aufbauen. Wir haben z.B. gerade ein menschlichen Lungenatlas gemacht und haben auch eine Oberkategorie, wo wir dann drei Zelltyparten erstmal annotiert haben und dann gehen wir runter: Da kommen wir auf bis zu 100 verschiedenen Zelltypen dann z.B. an der Lunge.
Speaker #1: [Barbara Strobl] Das gerade erwähnte Transkriptom ist also die Summe der ganzen RNA in einer Zelle. Das würde in unserem Gleichnis also allen Kopien von den Rezepten entsprechen. Dieses Transkriptom zeigt die Unterschiede zwischen den Zellen aber trotzdem ist es nicht ganz eindeutig wie viel Zelltypen es wirklich gibt, weil die Abgrenzung nicht so einfach ist. Der eben erwähnte Human Cell Atlas beschäftigt sich mit dieser Frage. Aber was gen au sind denn die Ziele von diesem Projekt?
Speaker #2: [Prof. Dr. Fabian Theis] Der Menschliche Zellatlas hat das Ziel so eine Art „Kategorisierung“ oder „Inventur“ aller menschlichen Zellen zu machen. Das ist das ganz große Ziel, - natürlich mit allen möglichen Problemen, weil halt wir Menschen alle unterschiedlich sind. Das heißt wenn ich Zellen aufmache, dann ist es über Menschen verschieden. Jetzt nehmen wir mal an: Wir haben erstmal ein Modellmenschen und da haben wir natürlich dann auch verschiedenste Organismen, und wir haben ja vorhin schon gesagt, dass es Billionen von verschiedenen Zellen gibt. Das heißt wenn man einen Zellatlas baut, dann kann man natürlich nie hoffen alle Zellen auf einmal zu messen. Und das ist auch gar nicht notwendig, weil wenn man halt paar Repräsentanten einer Kategorie von bestimmten Zelltypen oder von ähnlichen Zellen hat, dann reicht es auch aus. Was wir im Prinzip machen wollen ist, weil es eben diese Techniken gibt um diese Einzelzell-Genexpression machen zu könne, ist eben halt erstmal diese Kontrolle zu bilden. In viele Hinsicht sehen das Leute so ein bisschen als so eine Art „spiritual success“, also ein spiritueller Nachfolger des menschlichen Genomprojektes, wo man halt auch so eine Art Inventur des menschlichen Genoms eben gemacht hat. Und man auch festgestellt hat, dass „Hey das Genom ist nicht alles gleich“. Erstmal macht man so eine Referenz und dann vergleicht man das was eben unterschiedlich ist. Und eins der Ziele des GHGAs ist ja auch dann eben Zugriff auf die Variationen Genom zu machen. Genauso kann man bei dem Zellatlas jetzt eben auch erstmal einen Referenzatlas machen der auch aus verschiedensten Leuten schon mal zusammen besteht um dann eben die Varianz über Leute zu machen und dann kann man auch natürlich Krankheiten wieder drauf machen. Erstmal ist es wirklich so eine Ressource die dann extrem nützlich für verschiedene Downstream-Fragen sein wird.
Speaker #1: [Barbara Strobl] Könntest du uns noch erklären, warum es überhaupt so wichtig ist diese Zellunterschiede so genau zu kennen?
Speaker #2: [Prof. Dr. Fabian Theis] Also da gibt's auch wieder zwei Antworten. Es kommt drauf an was du machen willst. Also wenn du wirklich versuchen willst zu verstehen was passiert, - ja wenn du wirklich sozusagen Modell der Wirklichkeit bauen möchtest, dann möchtest natürlich irgendwie halt verschiedene Einflüsse, verschiedene Sachen versuchen zu verstehen. Und wenn du halt so tust, als wären wir nur so ein Mittelwert aus den verschiedenen Sachen, dann kann man halt nicht so richtig verstehen was passiert. Das ist so wie wenn du eine Schulklasse anschaust meinet wegen und sagst der mittlere Schüler ist halt halb junge, halb Mädchen, so ungefähr, weißt du? Das gibt's halt gar nicht. Genauso ist halt so ein Mittelwert von einer Zelle: den gibt's halt dann auch nicht. Für eine Reihe von Fragestellungen ist es dann trotzdem ein bisschen egal, - manchmal geht es auch so. Aber wenn du wirklich mechanistisch versuchen willst was zu verstehen: Warum alles, keine Ahnung, diese Moleküle da hochkommen oder so, - dann musst halt irgendwie wissen, was in der Zelle passiert. Das ist sozusagen das das Argument warum es sinnvoll ist. Natürlich machen wir alles komplizierter und so und die Analysen sind schwerer, also wen wir es machen. Für die Diagnostik, also gar nicht jetzt um das Verstehen besser zu machen, aber einfach nur um irgendwas rauszufinden, um dann halt zu sagen: Hey da gibt's die Krankheit ja oder nein, - dafür kann es auch helfen. Wenn man jetzt irgendein Objekt betrachtet das unabhängig ist von der Zelle, wie z.B. die DNA haben wir gerade gesagt und das Programm, wissen wir, in Allen das Gleiche ist. Du brauchst natürlich nicht, - da machst einfach Mittelwerte von hunderttausenden von Zellen. Manche Sachen aber, gerade wenn es halt irgendwie ganz bestimmte, - also die meisten Krankheiten entstehen meistens nicht in allen Zellen zugleich, sondern die sind halt irgendwie spezifischer. Wenn du eine Infektionskrankheit hast, dann schaust in der Lunge in bestimmten Lungenbläschen oder sowas. Wenn du irgendein Krebs hast, ist der halt auch nur in einem gewissen Areal. Wenn du jetzt da so eine Biopsie nimmst und das ja ganz viel „Nicht-Krebs-Gewebe“ dabei, dann verschlechterst du halt sozusagen dein Signal. Das heißt am liebsten hättest du eine Technik, die sensibel, sensitiv auf irgendwie eine bestimmte Sache reagiert, die dann für dich wichtig ist, z.B. eben diese eine Tumorzelle oder sowas. Wenn du die rausfinden kannst, dann kannst sagen: „Hey da ist noch irgendwie was übrig“, was deine Bestrahlung nicht erwischt hat und dann musst du mit der weitermachen. Übrigens, Tumorzelle ist kein so ganz gutes Beispiel wo du ein Transkript brauchst. Bei Tumorzellen ist oft auch wirklich eine genetische Veränderung drin. Das heißt, da siehst du ja auch was auf der DNA unterschiedlich. Aber im Prinzip ist das so eins der Beispiele, genauso bei Infektion und so weiter.
Speaker #1: [Barbara Strobl] Bei der Recherche zu diesem Thema bin ich oft über das „Smoothie-Beispiel“ gestolpert. Das Smoothie Beispiel erklärt, dass die bisherigen Sequenziermethoden einem Obstsmoothie gleichen. Man hatte also viel unterschiedliches Obst, oder in unserem Fall viele unterschiedliche Zellen, die alle zusammengeworfen und vermischt waren. Mit der Einzelzell-Sequenzierung kann man dann also das erste Mal tatsächlich jedes Obst für sich selber oder eben jede Zelle für sich selber genauer ansehen und so auch die Unterschiede zwischen den einzelnen Zellen herausfinden. Aber warum genau ist KI, also künstliche Intelligenz, im Zusammenhang mit Zellen so wichtig? Liegt das einfach daran, dass die Daten so enorm groß sind, dass es keine andere Analysemöglichkeiten mehr gibt?
Speaker #2: [Prof. Dr. Fabian Theis] Also erstmal bin ich fest davon überzeugt, dass, sogar unabhängig von der Größe der Datensätze, in fast allen biomedizinischen Fragestellungen Künstliche Intelligenz helfen wird, weil wir als Menschen oder als Organismen halt nie einfach sind. Wir sind halt nicht nur ein Datentyp, sondern es passiert alles, - ganz viel, zugleich. Das heißt, du kannst natürlich das jetzt kompliziert machen, wenn du solche multimodalen Messung machst von denen wir gerade gesprochen haben, - aber selbst wenn du die nicht machst, dann gibt's halt so Historie: Du warst vorher schon beim Arzt, hast das angeschaut, du hast vielleicht irgendwie mal da Blut abgenommen, dann hast du noch hier Gewicht gemessen und dann hast du vielleicht noch ein Zeitverlauf mit irgendwelchen EKG-Daten sowas gemacht. Das heißt, wir sind an sich komplex und diese verschiedenen Projektionen, die dann Messungen sind, die wir zu verschiedenen Zeitpunkten von uns haben oder vielleicht auch Behandlungen wie Medikamente und sowas, die sind halt einfach da. Was wir z.B. wirklich gemacht haben, ist dass wir diese Techniken, die wir zur Einzelzell-Analyse nehmen, auch nehmen um Variation über Menschen zu lernen, - haben gerade ein Paper rausgebracht, wie wir solche Sachen beschreiben und dann auch so Trajektorien und sowas suchen. Im Prinzip brauchen wir KI um diese Komplexität herzu werden. Meine Vision für Medizin der Zukunft ist tatsächlich, und das ist glaub ich nicht nur eine der Anwendungen, - das teilen glaub ich ganz, ganz viele Kollegen, - ist dass du im Prinzip im Hintergrund so eine KI oder ein Modell, wenn du so willst, hast, die dann Information die über mich mal zusammengebracht haben, - die ich dann auch nur freigeben kann, alles datensicher und so, - abgebildet werden kann auf die Variation die es halt so in Menschen gibt, um dann zu gucken: „Hey das ist bei mir im gesunden Bereich, das nicht.“. Aber das eben davon weggeht, von dieser Werte-kontrollierten Sache, wie wenn diese eine Blutwert zwischen 80 und 120 ist, dann ist es gut sonst ist es nicht, - das ist halt einfach zu einfach. Weißt du, weil es alle möglichen anderen Sachen auch noch gibt, die damit zusammenhängen, - die ich als Mensch aber gar nicht so einfach verstehen kann. Aber wenn ich mal als Arzt unterstützt werde, eben von so einem komplexen Modell, dann kann ich eben Sinn machen aus diesen ganzen komplexen Daten.
Speaker #1: [Barbara Strobl] Die künstliche Intelligenz hilft also vor allem bei der Komplexität dieser Daten. Aber spielt die Größe der Daten hier auch eine Rolle?
Speaker #2: [Prof. Dr. Fabian Theis] Ja das schöne daran, dass diese Techniken jetzt so hoch skaliert sind, dass eben im Vergleich zu den Anfängen, die natürlich sehr bescheiden waren von der Anzahl, heutzutage in typischen Experimenten zehn- bis hunderttausende von, vielleicht sogar bis zu Millionen von Zellen, in einem einzigen Experiment beobachtet und pro Zelle dann eben diese zwanzig-, dreißigtausend Werte oder sowas zugleich noch hat, also wirklich riesige Datenmengen, die dann entsprechend angeguckt werden können. Und idealerweise, und deswegen macht es das jetzt auch so spannend, nicht nur an sich angeguckt werden können sondern abgebildet werden auf so einer Referenzkarte, wie z.B. dieser menschliche Zellatlas. Das heißt, wenn du jetzt die Lunge z.B. von deinem Patienten jetzt machst, dann kannst du es projizieren auf das was wir als gesunde Referenz haben und kannst gucken: „Hey da bin ich so im normalen Bereich, - oh und da ist irgendwas anders.“.
Speaker #1: [Barbara Strobl] Die Schnittstelle zwischen Computerwissenschaften und der Genetik ist ja doch sehr spezifisch. Ist es schwierig für diesen Bereich Nachwuchsforschende zu finden?
Speaker #2: [Prof. Dr. Fabian Theis] Weißt du Talente in KI finden, - aber vielleicht auch in MINT generell, aber in KI speziell Talente zu finden, dann auch dir auszubilden und dann eben nicht nur in der Forschung, sondern natürlich dann auch in der Industrie, sei es jetzt in der Biomedizin, auch drüber hinaus, - zu bekommen, - das halt ich halt für ein ganz, ganz wichtiges Thema. Das ist auch, glaube ich was uns im Prinzip hier in Deutschland Standortvorteil verschafft, dass wir halt hier tolle Universitäten, tolle außeruniversitäre Forschungseinrichtungen haben, dass wir da eben an der Ausbildung wirklich gut dranbleiben.
Speaker #1: [Barbara Strobl] Wie ist denn für die meisten Leute der Zugang zu dieser Schnittstelle? Also studiert man eher vorher Computerwissenschaften und kommt dann in die Biologie oder studiert man vorher Biologie und kommt dann ein bisschen in die Computerwissenschaften?
Speaker #2: [Prof. Dr. Fabian Theis] Ja eigentlich so ein ganz guter „Mischmasch“. Also da kommen eine ganze Reihe von den Domänenwissenschaften, das heiß Biologie, Medizin und so weiter rein, -aber viele auch, die aus der Computerwissenschaft, aus der Mathematik, aus der Physik kommen, die sich dann eben für die Domäne mehr interessieren und dann sozusagen an diese Schnittstelle gehen. Ich glaub ganz viel moderne Forschung passiert eben mal den Schnittstellen und Bioinformatik, Computer-Biomedizin und sowas ist eben gerade so eine wirklich spannende Schnittstelle, so was passiert. Das passiert oft zwischen Bachelor-Master aber oft dann auch erst danach, für die Doktorarbeit. Ich habe z.B. in München diese Munich School für Data Science aufgebaut, wo wir eben auch solche Schnittstellendisziplinen dann eben erforschen, insbesondere eben auch in der Biomedizin und in den Lebenswissenschaften.
Speaker #1: [Barbara Strobl] Zum Schluss wüsste ich noch gerne, wie du die Zukunft, also ca. die nächsten 10 Jahre von dieser Schnittstelle zwischen KI und Genetik siehst. Also wie denkst du wird sich die Forschung weiterentwickeln und wie werden sich diese Veränderungen in der Versorgung wiederspiegeln? Fangen wir erstmal vielleicht mit deinen Zukunftsprognosen für die Forschung an.
Speaker #2: [Prof. Dr. Fabian Theis] Also ich find wir sind gerade an einem sehr spannenden Zeitpunkt. Dieses Verständnis, oder diese Sichtbarkeit, die KI in bestimmten Bereichen bei uns schon ganz lange hat, also Leuten ist es seit 10 Jahren bekannt, dass wir natürlich in biologischen Systemen machine learning Modelle oder sowas machen muss. Aber in der Allgemeinheit, - gerade so breit ist es ja vielleicht erst in dem letzten Jahr so passiert, dass jetzt KI plötzlich eins der, vielleicht sogar der der Kernthemen des wissenschaftlichen Fortschritts ist, - wo halt dann jeder schon mal so ein Chatbot oder sowas ausprobiert hat und gemerkt hat wie faszinierend das ist, was diese Dinger können, wenn die ein nur groß-genuge Daten angucken. Insofern ist natürlich diese Idee, das ist die Meinung von diesen Chatbot-Modellen, sogenannte Foundation Models für alle möglichen Bereiche zu machen, gerade extrem interessant und viele Leute probieren das wo man wirklich verschiedene Arten von Daten zusammenbringen kann und dann auch den spannende Fragen stellen können. Insofern glaube ich, dass in der Zukunft die Art wie wir biomedizinische Forschung machen, sich signifikant ändern wird. Zurzeit ist es so, dass meine biologischen oder medizinischen Partner oft extremst clevere Kombinationen von verschiedenen Daten und Fakten machen um dann das nächste Experiment zu planen. Ich glaube, dass wir in Zukunft dann eine Unterstützung durch eine KI bekommen werden, die dann viele von diesen Daten auch integriert und dann nächste Hypothesen, - so eine Formel, also eine Reihe von Hypothesen bereitstellt, um dann die sogenannte experimentelle Planung zu unterstützen, - wo man sagt: „Hey schau mal, ich habe jetzt so und so viel Geld um Experimente zu machen, - wenn ich die vier verschiedene Experimente mache, dann kriege ich am meisten Information über den Bereich raus der mich interessiert.“. Und so eine angeleitete Forschung zu machen, die ist glaube ich richtig spannend. Lass mich da ein Beispiel vielleicht zu geben aus dem Pharma-Bereich. Wenn du Drugs, also Medikamente versuchst zu entwickeln, dann macht man oft sogenannte Screens - einfach so eine Library, also eine Reihe von Molekülen hat zahn-, hunderttausende von Molekülen. Die schmeißt dann drauf auf Zellen und guckst dann welche wachsen und welche nicht. Das kostet natürlich total viel Geld und ist dann auch noch limitiert, weil die Anzahl der möglichen Moleküle, die übersteigt halt die Anzahl der Atome im Universum. Das heißt du kannst eh nur so und so viel machen. Das heißt, sobald du mehr als die paar Moleküle machen möchtest oder sobald du Kombination machen möchtest, hast du so einen riesigen experimentellen Raum, dass du ein Modell als Unterstützung eh brauchst. Dass die Hoffnung ist, angeleitet durch KI, eine bessere Erforschung des nächsten natürlichen Phänomens zu machen, da glaube ich geht's hin, dass man echt so ein experimentellen Loop hat, wo man dann eben durch KI-Unterstützung schneller vielleicht bessere Fragen stellen kann und auch bessere Antworten kriegen kann.
Speaker #1: [Barbara Strobl] Und wie denkst du, wird sich die medizinische Versorgung ändern?
Speaker #2: [Prof. Dr. Fabian Theis] Ich bin natürlich kein Mediziner. Also ich arbeite gerne mit Medizinern zusammen und wir finden auch viele Sachen zusammen raus, aber ich glaube, dass viele von diesen Techniken, von diesen biologischen und biotechnologischen Revolutionen, dass die immer mehr Einsatz auch in der Klinik finden werden. Viele von diesen molekularen Assays, die einfach dann oft bis jetzt nur phenotypisch-beschriebene Krankheiten mechanistischer beschreiben, könnten wir natürlich ersparen. Also wenn man jetzt irgendwie so einen molekularen Score hat, wie stark eine Depression ist z.B., wie kann man denn Long COVID wirklich beschreiben, - das jetzt über Fragebögen hinaus nicht einfacher, aber wenn sowas natürlich da ist, gibt’s zum einen dem Patienten viel mehr Grounding, viel mehr Sicherheit und man kann natürlich dann auch Behandlungen machen. Das ist eine Sache. Das andere ist gerade Sequenzierung, weil die eben so billig geworden ist und weil halt die DNA in allen unserer Zellen das gleiche ist, und sich auch über Lebenszeit nicht massiv verändert, wird glaube ich eine Information sein die in Zukunft von allen von uns mehr oder weniger vorliegen wird oder wir zumindest privat haben. Kostet nicht mehr so viel und dann kannst halt individuell behandeln, wenn du den genetischen Hintergrund kennst. Wie geht man damit aber um? Das sind komplexeste Daten. Du kannst es nicht von Medizin erwarten, - das können wir in der Forschung schon fast gar nicht, irgendwie dieses komplexe genetische Bild zu benutzen und dann eine richtige Handlungsanweisung zu machen. Das heißt, wir alle werden uns beschäftigen müssen wie man sozusagen in viele von unseren Diagnosen auch Genetik mit reinbringen können. Und, das ist jetzt für Genetiker gesagt, aber es ist dann natürlich auch dann für Bildgebung sehr klare klassische Modalität wo ganz die machine learning schon gemacht worden ist. Wie geht man damit um? Wie geht man mit diesen großen medizinischen Bildgebungen um? Wie geht man mit den Health Records um, die wir hoffentlich dann auch mal in Deutschland haben werden, - bisschen später als andere Länder aber dann doch. Was macht man mit dieser komplexen Information auf einmal? Und dafür brauchen wir eben diese KI Methoden. Ich glaube, dass das auch die Versorgung wirklich unterstützen kann und da vielleicht dann auch informiertere Modelle rauskommen können, die wir dann auch vielleicht besser verstehen, warum dann diese Therapieentscheidung getroffen wurde.
Speaker #1: [Barbara Strobl] Also, fassen wir das Thema noch einmal zusammen. Alle unsere Zellen haben die gleiche Anleitung aber je nach Zelltyp werden manche Gene ein oder ausgeschaltet. Daraus ergibt sich dann eine komplett andere Funktion der einzelnen Zellen. Wenn man jetzt die mRNAs misst, also die Kopien der eingeschalteten Gene, dann kann man die Funktion einer Zelle messen. Professor Theis hat das das Transkriptom genannt. Ich habe noch spannend gefunden, dass es gar nicht so einfach ist vorherzusagen, was eine Zelle als nächstes machen wird oder wie sie auf Medikamente reagieren wird. Bei diesen Fragestellungen kann KI, also künstliche Intelligenz, helfen. Ganz allgemein kann KI helfen die Komplexität der Gesundheit des Menschen besser zu verstehen. Wer mehr zum Thema KI in der Genetik erfahren möchte, kann sich unsere Folge 9 anhören. Das erwähnte Human Genome Project wird in der Folge 3: „Die Mondlandung der Genomforschung“, vorgestellt. Eng verwandt mit dem heutigen Thema ist auch das Thema Epigenetik. Auch hierzu haben wir eine Folge, Nummer 16: „Epigenetik, die Programmierung unserer Zellen“. Habt ihr gewusst, dass man noch gar nicht weiß wie viele menschliche Zellen es gibt? Antwortet uns auf unserer Homepage www.ghga.de/de/codedeslebens. Dieser Podcast wurde präsentiert von GHGA. Wir bieten Infrastruktur in welche Genomdaten sowie weitere medizinische Daten sicher gespeichert und kontrolliert zugänglich gemacht werden können. Das Projekt wird von der Deutschen Forschungsgemeinschaft finanziert und ist Teil der nationalen Forschungsdaten Infrastruktur. Weitere Informationen findet ihr unter www.ghga.de. Vielen Dank fürs Zuhören und herzlichen Dank an unseren heutigen Gast Professor Fabian Theis. Bis zum nächsten Mal.