Partition-Based Graph Abstraction

Mit PAGA Big Data interpretieren

Bei der Analyse molekularer Prozesse auf Basis einzelner Zellen entstehen schnell große Datenmengen. Forschende des Helmholtz Zentrums München und der TU München zeigen jetzt, welche Möglichkeiten ihr Computer-Algorithmus PAGA* bietet.

PAGA-basierte Einbettung der Entwicklungstrajektorien

PAGA-basierte Einbettung der Entwicklungstrajektorien im Embryo des Zebrafisches, gefärbt nach Zeitpunkten. | © Originaldaten von Wagner et al., Science (2018).

Das Schicksal einzelner Zellen im Körper ist in vielerlei Hinsicht relevant. Forscher wollen Entwicklungsprozesse untersuchen, aber auch verstehen, wie es zur Entstehung von Krankheiten kommt. „Bei Experimenten entstehen große Datensätze, sprich Big Data“, erklärt Prof. Dr. Dr. Fabian Theis, Direktor des Institute of Computational Biology (ICB) am Helmholtz Zentrum München und Professor für Mathematische Modellierung biologischer Systeme an der Technischen Universität München (TUM). Forscher erfassen nicht nur Informationen über die Zelle selbst**, sondern auch über Wechselwirkungen mit anderen Zellen oder anderen Gewebetypen. „Bislang gab es jedoch keine Möglichkeiten, um komplexe Prozesse auf zellulärer Ebene verständlich abzubilden“, so Theis. 

Hilfe zur Interpretation von Big Data

Forscher arbeiteten dabei bislang mit zwei Ansätzen zur Datenanalyse. Entweder suchten sie nach Zellen mit ähnlichen Eigenschaften und gruppierten diese („Clustering“). Oder sie beschrieben den zeitlichen Ablauf von Zellen auf ihren Entwicklungspfaden („Trajektorieninferenz“). „Wenn man diese sehr unterschiedlichen ‚Brillen‘ nimmt, um auf die Daten zu sehen, entstehen natürlich abweichende und unklare Interpretationen“, ergänzt Dr. Dr. Alex Wolf. Er leitete bis vor kurzem ein Machine Learning Team am ICB. „PAGA leistet alles, was Clustering und Trajektorieninferenz kann, in einer einzigen Analyse, mit einer einzigen Methode und einem einzigen schlüssigen Ansatz zur Modellierung.“ Je nach gewünschter Auflösung gruppiert das Tool Zellen beispielsweise anhand ihres Zelltyps (etwa Hautzellen), ihres biologischen Zustands (beispielsweise in Teilung) und zeigt die dabei zellulären Übergänge zwischen Typen und Zuständen auf.

Neue fachliche Herausforderungen im Zeitalter von Big Data und künstlicher Intelligenz

Internet und IT-Giganten wie Amazon, Apple oder Google haben demonstriert, wie man mit großen Datenmengen große Geschäfte macht: Diese Unternehmen verdienen Milliarden mit Big-Data-Anwendungen.

weiterlesen

Breite Anwendung von PAGA

In den letzten Monaten sind mehrere Fachartikel erschienen, die zeigen, welche Möglichkeiten PAGA bietet. Mireya Plass vom Max-Delbrück-Centrum für Molekulare Medizin in der Helmholtz-Gemeinschaft rekonstruierte zusammen mit Wolf und Kollegen den vollständigen zellulären Stammbaum eines Plattwurms*** - einer der von Science kuratierten wissenschaftlichen Durchbrüche des Jahres 2018****. Vor kurzem hat ein Team um Blanca Pijuan-Sala von der University of Cambridge mit Hilfe von PAGA zum ersten Mal die Entwicklungsprozesse eines Mausembryos rekonstruiert*****. Weitere Fachartikel zeigen, dass PAGA auch im klinischen Kontext wichtige Ergebnisse liefert. Forschende vom Broad Institute of MIT and Harvard untersuchten chronisch-entzündliche Darmerkrankungen******. Sie konnten nachweisen, dass Störungen der Zellentwicklung das Krankheitsbild erklären, die Abstammungslinien der Zellen im Darm erhielten sie mit PAGA. Theis sieht im Tool auch künftig große Potenziale: „Im Grunde kann jedes biologische Phänomen, das sich auf einen zellulären Prozess zurückführen lässt, mit PAGA analysiert werden, sobald auch Daten vorhanden sind.“ (HZM, red)

* PAGA steht für partition-based graph abstraction (PAGA): ein Verfahren, bei dem verschiedene Ansätze wie die Gruppierung von Zellen nach Eigenschaften und die zeitliche Entwicklung gemeinsam betrachtet werden.

** Dazu gehören u.a. das Transkriptom (die Gesamtheit aller aktiven Gene), das Proteom (die Gesamtheit aller gebildeten Proteine), die Morphologie (das Erscheinungsbild einer Zelle) bzw. das Epigenom (die Gesamtheit aller Veränderungen an der DNA und an speziellen Proteinen im Zellkern, den Histonen).