Frei zugängliche Datenanalyse zum Coronavirus

Open-Source-Plattform Galaxy
lz
SARS-CoV-2
Modelle SARS-CoV-2 CDC/Alissa Eckert, MS, Dan Higgins, MAM
Newsletter­anmeldung

Bleiben Sie auf dem Laufenden. Der MT-Dialog-Newsletter informiert Sie jede Woche kostenfrei über die wichtigsten Branchen-News, aktuelle Themen und die neusten Stellenangebote.


Die Plattform Galaxy ermöglicht die freie und transparente Ansicht von Genominformationen zu COVID-19. Damit soll der Datenaustausch zwischen den Behörden, Instituten und Laboren, die sich mit dem Virus beschäftigen, vereinfacht werden.

Dr. Wolfgang Maier und Dr. Björn Grüning von der Albert-Ludwigs-Universität haben zusammen mit Forschenden von Universitäten in Belgien, Australien und den USA die bisher verfügbaren Daten zu Sequenzen des neuartigen Coronavirus überprüft und auf der Open-Source-Plattform Galaxy veröffentlicht. Die beiden Freiburger Bioinformatiker wollen damit den Datenaustausch zwischen den Behörden, Instituten und Laboren, die sich mit dem Virus beschäftigen, vereinfachen. Ihr Vorgehen und die Ergebnisse haben die Freiburger Forschenden auf dem Portal bioRxiv dokumentiert.

Analyse von Big Data in den Lebenswissenschaften

Die Plattform Galaxy eignet sich zur Analyse von Big Data in den Lebenswissenschaften. Über öffentliche Server erhalten Wissenschaftlerinnen und Wissenschaftler unter anderem freien Zugang zu Analysewerkzeugen und reproduzierbaren Auswertungsverfahren. Maier und Grüning haben zusammen mit Kolleginnen und Kollegen für ihre Studie alle bisher öffentlich verfügbaren COVID-19-Genomdaten mit Galaxy neu analysiert. Bisherigen Veröffentlichungen habe es oft an Transparenz bezüglich der Datenanalyse gefehlt, erklärt Grüning. So enthalte beispielsweise nur eine von vier bis Anfang Februar publizierten Studien zum COVID-19-Genom eindeutige Angaben zu den verwendeten Rohdaten, sagt Grüning: „Und die Analysen waren zudem nicht gut dokumentiert und nicht reproduzierbar.“ Dadurch war es nicht möglich, die jeweiligen Aussagen nachzuvollziehen oder zu überprüfen.

Eigene Analysen von COVID-19-Daten

Innerhalb weniger Tage gelang es dem Team, auf die vorliegenden Sequenzen jeweils identische Arbeitsabläufe anzuwenden und mittels Galaxy öffentlich zugänglich zu machen. Forschenden steht damit nun weltweit über ein Netzwerk von Galaxy-Servern in Europa, den USA und Australien nicht nur die Auswertung der Daten, sondern gleichzeitig auch die wissenschaftliche Infrastruktur für eigene Analysen von COVID-19-Daten zur Verfügung. Damit lassen sich in Zukunft neuveröffentlichte Daten innerhalb von Stunden neu analysieren und mit den bisherigen Daten vergleichen.

Es mangelt an Datenaustausch

Die Forschenden sind sich einig, dass es derzeit bei der Forschung zu COVID-19 an Datenaustausch mangele, so Maier. Das solle sich mit den Veröffentlichungen auf Galaxy ändern: „Eine globale Zusammenarbeit, die für die Bewältigung von Notfällen im Bereich der öffentlichen Gesundheit wie dem Ausbruch von COVID-19 notwendig ist, erfordert schließlich einen ungehinderten Zugang zu Daten, Analysewerkzeugen und zur Berechnungsinfrastruktur.“

Daten sind online frei zugänglich

Galaxy wurde an der US-amerikanischen Penn State University initiiert und an der Universität Freiburg im Sonderforschungsbereich „Medizinische Epigenetik“ sowie als Teil des Deutschen Netzwerks für Bioinformatik-Infrastruktur (de.NBI) weiterentwickelt. Der Europa-Server befindet sich im Rechenzentrum der Universität Freiburg und ist als Community-Projekt angelegt. Die Daten sind online frei zugänglich. Wissenschaftler, die den Server nutzen möchten, brauchen keine Kenntnisse im Programmieren: Alle Einstellungen lassen sich über eine grafisch aufbereitete Oberfläche vornehmen. Federführend in der Weiterentwicklung von Galaxy ist das Team der Albert-Ludwigs-Universität um Grüning aus der Arbeitsgruppe von Prof. Dr. Rolf Backofen am Institut für Informatik.

Galaxy-Projekt
usegalaxy.eu

Literatur:

Galaxy and HyPhy developments teams, Nekrutenko, A., Kosakovsky Pond, S. L. (2020): No more business as usual: agile and effective responses to emerging pathogen threats require open data and open analytics. bioRxiv 2020.02.21.959973, DOI: 10.1101/2020.02.21.959973.


Quelle: idw/Albert-Ludwigs-Universität Freiburg im Breisgau

Artikel teilen

Online-Angebot der MT im Dialog

Um das Online-Angebot der MT im Dialog uneingeschränkt nutzen zu können, müssen Sie sich einmalig mit Ihrer DVTA-Mitglieds- oder Abonnentennummer registrieren.

Stellen- und Rubrikenmarkt

Möchten Sie eine Anzeige in der MT im Dialog schalten?

Stellenmarkt
Industrieanzeige