Uneingeschränkter Zugang

Mikrobiologische Forschungsdaten bei BacDive

Die Aktualisierung der frei zugänglichen mikrobiologischen Datenbank BacDive ermöglicht jetzt den Zugriff auf über 900.000 Metadaten.

Datenbank BacDive

Datenbank BacDive Startseite | DSMZ

Die Wissenschaftler Dr. Lorenz Reimer, Joaquim Sardà und Prof. Dr. Jörg Overmann vom Leibniz-Institut DSMZ-Deutsche Sammlung von Mikroorganismen und Zellkulturen haben mit der Aktualisierung im April 2019 die Datenbank BacDive umfassend erweitert. Bereits seit 2012 entwickeln die Bioinformatiker der DSMZ mit BacDive (the Bacterial Diversity Metadatabase) eine weltweit einzigartige Datenbank, die bisher nicht verfügbare Daten von Bakterien und Archaeen frei zugänglich macht. Die Entwicklung folgt dabei den FAIR-Prinzipien, nach denen wissenschaftliche Daten auffindbar, zugänglich, interoperabel und wiederverwendbar (Findable, Accessible, Interoperable, Re-usable) sein sollen.

Mehr als 600 Datenfelder verfügbar

Die Nutzungsmöglichkeiten von BacDive werden kontinuierlich erweitert, aktuell können Wissenschaftler über 600 Datenfelder für die Suche nach mikrobiologischen Informationen nutzen. Das Repertoire umfasst neben den initialen Speziesbeschreibungen und Stoffwechselprofilen auch Daten über enzymatische Aktivitäten und Antibiotikaresistenzen. Darüber hinaus bietet BacDive mit 9.000 Analytical Profile Tests (API) für über 5.000 bakterielle Stämme die größte öffentlich verfügbare API-Datensammlung weltweit.

Integration von externen Daten und Interoperabilität

Um der Wissenschaft eine umfassende Datenbank bieten zu können, pflegen die DSMZ-Wissenschaftler kontinuierlich auch die mikrobiologischen Metadaten anderer europäischer Stammsammlungen in BacDive ein. Mit dem aktuellen Update integrierte die DSMZ beispielsweise Daten von mehr als 19.505 Bakterienstämmen der schwedischen Sammlung Culture Collection University of Gothenburg (CCUG). Somit sind in BacDive aktuell Informationen zu 80.584 Bakterien und Archaeen abrufbar. Für die wissenschaftliche Arbeit mit quellenübergreifenden Datensätzen müssen die verschiedenen Informationsquellen möglichst direkt über eindeutige Identifikatoren verknüpft sein. Dazu wurden zum Beispiel direkte Links zu der 16S rRNA Sequenz eines Bakterienstammes in der Datenbank SILVA oder zu den an Stoffwechselreaktionen beteiligten Enzymen in der Datenbank BRENDA eingerichtet. Über Verlinkungen in PubMed, NCBI Taxonomy, NCBI Nucleotide, aber auch in Speziesbeschreibungen von Wikipedia gelangen Nutzer zu den strukturierten Metadaten in BacDive.

Quelle: Leibniz-Institut DSMZ