zur Hauptseite

Navigation und Service


IT-Konzept DPPN

DPPN Technisches Daten Management aller Standorte

Die im Rahmen des Deutschen Pflanzen Phänotypisierungs-Netzwerk (DPPN) entwickelten Phänotypisierungs-Plattformen produzieren eine sehr große und heterogene Menge an Daten. Damit deren volles wissenschaftliches Potential ausgeschöpft werden, müssen die Daten FAIR sein. Daher befasst sich das DPPN Techno Arbeitspaket mit der Entwicklung von Infrastrukturen zur Dokumentation und Publikation von Forschungsdaten, als auch zum Verknüpfung von genotypischen und phänotypischen Daten.

Das IPK Gatersleben entwickelt eine FAIR-konforme Infrastruktur, genannt e!DAL (electronic Data Archive Library), die in der Lage ist dauerhafte und zitierfähige DOIs für Forschungsdaten zu vergeben und bei DataCite zu registrieren. Durch eine hohe Automatisierung wird die Einreichung von Forschungsdaten vereinfacht. Darüber hinaus sichert ein Peer-Review ähnlicher Begutachtungsprozess die Qualität der veröffentlichten Daten. Das Plant Genomics and Phenomics Research Data Repository (PGP) ist die erste Instanz, die auf dieser Infrastruktur basiert und 2016 veröffentlicht wurde. Sie wird am IPK Gatersleben gehostet und ist als Forschungsdaten-Repository bei FAIRsharing.orgre3data.org und OpenAIRE registriert. Darüber hinaus hat das ScientificData und das GigaScience Journal PGP als institutionelles Repository akzeptiert. PGP bietet Zugang zu umfangreichen Datensätze aus den LemnaTec-Hochdurchsatz-Phänotypisierungsanlagen des IPK Gatersleben mit MIAPPE-konformen Experiment-Dokumentationen (Arend et al., 2016, Chen et al, 2018).

Mit der Integration der ELIXIR Authentication and Authorization Infrastructure (AAI) ist e!DAL in der Lage externe institutionelle Authentifizierungsprovider zu unterstützten. So konnte im Juni 2018 eine zweites Repository auf Basis der e!DAL Infrastruktur am Forschungszentrum Jülich etabliert werden. Es wird vom Jülich Plant Phenotyping Center (JPPC) gehostet.

Bild des DPPN DataInterfacesBild 1: Übersicht des DPPN IT-Konzeptes

Der Hauptteil der nachhaltigen Experiment-Annotationen umfasst die Beschreibung der experimentellen Faktoren und Proben-Eigenschaften sowie Protokolle und Parameter für das Pflanzenwachstum und spezifische Assays. Der internationale ISA-Tab Standard ist ein Tabellenformat für die universelle Dokumentation von experimentellen Forschungsdaten. Das DPPN ist an der Entwicklung von Empfehlungen für die minimalen Informationen über Pflanzenphänotypisierungs-Experimente (MIAPPE) beteiligt. Diese ist in der FAIRsharing.org Datenbank registriert und wurde zusammen mit der Implementierung in einer speziellen ISA-Tab-Konfiguration für Pflanzenphänotypisierungsdaten veröffentlicht (Ćwiek-Kupczyńska et al. 2016). Die entsprechenden Checklisten werden in den lokalen Datenmanagementsystemen der DPPN-Standorte angewendet, um eine nachhaltige Versuchsdokumentation zu unterstützen. Am IPK Gatersleben wurde hierfür ein PhenoLIMS-Modul auf Basis des kommerziellen Labor-Informationsmanagementsystems LIMSOPHY entwickelt, das Helmholtz Zentrum München richtet ein openBIS-Framework ein und das Forschungszentrum Jülich setzt ein maßgeschneidertes integratives Informationssystem ein. Alle Partner verwenden den ISA-Tab-Standard, um Datensätze für die Veröffentlichung und den Austausch zu exportieren.

 

Um die Interoperabilität von Datensätzen innerhalb und außerhalb des DPPN weiter zu verbessern, schlagen wir kontrollierte Vokabulare vor, die vorhandene Ontologien und universelle IDs integrieren, um die aktuelle ISA-Tab-Konfiguration zu erweitern und wichtige Metadaten von Pflanzenphänotypisierungs-Experimenten homogen zu beschreiben. Dies ermöglicht die gezielte Suche nach relevanten Datensätzen über Schlüsselwörter in DataCite oder in strukturierten Metadaten. Kompatible Annotationen von Datensätzen verschiedener Forschungsdomänen, Messdomänen und Omics-Ebenen eröffnen neue Möglichkeiten der datengetriebenen Hypothesengenerierung. Studien mit Arabidopsis und Pappeln zeigen, wie die Integration heterogener Daten aus phänotypischen Beobachtungen und Genexpression zu Befunden beiträgt, die auf potentielle Mechanismen abiotischer Stressreaktionen hinweisen, die teilweise durch die Überprüfung mehrerer annotierter früherer Datensätze im Kontext unterstützt werden.

Zusatzinformationen

 

gefördert durch

Öffnet neues Fenster

      Förderkennzeichen:
         031A053A/B/C

 

 


Servicemenü