Die AMMOD Stationen werden kontinuierlich hoch-komplexe und heterogene Daten und dazugehörige Metadaten liefern. Eine zentrale Aufgabe ist es diesen Datenstrom so zu gestalten, dass die Daten optimal integriert, archiviert und publiziert werden können. Dafür werden flexible, standard-konforme Softwarekomponenten benötigt, die flexibel für unterschiedliche Datentypen einsetzbar sind.

Das DFG finanzierte GFBio Projekt mit seiner durch die Partner bereitgestellten Infrastruktur (www.gfbio.org), enthält alle notwendigen Grundkomponenten für die Archivierung und Veröffentlichung von Biodiversitätsdaten. GFBio bietet aktuell ein Netzwerk von Datenzentren mit einem gemeinsamen Metadatenkatalog, eine flexible Datensuche, einen Terminologiedienst, einer GIS-basierte Plattform für Visualisierung und Analyse (VAT), ein einheitliches Submission System für Datenarchivierung, sowie einen gemeinsamen Helpdesk.

Die GFBio Datenzentren gewährleisten die Langzeitarchivierung und die Zitierbarkeit von Daten durch die Vergabe von persistenten, eindeutigen Identifier (z.B.  Digital Objects Identifier (DOI)). Damit bilden sie die Grundlage für die Nachnutzbarkeit aller Daten für alle relevanten Interessenvertreter (Stakeholder). Wichtig in dieser Hinsicht ist die Auffindbarkeit durch die Metadaten und der möglichst offene Zugriff auf die Daten und, sowie die Interoperabilität von Daten und Archiven, um eine effiziente Qualitätssicherung und Integration heterogener Daten zu ermöglichen (Wilkinson et al. 2016).

Der Datenfluss von den AMMOD Sensor-Plattformen zu den Langzeitdatenarchiven ist wie folgt (siehe Abbildung 1): Zunächst werden die von den AMMOD Sensor-Plattformen (Ammod devices) erzeugten Daten auf die AMMOD-Basisstation übertragen. Von dort  werden sie an eine Mediationskomponente (Broker agent) übertragen (A), die für die Weiterverarbeitung zuständig ist. Die Daten werden anschließend über bereits etablierte Abläufe an die GFBio Datenzentren für die Langzeitarchivierung und Publikation übermittelt (B) und dann über in AMMOD entwickelte Komponenten in einer Cloud-Infrastruktur gespeichert (C), die Zugang und Analysen für die Projektpartner noch vor der Publikation der Daten ermöglicht, z.B. die integrative, GIS-basierte statistische Datenauswertung, die vom Projektpartner FKIE vorgenommen wird.

 Abbildung 1 – Die Boxen repräsentieren die verschiedenen AMMOD Module. Die Linien zeigen den Datenfluss von den AMMOD Sensor-Plattformen, bis zum dedizierten Cloud-Infrastruktur. Die Daten Umfassen sowohl unverarbeitete (raw) und verarbeitete Messungen oder Aufnahmen (blau), beschreibende Metadaten (rot) und Statusmeldungen der Plattformen (grün).

In der Pilotphase erfordert die Archivierung und Veröffentlichung von Daten von AMMOD-Stationen eine Erweiterung der GFBio-Infrastruktur. Diese umfasst (1) die Anpassung von Software-Komponenten und Abläufe, sowie (2) die Etablierung von Metadaten-Schemata. Dabei werden die aktuelle Entwicklungen im internationalen Umfeld berücksichtigt. Ein Konzept um die Nachhaltigkeit und die Erweiterbarkeit durch weitere Datenquellen, Datentypen und Nutzerszenarien zu gewährleisten wird ebenso entwickelt.