Sensordatenfusion für Biodiversität – Von der Detektion zur Abundanz

Die Bestimmung der Population einer Tierart für ein bestimmtes Habitat (Abundanz) ist meistens eine große Herausforderung für Mensch und Technik. Während Experten sehr gut darin sind, Tierarten zu bestimmen und Anzahl zu zählen oder zu schätzen, sind damit zeitliche und örtliche Begrenzungen verbunden, die eine kontinuierliche Analyse der dynamischen Entwicklung nur mit Einschränkungen erlauben. Sensoren hingegen können einfach vervielfacht und permanent einsatzfähig gemacht werden, bieten jedoch ad-hoc nicht dasselbe Niveau an Information, da Sensordaten fehlerhaft, unvollständig und teilweise widersprüchlich sind. Darüber hinaus ist die Interpretation von Sensordetektionen  nicht eindeutig: Eine Detektionsmeldung kann

  • Eine Falschmessung sein, also eine Detektion, obwohl keine Spezies vorhanden war. Derartige Artefakte treten beispielsweise durch Sensorrauschen oder schlechte Messbedingungen auf.
  • Eine Detektion mit falscher Klassifikation sein, d.h. die Zuordnung der der gemessenen Daten zu einer Tierart ist nicht korrekt, auch wenn tatsächlich eine Spezies gesichtet wurde. Bei Klassifikationsalgorithmen, die eine große Anzahl verschiedener Objekte erkennen und auseinanderhalten müssen, sind Verwechslungen kaum vermeidbar. Die Selektivität über alle Spezies gibt dabei üblicherweise die Konfusionsmatrix an.
  • Eine richtige Messung mit korrekter Klassifikation sein (True Positive), und als bisher ungesehenes Individuum damit die gezählte Population um 1 erhöhen.
  • Eine richtige Messung mit korrekter Klassifikation sein, jedoch zu den Individuen gehören, die bereits gesichtet und gezählt wurden. Damit darf die Schätzung der Anzahl nicht erhöht werden.

In AMMOD werden probabilistische Methoden der Sensordatenfusion untersucht, um die verschiedenen oben aufgeführten Interpretationen von Detektionen stochastisch zu modellieren und damit die Zeitreihen von Messdaten zu einer berechneten Schätzung der Abundanz zu führen. Diese Schätzung ist nie perfekt, jedoch erlauben die Verfahren der Bayes’schen Statistik die Integration von Hintergrund- und Kontextwissen und ermöglichen damit eine präzise Modellierung des Wissens über die Population und ihren Lebensraum und damit eine Berechnung eines Erwartungswerts, der auf diesem Wissen beruht.

Darüber hinaus werden auch die Fehlervarianz und Standardabweichung der Schätzung berechnet, die eine Art Selbsteinschätzung der Qualität des Ergebnisses durch den Algorithmus ist. Damit kann der Benutzer erkennen, in wie weit den berechneten Zahlen zu trauen ist und in welchem Spektrum der Fehler einzuordnen ist.

Vereinfachtes Beispiel eines Dynamik-Modells, das den Verlauf einer Verteilungsfunktion um den Sensorstandort s0 (links) über die Zeit (Mitte und Rechts) zeigt. Sie kann gemäß einer gleichmäßigen Diffusion verlaufen (Mitte) oder auf der Basis von „Hot-Spots“ multimodal sein (Rechts).

Methodisch werden dabei insbesondere Algorithmen zur raum-zeitlichen Verfolgung von Objekten, dem Objekttracking, angewendet, bei dem die Anzahl der Objekte im „Field of View“ des Sensors und für jedes Objekt der „Zustand“ (z.B. die Position und Kinematik) geschätzt werden. Die räumliche Auflösung der Sensoren reicht in den meisten Fällen nicht für eine präzise Bestimmung der Trajektorien einzelner Individuen aus, nichtsdestoweniger kommen bei AMMOD stochastische Bewegungsmodelle mit dem Ziel der Populationsschätzung für jede Art zum Einsatz, bei denen im Zweifelsfall der Sensorstandort als Positionsmeldung mit großer Fehlervarianz genommen wird. Das Bewegungsmodell beschreibt dann die Verteilung der Aufenthaltswahrscheinlichkeit für ein gegebenes Zeitintervall und erlaubt damit eine probabilistische Assoziation mit neuen Detektionen. Das Sensormodell hingegen beschreibt das Verhalten des Sensors mit stochastischen Mitteln, sodass hier Werte zur Detektionswahrscheinlichkeit oder Falschalarmrate einbezogen werden. Im Zusammenwirken von Sensor- und Bewegungsmodell kann iterativ ein Schätzwert der Population berechnet werden, in dem verschiedene Interpretationen der Daten sowie Wissen über das Verhalten der Tierart einbezogen wurde.

Geoinformationssysteme (GIS) ermöglichen es darüber hinaus, zusätzliches Kontextwissen für die Sensordatenfusion zu integrieren, da sie Information z.B. zur Bebauung, Vegetation, Wasservorkommen oder Terrainbeschaffenheit bieten, die georeferenziert abgerufen werden können. Vor dem Hintergrund der oben beschriebenen Mehrdeutigkeiten in der Dateninterpretation können derartige Hintergrunddaten die Aussagekraft der Ergebnisse verbessern. In AMMOD soll daher auch untersucht werden, in wie weit sich diese Daten formalisieren und für die Integration in den Prozess der iterativen Schätzungsberechnung genutzt werden können.