Wie funktioniert die App Flora Incognita?

Grundlage ist die maschinelle Bilderkennung mit einer bestimmten Methode zur Informationsverarbeitung. Diese Methode stammt aus dem Bereich des Maschinellen Lernens (Machine Learning), einem Teilbereich der KI. Genauer gesagt gehört die Methode zum „Deep Learning“. Deep Learning ist wiederum ein Teilbereich des Maschinellen Lernens (vgl. Abb. 1).


Abb. 1: Darstellung der Bereiche Künstlicher Intelligenz basierend auf Simon (2021).

Das hier genutzte Prinzip zur Bestimmung von Pflanzenbildern ist Folgendes: Das System lernt anhand von Beispielbildern, welche Informationen (Parameter) am wichtigsten für die richtige Bestimmung von Pflanzen sind. Diese Beispielbilder müssen allerdings schon klassifiziert sein, damit man überprüfen kann, ob eine Bestimmung richtig oder falsch war. Daher nennt man sie auch Trainingsbilder. Die mehr als eine Millionen Trainingsbilder sind daher gut annotiert bzw. durch Expertinnen und Experten geprüft. Wird mit der App nun ein neues Bild aufgenommen, so kann das System Ähnlichkeiten bzw. gleiche Parameter identifizieren und den schon bekannten Gruppen zuordnen. Hierbei ist es kaum noch möglich nachzuvollziehen, wie genau diese Klassifikation vonstattengegangen ist (vgl. Simon, 2021; Wäldchen & Mäder, 2019).

Aber wie genau ist das System hinter der App, welches aus Beispielbildern lernt, aufgebaut? Grundlage ist hierbei ein künstliches neuronales Netz. Die Arbeitsweise eines neuronalen Netzes kann man sich ähnlich wie das menschliche Nervensystem vorstellen (vgl. Abb. 2). 


Abb. 2: Veranschaulichung eines neuronalen Netzwerks. Neuronen sind als Knoten dargestellt. Aus: Bennani-Baiti & Baltzer (2020).

Die Informationen werden als Parameter eines Pflanzenbildes (z.B. Farbe eines jeden Bildpixels) in die Eingabeschicht eingegeben. Über Knotenpunkte, die miteinander zwischen verschiedenen verdeckten Schichten verbunden sind, werden die Informationen verarbeitet. Sie werden zum Beispiel gewichtet, verrechnet, eventuell weitergegeben und zusammengeführt. In Abbildung 2 ist eine sehr einfache Version eines neuronalen Netzwerks dargestellt. Die Komplexität kann deutlich größer sein. Es kann mehr Eingabe- und Ausgabeknoten geben und die Zahl der dazwischen geschalteten Knoten und Schichten kann ebenfalls variieren. Grundsätzlich steigt die Leistungsfähigkeit eines neuronalen Netzwerks mit der Anzahl der Schichten. Beim Trainieren des neuronalen Netzwerks wird die Informationsverarbeitung in den Knoten eingerichtet. Hierbei wird festgelegt, inwiefern eine Information durch einen Knoten bzw. ein Neuron weitergegeben wird (vgl. Simon, 2021).

Neuronale Netzwerke sind eine wichtige Methode aus dem Bereich des Maschinellen Lernens. Hat ein neuronales Netzwerk viele Schichten und Knoten, so spricht man von Deep Learning. Beim Deep Learning wird auf große Datenmengen (Stichwort: Big Data) zugegriffen und diese zur Verbesserung der Klassifikation verwendet (vgl. Simon, 2021).

Wenn du nun die App nutzt, dann wird der Bilddatensatz eventuell mit deinen Bildern erweitert. Du leistest einen Beitrag zur Forschung und bist Teil von der sogenannten Citizen Science Bewegung. Verbesserungen können zudem mit Angaben von Metadaten, wie Standort oder Zeitpunkt der Blüte, erzielt werden (vgl. Wäldchen & Mäder, 2019).