4.1 Ein neuronales Netz, das Zeichen erkennt
Wir haben nun ein künstliches neuronales Netz (KNN) kennengelernt, das anhand von "Messwerten" Tiere klassifizieren kann.
Funktioniert das auch mit Bildern? Aber ja! Die folgende Abbildung zeigt ein einfaches Beispiel. Zu sehen ist ein KNN, das Bilder klassifiziert, die nur 3 x 3 Pixel groß sind. Unterschieden werden sollen die Zeichen PLUS (also +), MAL (also X) und MINUS (also -)
Vorher erinnern wir uns noch einmal an das Zitat von Hannah Fry: "Ein künstliches neuronales Netz kann man sich als eine riesige mathematische Struktur vorstellen, mit jeder Menge Schaltern und Reglern. Man speist ein Bild an einem Ende ein, es fließt durch eine Struktur, und am anderen Ende kommt eine Vermutung heraus, was dieses Bild enthält. Eine Wahrscheinlichkeit für jede Kategorie: Hund oder nicht Hund."
Abgesehen davon, dass es in unserem Beispiel nicht um die Erkennung von Hundebildern geht, passiert hier genau das selbe.
Gehen wir Schritt für Schritt von links nach rechts durch:
Ganz links befindet sich ein Bild, ein Pixelfeld, das aus 3 x 3 Pixeln, also insgesamt 9 Pixeln besteht. Die Helligkeit jedes einzelnen Pixels wird als Zahl codiert. Ein schwarzes Pixel hat den Wert 0, ein weißes den Wert 1. Alle Werte dazwischen (wie 0.1, 0.43 oder 0.9232) stehen für mehr oder weniger helle Graustufen.
Das Bild wird nun in die Eingabeschicht des künstlichen neuronalen Netzes eingespeist. Weil das Bild aus 9 Pixeln besteht, enthält die Eingabeschicht 9 Neuronen. Jedes einzelne Pixel des Bildes gehört zu einem Neuron in der Eingabeschicht. Die Helligkeitswerte werden einfach hineinkopiert. Die Werte der Neuronen in der Eingabeschicht hängen also auschließlich von den Helligkeitswerten der Pixel des eingespeisten Bildes ab. Wir nennen die Werte eines Neurons auch Aktivierung.
Anders ist es bei den Neuronen der verdeckten Schicht. Die Aktivierung jedes einzelnen Neurons in dieser Schicht hängt von den Aktivierungen der Eingabeschicht und dem ab, was Hannay Fry "Schalter und Regler" genannt hat, wir nennen sie auch Gewichte.
Für die Neuronen in der Ausgabeschicht gilt: Die Aktivierung jedes einzelnen Neurons in dieser Schicht hängt ab von den Aktivierungen der Neuronen in der vorherigen, also der verdeckten Schicht, und wiederum den "Schaltern und Reglern", also den Gewichten.
Da dieses künstliche neuronale Netz drei verschiedene Zeichen unterschieden soll, hat die Ausgabeschicht exakt drei Neuronen. Für jede Klasse von Zeichen exakt eines. Wenn wie im Bild das dem Plus-Zeichen zugeordnete Neuron am stärksten aktiviert ist, sozusagen "am hellsten leuchtet" - dann hat das künnstliche neuronale Netz ein Plus Zeichen erkannt.
Die große Frage ist aber: Wie stellen wir die "Schalter und Regler" ein, wie finden wir die richtigen Werte für die Gewichte, damit möglichst alle Zeichen richtig erkannt werden? Darum geht es im nächsten Abschnitt.