4.3 Was sind Trainingsdaten?
Künstliche neuronale Netze lernen anhand von Beispielen. Wenn das Ziel ist, Hunde- von Katzenbildern zu unterscheiden, benötigen wir sehr viele Bilder, bei denen bekannt ist, ob sie einen Hund oder eine Katze zeigen.
Genauer gesagt sind das Paare von Bildern und die "richtigen Ausgaben": Wenn wir nur zwei Klassen (Hund oder Katze) unterscheiden wollen, dann hat die Ausgabeschicht des künstlichen neuronalen Netzes zwei Neuronen. Im Falle einer Katze sollte das entsprechende Neuron in der Ausgabeschicht den Wert 1 haben, das andere, das "Hundeneuron" den Wert 0.
Berühmte Trainingsdatensätze
Wenn du dich weiter mit dem Thema "Künstliche Intelligenz" beschäftigst, und selber KI-Programme schreibst, wirst du wahrscheinlich auf zwei berühmte Trainingsdatensätze stoßen, die gerne zum lernen, experimentieren und vergleichen verwendet werden.
MNIST
Der MNIST-Datensatz enthält 70.000 Bilder von handgeschriebene Ziffern von 0 bis 9. Die Bilder sind schwarzweiß und 28 mal 28 Pixel groß. https://de.wikipedia.org/wiki/MNIST-Datenbank
CIFAR-10
Der CIFAR-10 Datensatz stellt 60.000 Bilder bereit, die 10 Bildklassen zugeordnet sind: Flugzeug, Automobil, Vogel, Katze, Rotwild, Hund, Frosch, Pferd, Schiff und LKW. Die Bilder sind farbig und 32 mal 32 Pixel groß.