Neuronale Netze können zur Bilderkennung eingesetzt werden. Anders als Menschen kann ein Computer nicht mit einem Blick erkennen, ob auf einem Bild ein Mensch, eine Pflanze oder ein Gegenstand zu sehen ist. Er muss das Foto auf einzelne Merkmale untersuchen. Welche Merkmale relevant sind, weiß der Computer durch den implementierten Algorithmus oder er findet es durch Datenanalyse selbst heraus.
In jeder Schicht des Netzes prüft das System die Eingangssignale, d. h. die Bilder, auf einzelne Kriterien wie Farbe, Ecken, Formen. Mit jeder Prüfung kann der Computer besser bewerten, was auf dem Bild zu sehen ist.
Zunächst werden die Ergebnisse relativ fehlerbehaftet sein. Erhält das neuronale Netz Feedback von einem menschlichen Trainer und kann dadurch seinen Algorithmus anpassen, spricht man von maschinellem Lernen. Beim Deep Learning kann das menschliche Training entfallen. Das System lernt in diesem Fall aus der eigenen Erfahrung und wird umso besser, je mehr Bildmaterial ihm vorliegt.
Am Ende steht im Idealfall ein Algorithmus, der fehlerfrei den Inhalt der Bilder identifizieren kann, je nach Training auch unabhängig davon, ob diese Bilder schwarzweiß sind oder in welcher Pose oder aus welcher Perspektive das Dargestellte zu sehen ist.