photokina: 26.–29.09.2018 08.–11.05.2019

#photokina

Künstliche Intelligenz: Imaging-Anwendungen einfacher und schneller

Wie die Bilder denken lernen

Selbstfahrende Autos, automatisch nachbestellende Kühlschränke, Service-Roboter, die Drinks an den Platz bringen, Türen die sich mit Fingerabdruck öffnen, sich selbst sortierende digitale Bildarchive – diese Zukunftsszenarien existieren bereits oder sind in greifbare Nähe gerückt. Häufig sind es Imagingtechnologien oder Bildauswertungstools basierend auf künstlicher Intelligenz, die das alles überhaupt erst ermöglichen.

Versuch und Irrtum

Unter künstlicher Intelligenz (KI) versteht man vor allem selbstlernende Systeme. Während man früher etwa fest einprogrammieren musste, wie ein Programm zum Beispiel Gesichter erkennt, ist Software heute so flexibel, dass sie sich das selbst erarbeitet. Als Basistechnologie werden dazu sogenannte „Neuronale Netze“ verwendet, die ähnlich wie der Mensch anhand von Versuch und Irrtum lernen, welche Operationen sie ausführen müssen, um zum gewünschten Ergebnis zu kommen. Werden mehrere Schichten von neuronalen Netzen in Kombination eingesetzt, verbessern sich die Ergebnisse deutlich. Man spricht dann von „deep learning“.

hotoDirector © CyberLink

hotoDirector © CyberLink

Damit neuronale Netze zum gewünschten Ergebnis kommen, hilft Feedback über die Richtigkeit ihrer Zwischenergebnisse sowie eine große Menge an Daten. Idealerweise werden neuronale Netze zum Start daher mit bereits von Menschen bewerteten Daten gefüttert, z.B. manuell verschlagwortete Bilder. Je mehr sie davon haben, desto einfacher und besser können sie Muster erkennen und desto zuverlässiger werden die Endergebnisse.

Vielfältige Einsatzmöglichkeiten
Der deutsche Stockfotografie-Anbieter EyeEm hat sich z.B. seinen großen Datenbestand zu Nutze gemacht und eine Anwendung auf Basis künstlicher Intelligenz entwickelt, die automatisch Schlagworte für Aufnahmen vorschlägt. Google, Apple und Microsoft nutzen die automatische Erkennung von Szenen bereits standardmäßig in ihren Suchmaschinen. Ein wesentlicher Bereich von KI-Technologien ist die Gesichts-Wiedererkennung. Bildverwaltungsprogramme können so auf Basis der bereits eingelesenen Fotos automatisch zusammengestellte Sammlungen mit Aufnahmen bestimmter Personen anbieten. Microsoft geht sogar so weit, dass man versucht, Emotionen automatisch zu erkennen. So könnte es etwa möglich werden, zielsicher ein Babyfoto mit trotzigem Gesichtsausdruck für ein Erinnerungs-Fotobuch zu finden.