14. März 10 Uhr, Webinar: Hochvolumige Bild-Produktion mit CGI: Automatisiert, regelbasiert Jetzt anmelden
Kuenstliche Intelligenz auf der Ueberholspur

Künstliche Intelligenz auf der Überholspur?

Ein künstliches neuronales Netz lernt das Freistellen von Produkten

In einem gemeinsamen Projekt von der Bergischen Universität Wuppertal und Laudert wird einem künstlichen neuronalen Netz die automatische Freistellung von Produkten aus Fotografien beigebracht. Die Ergebnisse lassen aufhorchen: Bereits jetzt erzielt die trainierte Künstliche Intelligenz (kurz: KI) beachtliche Ergebnisse – und lernt jeden Tag dazu.

In den meisten Anwendungsfällen dient der Einsatz von Künstlicher Intelligenz dazu, definierte Aufgaben sorgfältiger und schneller auszuführen als der Mensch. So auch in unserem geradlinigen Case des Forschungsprojekts: Ausgehend von Fotografien von an der Büste drapierten Fashion-Produkten sollen Freistellungsmasken herausgearbeitet werden, die den Artikel vom restlichen Teil des Bildes separieren.

Laudert forscht selbst

KI: Besser als Adobe?

Vor einigen Monaten führte der Software-Riese Adobe eine Funktion in Photoshop ein, die eine Freistellung des Hauptmotivs eines Bildes ermöglicht. Grundlage für die Entwicklung war maschinelles Lernen. Während die Funktion etwa für Familien- oder Tierbilder hervorragende Masken anlegt, ist sie für unseren Case ungeeignet. Die KI wurde schlicht nicht auf unseren speziellen Case trainiert, sodass die Masken enorm fehlerhaft und damit unbrauchbar sind.

Also forschen wir selbst – gemeinsam mit der Universität Wuppertal. Durch das Füttern eines künstlichen neuronalen Netzes mit tausenden Beispielen des Anwendungsfalls erlernt die KI ein berechenbares Verhalten, das allerdings nur für das System selbst erkennbar ist – ein Einblick in die von der KI erlernten Lösungswege ist nicht unmittelbar möglich.

Entsprechend ist der Ansatz intensiv und anspruchsvoll und beinhaltet deutlich mehr Fallstricke und Problemfälle, als es die bloße Beschreibung vermuten lässt. Besonders die exakte Unterscheidung zwischen Büste und Artikel sorgt in komplizierten Fällen immer wieder für Ungenauigkeiten.

Info

Was bedeutet…

Maschinelles Lernen

Der Begriff „maschinelles Lernen“ beschreibt die Generierung von Wissen eines künstlichen Systems, basierend auf Erfahrung. Aus Beispielen bauen Algorithmen ein statistisches Modell auf, aus dem Muster und Gesetzmäßigkeiten erkannt werden.

KI schneidet meist besser ab, als beauftrage DIenstleister

Künstliche Intelligenz schlägt händische Arbeit

Die Kunst im Projekt ist es nun, geeignete Netzarchitekturen für die jeweiligen anwendungsspezifischen Fragestellungen auszuwählen und weiterzuentwickeln. Durch strategisches Vorgehen und innovative, experimentelle Verfahren wurden dem Netz Beispiele aufgezeigt, wodurch die Freisteller-KI im Trainingsprozess sukzessive optimiert wurde. Wochen und Monate war dies Inhalt der Forschungsgruppe. Mit Erfolg: Die Ergebnisse wurden nicht nur immer besser, sondern haben sich ungemein stabilisiert.

In den meisten Testfällen übertrifft die KI bereits eigens beauftragte Vergleichsdienstleister, die die Freisteller händisch anfertigen ließen – für das ungeübte Auge sind Unterschiede kaum erkennbar (siehe folgende Bilder: links die zwei Dienstleister, rechts die KI).

Dennoch ist es noch ein weiter Weg hin zu einer standardisierten, kommerziellen Nutzung. Eine weitere Senkung der Fehlerquote ist ebenso nötig wie eine deutliche Ausweitung des Cases. Denn bisher ist das Netz nur für einen recht eng gesteckten Anwendungsfall in einem speziellen Segment trainiert. Die KI muss also noch viel lernen.

Künstliche Intelligenz muss noch lernen

Weiteres Vorgehen: Schärfen der Netztopologie

Das Projekt mit der Universität Wuppertal wird noch einige Monate weitergehen. Tobias Enk, der die Forschungsgruppe vonseiten der Universität begleitet, erklärt: „Aus dem bisherigen Vorgehen haben sich Netztopologien herauskristallisiert, die erfolgreicher waren als andere. Den vielversprechendsten von ihnen werden wir in Zukunft weiterhin hochwertige Daten zukommen lassen, um die Freistellqualität weiter zu optimieren. Zudem forschen wir daran, ob und, wenn ja, wie die Methoden für weitere Anwendungsbereiche genutzt werden können.“ Bis zum Ende des Projekts werden der Freisteller-KI noch viele tausende Bilder vorgelegt.

Weitere Artikel zu den Themen