KI-Bilder erkennen

Einige erkennen sie mit bloßem Auge, viele nicht – KI-Bilder. Woran du schon anhand eines Indiz solche Bilder identifizierst und wie du dein Auge trainieren kannst, erklären wir dir hier.

Generative KI kann mittlerweile alles abbilden, von einfachen Skizzen und Aquarell, Vektorgrafiken bis hin zu realistischen Illustrationen und Fotos. Schier die Masse an unterschiedlichen Stilen kann einen anfangs überfordern. Wie soll jemand, der Kunst bloß genießt, den Unterschied zwischen KI- Aquarellen und echten Leinwandarbeiten erkennen? Das Geheimnis liegt in der Mustererkennung und im menschlichen Denkprozess.

Wie wir gelernt haben, ist genKI keine richtige Künstliche Intelligenz, sondern ein Wahrscheinlichkeitsmodell. Sie fußt auf Datensätzen und unserer Vorstellung von Ästethik. Schließlich haben wir KI für Menschen entwickelt und selbst, wenn wir es nicht wahrhaben wollen, wir und unsere Sprache sind endlich. KIs wie Midjourney, ChatGPT, Dall-E und Stable Diffusion beruhen auf Prompts (Schlagwörter). Diese geben vor, wie das Bild aussehen soll, pickt die einzelnen Wörter aus möglichen Datensätzen (Kunstwerken) heraus und generiert. Doch wie beschreibt man ein Gesicht? Markanter Kiefer, runde Augen, gerade Nase? Oder sogar nur wunderschön?
Man merkt: Unser Wortschatz ist begrenzt. Uns fehlen die Adjektive und deshalb entstehen oft gleiche Gesichter, weil eine KI nach unserer allgemeinen Schönheitsdefinition generiert. Man möchte den Leuten ansprechende Bilder gestalten, so wie die Kunstschaffenden vor einem selbst. So entstehen Millionen Bilder mit dem gleichen Stil, Farbkombination, den gleichen Fehlern und Motiven. Deswegen ist die Masse das erste Indiz. So wie man Kunstschaffende am Stil erkennt, so erkennt man auch KI-Stile. Es sind zukünftig vielmehr die Muster, die sie verraten, statt zahlreiche Fehler.

Vor ein paar Jahren sahen KI-Bilder noch so aus:

Eine Frau im weißen Kleid. Abstrakte Hände versuchen Blumen zu halten.

Ein feenähnliches Wesen, das ihre Flügel in Händen hält.

Jetzt sehen sie vermeintlich professioneller aus:

Portraitzeichnung einer Frau mit Blumen als Haare.

Doch diese haben Fehler, die auf diesem hohen Level nicht passieren würden – peinliche, ausgearbeitete Anfängerfehler. Man musst hier verstehen, wie Kunstschaffende arbeiten und sich entwickeln, um ein KI-Bild anhand dessen zu identifizieren. Ein gutes Beispiel sind Kinder. Kinder malen Strichmännchen, dann später Figuren mit fünf Fingern, Haaren und Kleidung, Farben werden gezielter ausgewählt. Mit steigendem Alter kommen mehr und mehr Details hinzu. Ein älteres Kind denkt nicht daran, wieder Strichmännchen als fertiges Bild zu sehen, weil es mehr kann. Seine Anforderungen haben sich verändert und durch Übung steigern sich seine Fähigkeiten weiter. Aus einem Nikolaushaus wird ein rotes Haus, mit Fenstern, Türen und Ziegeln. Genau das können wir auf KI-Bilder übertragen. Es ist eine Frage der Fähigkeiten.
Alle Kunstschaffenden durchlaufen den Prozess. Jemand, der einen Apfel realistisch zeichnen kann, würde den Stängel nicht mit einer Linie darstellen, wenn er seine Bilder öffentlich zur Schau stellt.
Jedoch machen KIs häufig solcher Fehler. Nicht selten weist eine realistisch gezeichnete Figur sechs Finger, eine vergrößerte Pupille oder unterbrochene Haarsträhnen auf. Missgeschicke, die auf diesem hohen Niveau nicht passieren sollten. Der Messwert ist ganz klar vorhanden und spricht für ein KI-Bild.

Eine Elfe mit Rüstung und Schwert. Fehler sind rot eingekreist

Bei dieser Elfe ist vieles schiefgegangen. Besonders in der Symmetrie der Rüstung. Knöpfe sind schief und krumm, hier und da gibt es plötzliche Spitzen und Rundungen, die auf der anderen Seite fehlen. Zudem fehlt die rechte Hand am Schildgriff. Klare Anzeichen für eine KI.

Foto: Ein Pärchen mit Jacken schaut in die Ferne.

Foto: Ein Pärchen mit Jacken schaut in die Ferne. Fehler sind rot eingekreist.

Das Foto ist etwas schwieriger, aber auch hier steckt die KI im Detail. Plötzlich abgebrochene Haarenden, die eigentlich auslaufen sollten und die Verschmelzung der Haut mit Strähnen sind am auffälligsten. Aber auch die Kleidung weist Fehler auf. An der Jacke der Frau ist eine dicke Falte, die so aussieht, als ob sie ein Träger einer Tasche wäre. Bei der Beschaffung des Stoffes ist eine Falte eher unwahrscheinlich, und wenn es ein Träger wäre, wo verläuft er weiter? Fehlende durchgehende Logik ist bei generativer KI sehr üblich und definitiv ein Zeichen.

Eine mehrgewichtige Frau steht in einer mitteralterlichen Taverne.

Eine mehrgewichtige Frau steht in einer mitteralterlichen Taverne. Fehler sind rot eingekreist.

Eine wunderschöne Illustration, die man häufig im Buchsektor in ähnlichen Stilen antreffen kann. Doch halt! Hier hat die KI besonders im Hintergrund ‚‚gewerkelt‘‘. Eine Laterne vor einem Fenster, fehlende Gesichtsperspektive und wirre Handakrobatik mit … Sachen? Sehr viele Hinweise finden sich im Hintergrund wieder. Zudem fehlt auch hier die Durchgängigkeit (der linke Arm). Die Haare müssen hinter dem sehr komischen Arm (?) sein.

Der Uncanny Valley- Effekt

Im Jahr 1970 beschrieb Masahiro Mori ein paradox erscheinendes Phänomen – den heutigen Uncanny Valley- Effekt, der bei künstlich erschaffenen Figuren auftritt. Beobachtungen zufolge fühlen wir uns bei roboterartigen menschlichen Zügen unbehaglich und akzeptieren diese Figur erst, wenn sie entmenschlicht oder menschlicher designt wird. Ein Phänomen, welches auch in der genKI stark hervorgetreten ist. Oft äußert es sich mit Skepsis und dem Gefühl, dass etwas seltsam aussieht, ohne es wirklich benennen zu können. Unsere Erfahrungen zeigen, was realistisch genug dargestellt wird und was nicht. Das können Unstimmigkeiten in der Symmetrie, die falsche Struktur, eine unpassende Anatomie oder steife Mimik sein, wohingegen Stofftiere und andere verniedlichte Figuren, wie in Animes oder Animationsfilmen, akzeptiert werden, obwohl sie weniger Mimik aufweisen. Das Zwischenfeld ist entscheidend. Da genKI auf trainierten, zusammengewürfelten Datensätzen beruht, kommt es noch immer zu dem unbehaglichen Gefühl, wenn wir ein fehlerhaftes KI-Bild betrachten. Es fehlt die natürliche Harmonie.

Eine Puppe mit unatürlichem Gesicht und rote Blumen auf dem Kopf.

Ein junges 3D Mädchen in einem Office lächelt unnatürlich in die Kamera.

Fehler, die KIs (noch immer) gern machen:

Haare fliegen wild herum und wirken nicht organisch
Verschmelzen von Dingen, oft im Hintergrund
schiefe Perspektiven
Unmenge an Details, die nicht identifizierbar sind
unterbrochene Linien
sehr starke Kontraste
Details, die keinen Sinn ergeben (z. B. eine Kamera mit fünf Knöpfen auf der Vorderseite)
Frames (stark pixelig an den Konturen)
Haut fehlt plötzlich an Textur (Fotos)
Hände
plötzlich schiefe Partien
Augen wirken seelenlos
merkwürdige Details im Hintergrund
Anatomie
Physikalisch fragwürdig, wie bei Pflanzen, die so groß sind wie ein Haus