Thema:
Re:LAION flat
Autor: JPS
Datum:03.05.23 17:12
Antwort auf:Re:LAION von Alopex

>Andererseits ist das aber nur ein IST-Zustand, und ich sehe nicht, warum sich das nicht anders entwickeln könnte. Entsprechendes Material und Tagging vorausgesetzt ist das nicht per se undenkbar.

Das hätte mit dem technischen Prinzip und dem Ziel aktueller Lösungen dann aber gar nichts mehr zu tun.

Dafür, dass so eine KI beliebige Bilder erzeugen kann, ist es gerade nicht erwünscht, dass dort die Ursprungsdaten zu konkret und unverändert gespeichert sind - das Ziel ist es die (in diesem Fall) visuelle Essenz unserer Welt einzufangen und nicht das konkrete Motiv.

Wenn ich also eingebe, dass ich ein schwarze Frau mit naturblonden Haaren und Muskeln im Umfang eines typischen männlichen Bodybuilders und der Größe von nur 1,20m auf einem Einhorn reiten lassen will, dann muss er das können, weil er alle diese Begriffe wie ein Mensch einordnen kann. Er soll dafür nicht auf ein Ausgangsbild einer solchen Frau oder dieser speziellen Szene angewiesen sein.

Und das Bild soll dann auch nicht mit jedem Seed das gleiche sein, da er nur eine schwarze Frau mit naturblonden Daten gespeichert hat, sondern die KI muss wissen in welcher Range sich eine schwarze Frau von den Gesichtszügen abspielt, dieser die passende Haut- und Haarfarbe geben und das Ganze auch noch mit den Muskeln und der Größe stimmig in Einklang bringen, so wie es ein Mensch in seiner Vorstellung könnte, weil er die Muster begriffen hat und nicht weil er das konkrete Motiv schon einmal gesehen hat und möglichst gut kopieren kann.

Das siehst Du auch ohne genaues Verständnis der Technik (das ich auch nicht habe) daran, dass solche Models nur 2-8 GB groß sind und sie dennoch bereits jetzt fast alles aus jedem Winkel zumindest grob darstellen können.

Dass weltweit bekannte Promis direkt abrufbar sind, ist eher ein Nebeneffekt, weil deren Bilder eben in so großer Stückzahl im Internet verbreitet sind und somit die konkreten Kombination aus Vektoren tatsächlich mit den Worten/Namen in Verbindung stehen.

Die Anzahl von Silben und Worten ist aber stark begrenzt, so dass das immer nur für eine sehr begrenzte Anzahl an Personen (in einem allgemeingehaltenen Model eben weltweit bekannte Promis) funktionieren kann. Du kannst mit einer begrenzten Anzahl an Worten nicht die Gesichter größerer Teile der der Weltbevölkerung in so ein Model reinbringen und sie konkret abrufbar machen. Ein größeres Datenset kann nur dazu dienen die Zuordnung zu verfeinern und alle möglichen Variationen besser abdecken zu können.

>Und gibt es nicht schon / war nicht schon die Rede von Bildgeneratoren, bei denen man eigenes Bildmaterial hochlädt, und das manipulieren lässt?
>Und jetzt denkst du mal an den unheimlichen Nachbarn, der heimlich deine Kinder fotografiert, und ein lokales TruthStableDiffusion damit füttert. Würdest du nicht wollen.


Das Problem entsteht hier aber doch nicht bei der Bildbearbeitung, sondern im Kopf Deines Nachbarn.

Der Nachbar kann auch ganz ohne solche "KI"-Systeme Bilder von Deinen Kindern machen oder im Internet suchen und dann deren Gesicht mit Photoshop auf irgendein anderes Bild montieren. Wie gesagt, sollte das nach ein paar Youtube-Videos nahezu jeder mit ausreichend Interesse/Motivation hinbekommen.

Oder er hat genug Fantasie, dass er diese Nachbearbeitung gar nicht erst braucht.

Was würde sich also ändern? Würde das einfache Erzeugen solcher Bilder die Wahrscheinlichkeit erhöhen, dass er es im Real-Life erleben will? Würde es an seinem Interesse an Deinen Kindern etwas ändern?

Auch ohne KI werden sich schon genügend Männer einen auf die Bilder der Kollegin von der Firmenwebsite oder auf Fotos von Firmenfeiern gekeult haben. Oder eben auch ganz klassisch rein auf den Gedanken an sie.

Was würde ein Fake-Bild daran ändern? Der Ersteller wüsste dass es Fake und der dargestellte Körper nicht der echte ist, Dritte würden die Echtheit anzweifeln, in ein paar Jahren und mit noch einfacherer Zugänglichkeit zu hochwertigen Lösungen noch mehr als heute. Für mehr als eine private Phantasie-Stütze zu einer ohnehin schon vorhandenen Phantasie wird so ein Bild also nicht taugen.

>2) Ich sehe auf immer mehr Seiten Hinweise, die DataMining etc. untersagen, zuletzt fiel es mir bei SPON auf. Ich nehme mal an, jeder Stock-Anbieter und jeder Fotograf auf der Höhe der Zeit macht das mittlerweile. Und ich wette, solches Material ist in den DB ebenfalls enthalten.

In Zukunft wird es damit sicher schwieriger noch größere Bildersammlungen zusammenzustellen. Auch Gesetze werden sicher noch verfeinert und um weitere Einschränkungen erweitert. Oft auch aus Unverständnis, so wie die Verpixelung bei Google Street View.

>3) Zu den Patientenbildern und der Verantwortung von Schuhmann: Du kannst ja auch nicht durch die Straße laufen, und jedes Fahrrad, das nicht abgeschlossen ist, mitnehmen und dann sagen: Ich bin kein Dieb, der Besitzer hätte das Fahrrad halt nicht da hin stellen dürfen.

Diebstahl und das Erstellen einer digitale Kopie sind nicht das gleiche. Zumal gerade das Erstellen der digitalen Kopie in dem Fall sogar explizit vom Gesetzgeber genau für diesen Zweck erlaubt wurde.

>Meine Sicht: Unabhängig davon, wie praktikabel oder technisch machbar das ist, wenn du Datenbanken mit Fremdmaterial erstellst, musst du aktiv prüfen, ob du das auch darfst.

Sehe ich nicht so, zumindest nicht wenn diese Bilder eben nicht das Endergebnis sind, sondern nur als Zwischenschritt nötig sind, um unsere Welt und deren Besonderheiten digital einzufangen. Für mich ist das wie die Angst von afrikanischen Ureinwohnern, dass ihre Seelen gefangen werden, wenn jemand ein Photo von ihnen macht - Angst vor unbekannter und nicht verstandener Technik.


< antworten >