Thema:
Re:Mega Lol - Gemini Fail flat
Autor: _bla_
Datum:22.03.24 15:11
Antwort auf:Mega Lol - Gemini Fail von Optimus Prime

>Ich hab hier ein Trainingszertifikat mit einem QR Code zur Validierung.
>
>Hab einen Screenshot vom QR Code gemacht, in Gemini hochgeladen und gefragt wo der QR code hinführt.
>
>Ich bin dann auf TEMU geleitet worden um einen PC zu kaufen.
>
>Nehme ich nun mein Telefon und nutze die Kamera leitet mich der QR Code zur richtigen Homepage zur Zertifikatsvalidierung.
>
>Was für ein AI Scherz.


Das ist für ein LLM ein richtig schwierige Aufgabe. Eine QR Code zu dekodieren ist eine komplett andere Aufgabe, als die Sprach- und Bildzuordnungstasks für die die Netzwerke trainiert wurden. Gehe davon aus, das LLMs wie Gemini Aufgaben erledigen können, die auch Menschen ganz gut können, aber bei Aufgaben versagen, die bisher durch komplexe Programme erledigt wurden, aber von einem Menschen höchstens mit Papier, Stift und sehr viel Zeit zu lösen wäre, auf für LLMs sehr schwierig sind.

Das lässt sich halt darüber lösen, in dem man dem LLM einen QR Dekoder Plugin zur Verfügung stellt und dem LLM beibringt, wenn er einen QR Code erkannt hat, den durch den entsprechendes externe Tool zu schicken.


< antworten >