Google hat Whisk vorgestellt, ein neues KI-Tool, das Bilder generiert und dabei andere Bilder als Eingabeaufforderungen verwendet. Im Gegensatz zu älteren Tools, die stark auf lange, detaillierte Textbeschreibungen angewiesen sind, ermöglicht Whisk Berichten zufolge Benutzern das Hochladen von Bildern, um defi , die sie generieren möchten.
Das Tool unterstützt außerdem mehrere Bilder für jede dieser Eingaben, was den Benutzern erhebliche Flexibilität beim Experimentieren bietet. Wenn Sie zunächst kein Bild haben, verfügt Google über ein Würfelsymbol, das die Eingabeaufforderungen automatisch mit Bildern füllt.
Allerdings scheinen diese Platzhalterbilder ebenfalls KI-generiert zu sein. Benutzer können auch etwas Text hinzufügen, um die Ausgabe zu verfeinern, das Textfeld ist jedoch optional. Nach Angaben des Unternehmens liefert Whisk auch ohne Whisk Ergebnisse.
Das Tool generiert dann ein Bild und eine entsprechende Textaufforderung, die bei seiner Erstellung verwendet wurde. Wenn Ihnen das Ergebnis gefällt, können Sie es zu Ihren Favoriten hinzufügen oder herunterladen. Wenn Sie dies nicht tun, können Sie es verfeinern, indem Sie die zugrunde liegende Textaufforderung bearbeiten oder etwas völlig Neues erstellen.
Bild 3 unterstützt Googles Whisk AI
Laut Google ist Whisk für „schnelle visuelle Erkundung und nicht für pixelgenaue Bearbeitungen“ konzipiert. Obwohl es flexibel ist und Spaß macht, liefert es nicht jedes Mal einwandfreie Ergebnisse. Das Unternehmen räumt ein, dass das Tool „das Ziel verfehlen“ kann, weshalb schnelle Bearbeitungen für eine bessere Genauigkeit möglich sind.
Siehe auch „Ex-Friends“-Star Lisa Kudrow kritisiert Tom Hanks‘ Film „Here“ als Unterstützung für KI
Whisk läuft auf Googles neuestem Bildgenerierungsmodell Imagen 3, das das Unternehmen neben dem Tool ebenfalls angekündigt hat. Imagen 3 unterstützt Whisk bei der Erstellung seiner KI-generierten Ergebnisse, und die zugrunde liegende Technologie soll die Gesamtqualität der Ergebnisse verbessern.
Neben Imagen 3 stellte Google auch Veo 2 vor, sein verbessertes Videogenerierungsmodell. Veo 2 hat Berichten zufolge ein besseres Verständnis für Kinematografie und behebt häufige Probleme wie halluzinierte Merkmale – zum Beispiel den classic KI-Fehler von zusätzlichen Fingern.
Das Modell wird erstmals auf der VideoFX-Plattform von Google eingeführt, die sich noch in begrenzten Tests durch Google Labs befindet. Das Unternehmen sagt, dass Veo 2 irgendwann im Jahr 2025 auf YouTube Shorts und andere Google-Produkte ausgeweitet wird.
Derzeit positioniert das Unternehmen Whisk eher als Erkundungstool denn als professionelle Bearbeitungslösung. Ob es sich gegen Konkurrenten wie DALL-E von OpenAI behaupten kann, bleibt abzuwarten.
Ein Schritt-für-Schritt-System zum Start Ihrer Web3-Karriere und zur Erlangung hochbezahlter Krypto-Jobs in 90 Tagen.