Google hat seine KI-Bildgenerierung mit Gemini 2.0 Flash in einer Vorschauversion freigegeben. Die neue Version bringt nicht nur höhere Nutzungslimits mit sich, sondern auch deutliche Verbesserungen bei der Bildqualität, so Google. Besonders die Textwiedergabe in generierten Bildern wurde optimiert – ein Punkt, der bei vielen KI-Bildgeneratoren bislang problematisch war.
Die Integration erfolgt über die Gemini API in Google AI Studio oder Vertex AI unter Verwendung des Modellnamens „gemini-2.0-flash-preview-image-generation“. Entwickler können damit unmittelbar beginnen, die Bildgenerierung in ihre Projekte einzubauen.
Das System erlaubt es, Produkte in neue Umgebungen zu setzen, Bilder in Echtzeit kollaborativ zu bearbeiten und gezielt einzelne Bildbereiche zu modifizieren, ohne den Rest des Bildes zu verändern. Besonders für E-Commerce-Anwendungen dürfte die Möglichkeit interessant sein, dynamisch neue Produktvarianten mit entsprechender Beschriftung zu erstellen.
from google import genai
from google.genai import types
client = genai.Client(api_key="GEMINI_API_KEY")
response = client.models.generate_content(
model="gemini-2.0-flash-preview-image-generation",
contents=(
"Show me how to bake a macaron with images."
),
config=types.GenerateContentConfig(
response_modalities=["TEXT", "IMAGE"]
),
)
Aktuell befindet sich die Funktion noch in der Vorschauphase. Google kündigt bereits weitere Qualitätsverbesserungen, neue Funktionen und erweiterte Nutzungslimits an. Die bisherigen Ergebnisse zeigen jedoch schon jetzt deutliche Fortschritte gegenüber der experimentellen Version, so Google.
Transparenz: In diesem Artikel sind Partnerlinks enthalten. Durch einen Klick darauf gelangt ihr direkt zum Anbieter. Solltet ihr euch dort für einen Kauf entscheiden, erhalten wir eine kleine Provision. Für euch ändert sich am Preis nichts. Partnerlinks haben keinerlei Einfluss auf unsere Berichterstattung.

8 months ago
8



