Ideogram 4.0: Neues Open-Weight-Bildmodell mit 2K-Auflösung und präziser Textdarstellung veröffentlicht

4 days ago 10

Ideogram hat Version 4.0 seines Text-zu-Bild-Modells als offenes Modell veröffentlicht.

Zu den neuen Funktionen gehören laut Ideogram native 2K-Auflösung, transparente Hintergründe, präzise Layout-Steuerung per Bounding Boxes und eine präzise Textdarstellung in Bildern, etwa für Logos und Poster. Editierbarer Text und Ebenen sollen bald folgen.

Das Modell kann auf eigener Hardware betrieben und mit eigenen Daten feinabgestimmt werden. Gewichte und Code stehen bei Github zum Download bereit, die kommerzielle Nutzung benötigt allerdings eine Bezahllizenz.

Laut dem Leaderboard von DesignArena liegt Ideogram 4.0 auf Platz 1 unter allen Open-Weight-Modellen, nur geschlossene Modelle von OpenAI und Google schneiden besser ab. Auch in der Text-to-Image-Arena liegt es im Quality-Modus auf 1, insgesamt auf Platz 9. Laut der Ideogram-Webseite ist das Modell über die eigene gehostete API in drei Qualitätsstufen verfügbar:

Qualitätsstufe Preis pro Bild
Turbo 0,03 Dollar
Default 0,06 Dollar
Quality 0,10 Dollar

Zusätzlich ist Ideogram 4.0 im Web und auf Partnerplattformen verfügbar, darunter Hugging Face, ComfyUI, fal, Runware, Magnific, Krea AI, Leonardo AI, Picsart, Cloudflare, Replicate, Gamma, Flora AI und Kittl. In unserem Benchmark-Prompt schneidet das Modell besser ab als Midjourney v8, ähnlich wie Flux, aber schlechter als GPT-Image-2, Nano Banana Pro oder Luma Uni-1.1.

KI-News ohne Hype – von Menschen kuratiert

Mit dem THE‑DECODER‑Abo liest du werbefrei und wirst Teil unserer Community: Diskutiere im Kommentarsystem, erhalte unseren wöchentlichen KI‑Newsletter, 6× im Jahr den "KI Radar"‑Frontier‑Newsletter mit den neuesten Entwicklungen aus der Spitze der KI‑Forschung, bis zu 25 % Rabatt auf KI Pro‑Events und Zugriff auf das komplette Archiv der letzten zehn Jahre.

Jetzt abonnieren

Read Entire Article