
Nutzer von Ollama bekommen neue Funktionen an die Hand. Das Tool, das bisher primär für das lokale Ausführen von Sprachmodellen bekannt ist, unterstützt ab sofort experimentell die Generierung von Bildern. Der Start erfolgt vorerst auf dem Mac, Versionen für Windows und Linux sollen aber bald folgen.
Die Bedienung erfolgt wie gewohnt über das Terminal, beispielsweise mit dem Befehl ollama run x/z-image-turbo gefolgt vom gewünschten Prompt. Wer kompatible Terminals wie Ghostty oder iTerm2 im Einsatz hat, sieht die Ergebnisse direkt inline, gespeichert wird die Datei im aktuellen Verzeichnis.
Zum Start stehen ein paar Modelle bereit. Z-Image Turbo stammt aus Alibabas Tongyi Lab, nutzt 6 Milliarden Parameter und wird unter der Apache-2.0-Lizenz vertrieben. Der Fokus liegt hier auf fotorealistischen Ergebnissen sowie der korrekten Darstellung von englischem und chinesischem Text innerhalb der Bilder. Ebenfalls verfügbar ist FLUX.2 Klein von Black Forest Labs. Das Modell gibt es in einer Variante mit 4 Milliarden Parametern unter Apache 2.0 sowie als 9-Milliarden-Version unter einer nicht-kommerziellen Lizenz. FLUX.2 Klein soll besonders bei Text in Bildern und UI-Entwürfen punkten.
Wer tiefer einsteigen will, kann diverse Parameter anpassen. Über entsprechende Befehle lassen sich Breite und Höhe des Outputs definieren, wobei kleinere Bilder natürlich schneller berechnet sind und weniger Speicher belegen. Auch die Anzahl der Berechnungsschritte kann justiert werden, wobei Ollama hier meist schon passende Standardwerte vorgibt. Lest euch bei Bedarf und Interesse gern ein.
Transparenz: In diesem Artikel sind Partnerlinks enthalten. Durch einen Klick darauf gelangt ihr direkt zum Anbieter. Solltet ihr euch dort für einen Kauf entscheiden, erhalten wir eine kleine Provision. Für euch ändert sich am Preis nichts. Partnerlinks haben keinerlei Einfluss auf unsere Berichterstattung.

1 month ago
4


