Google präsentiert Gemma 4: Agenten-Workflows und Edge-Optimierung

2 weeks ago 5

Google hat die vierte Generation seiner Gemma-Modellreihe veröffentlicht. Im Mittelpunkt stehen diesmal agentenbasierte Workflows, logisches Schließen und eine bessere Ausnutzung der verfügbaren Parameter. Alle vier Modelle (31B Dense, 26B MoE (Mixture-of-Experts), E2B und E4B) sind unter der Apache-2.0-Lizenz verfügbar, was kommerzielle Nutzung und eigene Anpassungen ausdrücklich erlauben soll.

Die Edge-Modelle kommen mit einem Kontextfenster von 128.000 Token, die großen Varianten verdoppeln das auf 256.000 Token. Alle vier Modelle verarbeiten Bilder und Videos in variabler Auflösung, was sie für Aufgaben wie OCR oder Diagrammanalyse brauchbar macht. Die Edge-Modelle verarbeiten nativ auch Audio, also gesprochene Sprache, ohne dass dafür separate Transkriptionstools nötig wären. Trainiert wurde auf über 140 Sprachen.

Für Entwickler gibt es von Tag eins an native Unterstützung für Function-Calling, strukturierte JSON-Ausgaben und System Prompts – also die üblichen Bausteine für KI-Agenten. Die Modellgewichte selbst sind auf Hugging Face, Kaggle und Ollama verfügbar.

Transparenz: In diesem Artikel sind Partnerlinks enthalten. Durch einen Klick darauf ge­lan­gt ihr direkt zum Anbieter. Solltet ihr euch dort für einen Kauf entscheiden, erhalten wir ei­ne kleine Provision. Für euch ändert sich am Preis nichts. Partnerlinks haben keinerlei Einfluss auf unsere Berichterstattung.

Read Entire Article