Gemini 3.1 Flash Live: Google verbessert sein Audio-Modell

2 months ago 19

Das nächste Modell bitte! Google legt nach und präsentiert mit Gemini 3.1 Flash Live die nächste Version seines Audio- und Sprachmodells. Man verspricht hierbei eine höhere Präzision und geringere Latenzen, was Gespräche mit der KI flüssiger machen soll. Verfügbar ist das Ganze für Entwickler über die API im Google AI Studio sowie für Unternehmenskunden. Aber auch Nutzer von Search Live und Gemini Live kommen direkt in den Genuss der Neuerungen.

In Benchmarks wie dem ComplexFuncBench Audio erreicht das Modell wohl 90,8 Prozent und schlägt damit den Vorgänger. Auch das Verstehen von Unterbrechungen oder Sprechpausen im echten Leben klappt laut Google besser. Dazu kommt ein feineres Gespür für Tonfälle. Das System erkennt eher, ob jemand frustriert oder verwirrt klingt und passt die Reaktion entsprechend an, was beim alten 2.5 Flash Native Audio noch nicht so gut funktionierte.

Im Alltag bei der Nutzung von Gemini Live soll sich das durch schnellere Antworten bemerkbar machen. Google gibt an, dass der Gesprächsfaden nun doppelt so lange behalten werden kann, was bei Brainstormings hilfreich ist. Könnt ihr ja direkt mal mit Search Live testen.

Transparenz: In diesem Artikel sind Partnerlinks enthalten. Durch einen Klick darauf gelangt ihr direkt zum Anbieter. Solltet ihr euch dort für einen Kauf entscheiden, erhalten wir eine kleine Provision. Für euch ändert sich am Preis nichts. Partnerlinks haben keinerlei Einfluss auf unsere Berichterstattung.

Read Entire Article

Gemini 3.1 Flash Live: Google verbessert sein Audio-Modell

Related

BOOX Go 6 (Gen II): Kompakter E-Reader mit Stift-Unterstützu...

Zattoo: Neue Kanäle von Rakuten TV starten

Deutsche Bahn: Mehr Bodycams für das Personal