OpenAI bringt GPT-5-Intelligenz in Echtzeit-Sprachmodelle

1 month ago 12

OpenAI hat mit GPT-Realtime-2 ein neues Sprachmodell vorgestellt, das über die API verfügbar ist. Was das Modell von seinen Vorgängern unterscheidet, ist die Tatsache, dass es erstmals GPT-5-Niveau beim Denken und Schlussfolgern in Echtzeit-Sprachinteraktionen mitbringt. Das klingt erstmal technisch trocken, ist aber eigentlich ein ziemlich großer Schritt für alle, die Sprachagenten entwickeln.

Bisher sind Sprachassistenten oft eher reaktiv – man stellt eine Frage, bekommt eine Antwort. Mit GPT-Realtime-2 sollen Sprachagenten komplexere Aufgaben direkt im Gesprächsverlauf lösen können, also wirklich mitdenken, während das Gespräch läuft, nicht nur auf vorgefertigte Muster zurückgreifen.

Zusammen mit GPT-Realtime-2 hat OpenAI zudem zwei weitere Modelle veröffentlicht: GPT-Realtime-Translate für Echtzeit-Übersetzung und GPT-Realtime-Whisper für Audio-Transkription. Alle drei sind als Streaming-Modelle über die API abrufbar.

Transparenz: In diesem Artikel sind Partnerlinks enthalten. Durch einen Klick darauf ge­lan­gt ihr direkt zum Anbieter. Solltet ihr euch dort für einen Kauf entscheiden, erhalten wir ei­ne kleine Provision. Für euch ändert sich am Preis nichts. Partnerlinks haben keinerlei Einfluss auf unsere Berichterstattung.

Read Entire Article