GPT-5.3-Codex-Spark: Echtzeit-Coding mit 1000 Token pro Sekunde

3 months ago 25

OpenAI schlägt mit dem neuen GPT-5.3-Codex-Spark einen anderen Weg ein als bei den bisherigen großen Modellen. Statt komplexe Aufgaben über lange Zeit autonom abzuarbeiten, liegt der Schwerpunkt hier auf direkter Reaktion und minimaler Verzögerung. Die aktuelle Research Preview richtet sich an Entwickler, die schnelle Antworten brauchen und nicht auf die Fertigstellung umfangreicher Prozesse warten wollen.

Das Modell entstand demnach aus der Zusammenarbeit mit Cerebras, die bereits im Januar angekündigt wurde. Technisch setzt Codex-Spark auf die Wafer Scale Engine 3 des Chipherstellers, einen Beschleuniger für High-Speed-Inferenz. Das Resultat zeigt sich in den Zahlen: Über 1000 Token pro Sekunde schafft das Modell bei der Ausgabe. Zum Vergleich bringen die großen Frontier-Modelle zwar mehr Leistung bei komplexen Problemen, brauchen dafür aber deutlich länger.

Das Modell arbeitet gezielt und schlank, nimmt minimale Änderungen vor und hält sich zurück, sofern nicht explizit mehr verlangt wird. Tests laufen nur auf Anfrage, nicht automatisch. Das Kontextfenster liegt bei 128.000 Token, das Modell verarbeitet reinen Text. In Benchmarks wie SWE-Bench Pro und Terminal-Bench 2.0 zeigt sich: Die Genauigkeit bleibt solide, die Geschwindigkeit aber steigt massiv im Vergleich zum regulären GPT-5.3-Codex.

Interessanterweise steckt nicht nur bessere Hardware hinter der Performance. OpenAI hat laut eigenen Aussagen die gesamte Request-Response-Pipeline überarbeitet. Persistente WebSocket-Verbindungen ersetzen das bisherige System, die API wurde optimiert. Dadurch sinkt der Overhead pro Roundtrip zwischen Client und Server um 80 Prozent. Die Zeit bis zum ersten sichtbaren Token halbierte sich laut den Entwicklern. Diese Anpassungen sollen später für alle Modelle Standard werden. Klingt alles vor allem nach Entwickler-Sprech und das hat eben auch seine Gründe.

Aktuell läuft Codex-Spark als Research Preview für ChatGPT Pro-Nutzer. Verfügbar ist das Modell in der Codex-App, über die CLI und in der VS Code-Extension. Wegen der speziellen Hardware gelten während der Testphase eigene Ratenlimits, die nicht auf normale Kontingente angerechnet werden.

Transparenz: In diesem Artikel sind Partnerlinks enthalten. Durch einen Klick darauf gelangt ihr direkt zum Anbieter. Solltet ihr euch dort für einen Kauf entscheiden, erhalten wir eine kleine Provision. Für euch ändert sich am Preis nichts. Partnerlinks haben keinerlei Einfluss auf unsere Berichterstattung.

Read Entire Article

GPT-5.3-Codex-Spark: Echtzeit-Coding mit 1000 Token pro Sekunde

Related

Google NotebookLM bekommt ein Upgrade spendiert

Funkferngesteuertes Spielzeug im Visier der EU: Jedes zweite...

LG UltraGear: Neue Gaming-Monitore starten in den Verkauf