OpenAI öffnet sein Sprachmodell GPT-5.5 für Sicherheitsforscher und stellt zusätzlich eine Variante namens GPT-5.5-Cyber bereit, die deutlich weniger Anfragen ablehnt. Zugang bekommen zunächst nur überprüfte Verteidiger, die kritische Infrastruktur schützen und sich über das Programm "Trusted Access for Cyber" verifizieren lassen.
Standard-Chatbots verweigern in der Regel Anfragen, die nach Anleitungen für Hackerangriffe klingen, weil sie Missbrauch verhindern sollen. Diese Filter behindern aber auch legitime Sicherheitsarbeit, etwa wenn jemand eine bekannte Schwachstelle nachstellen will, um sie zu schließen.
OpenAI staffelt den Zugriff nun in drei Stufen: das öffentliche Modell mit den üblichen Sperren, eine Zwischenstufe mit gelockerten Filtern für defensive Arbeit, und GPT-5.5-Cyber mit den wenigsten Einschränkungen für autorisierte Angriffstests.
Erlaubt sind damit Aufgaben wie das Analysieren von Schadsoftware oder das Prüfen von Sicherheits-Updates. Blockiert bleiben laut OpenAI etwa der Diebstahl von Passwörtern oder Angriffe auf fremde Systeme.
Wie weit die Lockerung reicht, zeigen die Beispiele in der Ankündigung. Bittet man das öffentliche Modell, einen funktionierenden Exploit für eine bekannte Schwachstelle zu schreiben, lehnt es ab. Die mittlere Stufe liefert den Code mitsamt Dokumentation. GPT-5.5-Cyber geht noch einen Schritt weiter und führt den Angriff im Demo-Szenario gegen einen Testserver tatsächlich aus, übernimmt das System und liest Systeminformationen aus.
OpenAI betont, die neue Cyber-Variante sei nicht klüger als das Standardmodell, sondern nur freizügiger bei Sicherheitsthemen. Ab dem 1. Juni 2026 müssen Einzelnutzer der höchsten Zugriffsstufe phishing-resistente Authentifizierung aktivieren. Als Partner nennt OpenAI unter anderem Cisco, CrowdStrike, Palo Alto Networks, Cloudflare, Intel, Snyk und SentinelOne. Über Codex Security erhalten zudem ausgewählte Entwickler wichtiger Open-Source-Projekte vergünstigten Zugriff.
Wettlauf mit Anthropics Mythos
Die Freigabe fällt in eine Phase, in der sich Silicon Valley und das Weiße Haus mit den Angriffsfähigkeiten neuer KI-Modelle beschäftigen. Eine Quelle sagte gegenüber dem Tech-Magazin Axios, GPT-5.5-Cyber liege beim Aufspüren und Ausnutzen von Software-Lücken etwa auf dem Niveau von Anthropics Mythos Preview.
Anthropic verfolgt einen strengeren Kurs und gibt Mythos nur rund 40 Organisationen über das Projekt Glasswing frei. OpenAI wählt einen breiteren, gestuften Weg. Im Weißen Haus werden derzeit Anordnungen diskutiert, die der Regierung künftig mehr Mitsprache bei der Veröffentlichung solcher Modelle geben könnten.
Vor kurzem hatte das britische AI Security Institute GPT-5.5 getestet. In einer simulierten Angriffsserie auf ein Firmennetzwerk mit 32 Schritten kam das Modell in 2 von 10 Durchläufen ans Ziel, Mythos schaffte 3 von 10. Bei einzelnen Expertenaufgaben lag GPT-5.5 sogar knapp vorn.
KI-News ohne Hype – von Menschen kuratiert
Mit dem THE‑DECODER‑Abo liest du werbefrei und wirst Teil unserer Community: Diskutiere im Kommentarsystem, erhalte unseren wöchentlichen KI‑Newsletter, 6× im Jahr den "KI Radar"‑Frontier‑Newsletter mit den neuesten Entwicklungen aus der Spitze der KI‑Forschung, bis zu 25 % Rabatt auf KI Pro‑Events und Zugriff auf das komplette Archiv der letzten zehn Jahre.



