Neues Claude Mythos löst erstmals alle Cyber-Angriffssimulationen der britischen KI-Sicherheitsbehörde

3 weeks ago 11

Die Cyber-Fähigkeiten von Frontier-KI-Modellen steigen schneller als bisher angenommen. Das britische AI Security Institute (AISI) hat seine Einschätzung innerhalb weniger Monate zweimal nach oben korrigiert.

Im November 2025 schätzte die Behörde die Verdopplungszeit der Cyber-Fähigkeiten auf acht Monate. Bis Februar 2026 revidierte sie den Wert auf 4,7 Monate. Anthropics Claude Mythos Preview und OpenAIs GPT-5.5 hätten nun selbst diesen beschleunigten Zeitplan "substanziell übertroffen", so das AISI. Ob es sich um einen neuen Trend oder einen einmaligen Sprung handelt, sei derzeit unklar.

Mythos Preview löst erstmals beide Cyber-Ranges des AISI

Besonders bei den sogenannten Cyber Ranges des AISI, also komplexen Angriffssimulationen, haben sich die Fähigkeiten der Modelle gesteigert. Bei einem 32-Schritte-Angriff auf ein simuliertes Unternehmensnetzwerk, für den menschliche Experten laut AISI rund 20 Stunden benötigen würden, schloss der neueste Mythos-Preview-Checkpoint den vollständigen Angriff in 6 von 10 Versuchen ab. Dieser Checkpoint wurde auch an Partner ausgerollt. Die zuvor getestete Mythos-Version schaffte das nur in 3 von 10 Versuchen.

Absolvierte Schritte (0 bis 32) mit Meilensteinen von M1 (Reconnaissance) bis M9 (Full network takeover). Die Linien älterer Modelle (z. B. GPT-4o) flachen früh ab. Die Kurven der neuesten Modelle („Mythos Preview“, „GPT-5.5“) steigen ab 1 Mio. Token steil an. Zwei gestrichelte Linien zeigen Bestversuche, die das Maximum von 32 Schritten (M9) erreichen.

Zudem löste das Modell die Simulation "Cooling Tower", ein industrielles Steuerungssystem, in 3 von 10 Versuchen. Kein anderes Modell hatte diese Simulation zuvor bestanden, auch die frühere Mythos-Version nicht.

"Die Richtung ist klar: Cyber-Fähigkeiten schreiten rapide voran, und aktuelle Modelle stellen einen bedeutsamen Sprung gegenüber ihren Vorgängern dar", schreibt das AISI. Die Behörde arbeite bereits an härteren Evaluierungen mit aktiven Verteidigungsmaßnahmen, um mit der Entwicklung Schritt zu halten.

XBOW bestätigt Stärke bei Quellcode-Analyse, sieht aber Grenzen

Das auf offensive Sicherheit spezialisierte Unternehmen XBOW hat Mythos Preview unabhängig mit einem Team von zehn Experten getestet. Das Modell sei "ein großer Fortschritt" und zeige "token-for-token beispiellose Präzision" bei der Schwachstellenerkennung. Im Vergleich zu Anthropics Opus 4.6 habe Mythos Preview die Zahl der falsch-negativen Ergebnisse um 42 Prozent reduziert. Mit zusätzlichem Zugang zum Quellcode betrug die Reduktion sogar 55 Prozent.

KI-Modelle von Anthropic, Google und OpenAI. „Mythos Preview“ führt mit einem Wert von knapp 11 deutlich vor „GPT-5.5“ (ca. 7,5). Die Vorgängermodelle sowie „Gemini 3.1 Pro“ liegen weit abgeschlagen zwischen Werten von 2 und 5.

Die größte Stärke von Mythos Preview liegt laut XBOW in der Quellcode-Analyse. "Das war die erste Instanz eines Themas, das immer wieder auftauchte: Mythos Preview ist beeindruckend beim Schreiben von Code, aber noch beeindruckender beim Lesen", heißt es im Bericht. Das Modell fand auch Schwachstellen in der V8-Sandbox von Chromium, einem Bereich, in dem frühere Modelle ausschließlich Fehlalarme produziert hatten.

Allerdings zeigt die XBOW-Evaluation auch die Grenzen dieser Stärke. Der Zugang zu einem laufenden System sei in vielen Fällen wichtiger als der Zugang zum Quellcode, da sich viele Schwachstellen erst aus Konfiguration, Abhängigkeiten oder dem Zusammenspiel eigentlich sicherer Komponenten ergeben.

Selbst bei Benchmarks, bei denen die Schwachstelle rein im Code lag, schadete der Entzug des Live-Zugangs der Leistung stärker als der Entzug des Quellcodes. Mythos Preview kann Code hervorragend lesen, bleibt aber auf die Interaktion mit laufenden Systemen angewiesen, um sein volles Potenzial auszuspielen.

Mächtig, aber teuer: Die Kosten relativieren den Vorsprung

XBOW stellt eine Frage, die angesichts der zuletzt deutlich gestiegenen KI-Modellkosten relevant ist: Steht der Nutzen im Verhältnis zu den Kosten? Anthropic habe angekündigt, dass Mythos Preview fünfmal so teuer sein werde wie ein Opus-Modell.

Bei einer Normalisierung nach geschätzten Betriebskosten sei Mythos Preview auf den XBOW-Benchmarks "nicht best-in-class". Die Alternative wäre, einem Agenten mit GPT-5.5 mehr Zeit zu geben. Das liefere in vielen Fällen bei geringeren Kosten gleichwertige oder bessere Ergebnisse.

"Die bessere Option hängt vom Anwendungsfall ab; oft ist es letztere", schreibt XBOW. Das Unternehmen empfiehlt, einen "Kader von Modellen" einzusetzen, statt sich auf ein einzelnes zu fixieren.

„Trace Mining“ ist blau („Good“), „Threat Model“ gelb („Fair“) und „Command Safety“ orange („Mediocre“). Eine Zusatzspalte liefert kurze Erklärungen zur jeweiligen Wertung.

Anthropic: "In einem Jahr wird Mythos ziemlich dumm aussehen"

Logan Graham, der bei Anthropic das Red-Teaming rund um Projekt Glasswing leitet, ordnet die Ergebnisse ein: Glasswing-Partner hätten mit Mythos Preview in wenigen Wochen "viele tausende geschätzt hochkritische Schwachstellen" gefunden, "manchmal doppelt so viele, wie sie normalerweise in einem Jahr finden würden".

Doch Graham betont, es gehe nicht um den Hype um ein einzelnes Modell. "Innerhalb eines Jahres wird Mythos wahrscheinlich ziemlich dumm aussehen (relativ zu anderen neuen Modellen)."

Die eigentliche Botschaft sei die Vorbereitung auf eine Welt, in der Modelle "besser, schneller, billiger und kreativer als einige der besten menschlichen Experten" bei Dual-Use-Fähigkeiten seien. Andere Anbieter könnten offen verfügbare oder ungesicherte Modelle mit Mythos-Niveau veröffentlichen.

Cybersecurity wird noch politischer

Anthropic hatte Claude Mythos Anfang April vorgestellt und den Zugang auf rund 50 Unternehmen beschränkt, offiziell aus Sicherheitsgründen. Kritiker hielten die Zurückhaltung für überzogen oder sahen darin ein PR-Manöver.

Die Wahrheit dürfte in der Mitte liegen: Claude Mythos ist womöglich kein beispielloser Ausreißer, aber das erste vorgestellte Modell seiner Art mit deutlich fortgeschrittenen Cyber-Fähigkeiten, die über das bisher bekannte Maß hinausgehen. Das erzeugt Handlungsdruck in der Softwarebranche, aber auch in der Politik.

So befasst sich die US-Regierung intensiv mit Claude Mythos und testet das Modell bereits, während Anthropic China und offenbar auch der EU den Zugang verwehrt. OpenAI ging zumindest auf die EU zu, um über einen frühen Zugang zu GPT-5.5-Cyber zu sprechen. In jedem Fall zeigt sich hier die weitreichende Abhängigkeit der Europäischen Union vom Wohlwollen großer US-Technologiekonzerne, da es an vergleichbaren europäischen Produkten mangelt.

KI-News ohne Hype – von Menschen kuratiert

Mit dem THE‑DECODER‑Abo liest du werbefrei und wirst Teil unserer Community: Diskutiere im Kommentarsystem, erhalte unseren wöchentlichen KI‑Newsletter, 6× im Jahr den "KI Radar"‑Frontier‑Newsletter mit den neuesten Entwicklungen aus der Spitze der KI‑Forschung, bis zu 25 % Rabatt auf KI Pro‑Events und Zugriff auf das komplette Archiv der letzten zehn Jahre.

Jetzt abonnieren

Read Entire Article