Anthropic warnt erneut: Claude Mythos Preview findet Bugs schneller, als Entwickler sie beheben

2 weeks ago 10

Einen Monat nach dem Start von Project Glasswing meldet Anthropic erste Ergebnisse: Das KI-Modell Claude Mythos Preview hat laut dem Unternehmen zusammen mit rund 50 Partnern mehr als 10.000 Schwachstellen mit hohem oder kritischem Schweregrad in systemrelevanter Software gefunden.

Die Geschwindigkeit, mit der das Modell Sicherheitslücken aufspürt, übersteige mittlerweile die Kapazität, diese zu verifizieren, offenzulegen und zu beheben, schreibt Anthropic in einem Blogpost. Das Unternehmen hält sich mit konkreten technischen Details zurück: Da die branchenübliche Frist zur Offenlegung neuer Schwachstellen bei 90 Tagen liegt, könne man die meisten Funde bisher nicht im Detail beschreiben, ohne Endnutzer zu gefährden.

Partnerergebnisse: zehnfache Bug-Finding-Rate

Die Glasswing-Partner betreiben und entwickeln laut Anthropic Software, die für das Internet und andere kritische Infrastruktur grundlegend ist. Sie haben jeweils Hunderte kritische Schwachstellen gefunden. Mehrere Partner berichten zudem, ihre Bug-Finding-Rate habe sich mehr als verzehnfacht.

Cloudflare etwa hat laut eigenen Angaben 2.000 Bugs identifiziert, davon 400 mit hohem oder kritischem Schweregrad. Die Falsch-Positiv-Rate sei dabei besser als bei menschlichen Testern gewesen. Mozilla fand und behob 271 Schwachstellen in Firefox 150, mehr als zehnmal so viele wie mit dem Vorgängermodell Claude Opus 4.6 bei Firefox 148.

Auch externe Evaluierungen bestätigen die Leistungsfähigkeit des Modells. Das britische AI Security Institute berichtet, Mythos Preview sei das erste Modell, das beide hauseigenen Cyber Ranges, also Simulationen mehrstufiger Cyberangriffe, vollständig löst. Die unabhängige Sicherheitsplattform XBOW bezeichnet das Modell als deutlichen Fortschritt gegenüber allen bisherigen Modellen mit "absolut beispielloser Präzision". Auf den akademischen Benchmarks ExploitBench und ExploitGym schneidet Mythos Preview laut Anthropic ebenfalls am besten ab.

Die Auswirkungen zeigen sich bereits in der Patch-Landschaft: Palo Alto Networks hat in seinem jüngsten Release fünfmal so viele Patches wie üblich ausgeliefert. Microsoft kündigt an, die Zahl neuer Patches werde "für einige Zeit mehr werden". Oracle findet und behebt Schwachstellen nach eigenen Angaben mehrfach schneller als zuvor.

Neben der reinen Schwachstellensuche hat sich Mythos Preview auch in anderen Sicherheitsbereichen als nützlich erwiesen: Bei einer der Partner-Banken half das Modell laut Anthropic, einen betrügerischen Überweisungsversuch über 1,5 Millionen Dollar zu erkennen und zu verhindern.

Über 6.000 potenzielle Schwachstellen in Open-Source-Projekten

Parallel zur Partnerarbeit hat Anthropic nach eigenen Angaben mehr als 1000 Open-Source-Projekte mit Mythos Preview gescannt. Das Modell schätzt, 6202 hoch- oder kritisch eingestufte Schwachstellen gefunden zu haben, bei insgesamt 23019 Funden aller Schweregrade.

Von den 1752 bisher durch unabhängige Sicherheitsfirmen und teilweise durch Anthropic überprüften hoch- oder kritisch eingestuften Funden erwiesen sich 90,6 Prozent als echte Treffer. 62,4 Prozent wurden tatsächlich als hoch oder kritisch bestätigt. Anthropic rechnet auf Basis dieser Triage-Raten damit, dass Mythos Preview insgesamt fast 3.900 bestätigte hoch- oder kritisch eingestufte Schwachstellen in Open-Source-Code aufgedeckt hat, und plant, das Scanning fortzusetzen.

Mehrere Open-Source-Maintainer haben Anthropic laut dem Blogpost gebeten, die Offenlegungsrate zu drosseln, weil sie mehr Zeit für das Entwerfen von Patches benötigen. Im Durchschnitt dauere es zwei Wochen, einen hoch oder kritisch eingestuften Bug zu beheben. Bisher seien 530 solcher Bugs an Maintainer gemeldet worden, von denen 75 gepatcht und 65 mit öffentlichen Advisories versehen seien. Weitere 827 bestätigte Schwachstellen warten demnach noch auf Offenlegung.

Das Problem verschärft sich dadurch, dass Maintainer ohnehin bereits mit einer Flut minderwertiger, KI-generierter Bug-Reports zu kämpfen haben.

Anthropic warnt vor einer Übergangsphase mit erhöhtem Risiko

Anthropic weist darauf hin, dass Modelle mit vergleichbaren Cybersicherheitsfähigkeiten bald breiter verfügbar sein würden. Die daraus resultierende Übergangsphase, in der Schwachstellen schnell gefunden, aber langsam gepatcht werden, berge neue Risiken. Mythos-Klasse-Modelle verringerten die Zeit und Kosten für das Finden und Ausnutzen von Schwachstellen erheblich. Kein Unternehmen, Anthropic eingeschlossen, habe bisher Schutzmechanismen entwickelt, die stark genug seien, um den Missbrauch solcher Modelle zu verhindern und potenziell schwerwiegenden Schaden abzuwenden.

Langfristig sollen solche Modelle Entwicklern ermöglichen, deutlich sicherere Software zu bauen, indem Bugs vor dem Deployment erkannt werden. Kurzfristig empfiehlt Anthropic Software-Entwicklern, ihre Patch-Zyklen zu verkürzen und Updates für Nutzer so einfach wie möglich zu gestalten. Netzwerkverteidiger sollten grundlegende Kontrollen wie Multi-Faktor-Authentifizierung, gehärtete Konfigurationen und umfassende Protokollierung priorisieren.

KI-News ohne Hype – von Menschen kuratiert

Mit dem THE‑DECODER‑Abo liest du werbefrei und wirst Teil unserer Community: Diskutiere im Kommentarsystem, erhalte unseren wöchentlichen KI‑Newsletter, 6× im Jahr den "KI Radar"‑Frontier‑Newsletter mit den neuesten Entwicklungen aus der Spitze der KI‑Forschung, bis zu 25 % Rabatt auf KI Pro‑Events und Zugriff auf das komplette Archiv der letzten zehn Jahre.

Jetzt abonnieren

Read Entire Article