OpenAI widerlegt Erdős-Vermutung: Was der "Meilenstein in der KI-Mathematik" für die Zukunft des Fachs bedeutet

2 weeks ago 8

Warum Menschen die Lösung verpassten

Thomas Bloom schreibt in seinem Beitrag zum Begleitpapier, dass vier Bedingungen zusammenkommen mussten, damit ein Mensch die Lösung hätte finden können: Man musste signifikante Zeit auf das Problem verwenden, gegen die etablierte Meinung von Erdős überhaupt eine Widerlegung versuchen, die Originalkonstruktion in die Welt der Zahlenkörper übertragen wollen und ausreichend mit der recht spezialisierten Klassenkörpertheorie vertraut sein. "Die KI erfüllte alle diese Kriterien", schreibt Bloom. Sie kombiniere "übermenschliche Geduld mit Vertrautheit mit einem riesigen Arsenal an technischer Maschinerie".

Sawin nennt zusätzlich einen technischen Grund, warum naheliegende Verallgemeinerungen scheiterten. Der natürliche Versuch wäre gewesen, ein einmal gewähltes erweitertes Zahlensystem zu nehmen und darin immer größere Ausschnitte zu betrachten – gewissermaßen das alte Raster nur in einer komplizierteren Zahlenwelt aufzublähen. Das führt laut Sawin jedoch wieder zur alten Erdős-Schranke. Der entscheidende Trick des KI-Modells war umgekehrt: Es hielt den betrachteten Maßstab in jedem dieser Zahlensysteme fest, wechselte aber mit jedem Schritt zu immer reicheren Zahlensystemen. Für einen Menschen sei nicht ersichtlich gewesen, warum gerade dieser Wechsel etwas bringt, schreibt Sawin.

Bloom hatte das Problem nur einen Monat vor der KI-Lösung in einem Blogpost als eines seiner "Top 10 Erdős-Probleme" aufgeführt. Anlass war, dass einige Beobachter aus früheren KI-Lösungen zu einfacheren Erdős-Problemen geschlossen hatten, alle Aufgaben des Mathematikers seien Trivialitäten. Bloom wollte mit der Liste zeigen, dass viele Erdős-Probleme jahrzehntelang tiefe Methoden hervorgebracht haben.

Die Unit-Distance-Vermutung war für ihn das einzige Problem aus der diskreten Geometrie auf der Liste, gerade weil sie "seit Jahrzehnten dem Beweis widerstanden" habe. Bloom verwies darauf, dass die seit 1984 bestehende Obergrenze von Spencer, Szemerédi und Trotter seit über 40 Jahren nicht verbessert worden sei: "Dieses Problem ist ein gutes Beispiel dafür, dass wir trotz einiger spektakulärer Resultate in der diskreten Geometrie noch weit davon entfernt sind, selbst die grundlegendsten Fragen zu verstehen", schrieb Bloom. Dass eine KI ausgerechnet dieses Problem nur einen Monat später knacken würde, hatte er nicht erwartet: "Ich glaubte zwar, dass KI irgendwann bei einigen Problemen auf dieser Liste Fortschritte machen würde, aber sicher nicht so schnell."

Reaktionen aus der Fachwelt

Noga Alon, einer der führenden Kombinatoriker, bezeichnet das Ergebnis als "herausragende Leistung" und das überraschende Resultat als "elegante und clevere Anwendung relativ ausgefeilter Werkzeuge aus der algebraischen Zahlentheorie". Fields-Medaillist Tim Gowers schreibt, hätte ein Mensch das Papier bei den Annals of Mathematics eingereicht und ihn um eine schnelle Einschätzung gebeten, "hätte ich die Annahme ohne zu zögern empfohlen". Kein vorheriger KI-generierter Beweis sei dem nahegekommen. Gowers nennt das Resultat einen "Meilenstein in der KI-Mathematik".

Der Zahlentheoretiker Arul Shankar sieht in der Arbeit den Beleg, dass aktuelle KI-Modelle "über bloße Helfer für menschliche Mathematiker hinausgehen, sie sind in der Lage, originelle Ideen zu haben und sie zur Fruchtbarkeit zu führen". Bloom relativiert: Der Beweis liefere keine grundsätzlich neuen geometrischen Werkzeuge, wie sie ein vollständiger Beweis der Vermutung wohl gebraucht hätte. Aber er zeige, "dass zahlentheoretische Konstruktionen über solche Fragen mehr zu sagen haben, als wir vermutet hatten". Er erwartet, dass algebraische Zahlentheoretiker nun "andere offene Probleme der diskreten Geometrie genauer ansehen werden".

Warum dieser Fall anders bewertet wird

KI-Systeme hatten in den vergangenen Monaten bereits eine ganze Reihe von Erdős-Problemen gelöst oder teilweise gelöst. Auf der von Bloom betreuten Plattform erdosproblems.com sind rund 1.000 Probleme katalogisiert. Laut Fields-Medaillist Terence Tao waren im September 2025 etwa 380 davon gelöst, in einer chaotischen Phase Anfang 2026 kamen rund 50 weitere hinzu, teils durch Menschen, teils durch KI, teils durch Mischformen. Einige dieser Lösungen ließen sich auf wenigen Seiten notieren oder bewegten sich auf dem Niveau anspruchsvoller Übungsaufgaben.

Genau das hatte Bloom zu seiner Top-10-Liste motiviert: Er beobachtete, dass "einige Mathematiker zunehmend abschätzig über Erdős-Probleme sprechen, vermutlich weil sie Berichte über KI-Lösungen auf dieser Seite gesehen haben, die sich als ziemlich einfach herausstellten, und daraus fälschlich verallgemeinert haben, dass alle Probleme von Erdős unterhaltsame Spielereien auf Olympiade-Niveau seien".

Die Unit-Distance-Widerlegung wird im Begleitpapier und von OpenAI explizit anders eingeordnet. Es handle sich, so OpenAI, um "das erste Mal, dass ein prominentes offenes Problem im Zentrum eines Teilgebiets der Mathematik autonom von KI gelöst" wurde. Bloom selbst beschreibt seine eigene Reaktion so: Seine große Überrashcung sei "leicht gedämpft" worden, als er erfuhr, dass es sich um eine Widerlegung handele, und weiter gedämpft, als er die Konstruktion sah.

Trotzdem bleibe der Befund: Anders als bei den vorherigen Erdős-Lösungen handelt es sich nicht um eine zugängliche Übungsaufgabe, sondern um ein Problem, das seit acht Jahrzehnten als hart gilt, eine seit 1984 unveränderte Obergrenze hat, und dessen Lösung Werkzeuge aus einem entfernten Fachgebiet erfordert.

Gowers fasst zusammen: Hätte ein Mensch die Arbeit eingereicht, hätte er sie "ohne zu zögern" für die Annals of Mathematics akzeptiert. Kein vorheriger KI-generierter Beweis sei dem nahe gekommen.

Was das Resultat über die Mathematik selbst aussagt

Mehrere der beteiligten Mathematiker nutzen das Begleitpapier, um über die strukturellen Folgen solcher KI-Beiträge für ihr Fach nachzudenken. Co-Autor Daniel Litt stellt unbequeme Fragen: Warum gibt es überhaupt berühmte Probleme, die sich mit einem relativ kurzen, cleveren Argument lösen lassen? Seine Vermutung: Entweder klammern sich Forscher an nicht-optimale Annahmen, etwa Erdős eigene Überzeugung, dass seine Vermutung stimme. Oder die Lösung verlangt Ideen aus Gebieten, mit denen die meisten im jeweiligen Feld nicht vertraut sind.

"Diese Erklärungen sollten uns, falls sie zutreffen, ein gewisses Unbehagen bereiten", schreibt Litt. "Sie legen nahe, dass die Anreize zu Spezialisierung und Silo-Bildung uns einige hochwertige Wissenschaft gekostet haben." Litt kontrastiert das menschliche Vorgehen, bei dem ein Forscher aus persönlicher Neugier wenige Fragen vertieft, mit dem aktuellen KI-Modus, ganze Problemlisten systematisch durchzuarbeiten. Das sei "eine massive Ausweitung der Aufmerksamkeit für mathematische Probleme".

Gowers beschreibt offen seine eigene Reaktion: Als er zunächst fälschlich annahm, die KI habe die Vermutung bewiesen statt widerlegt, verbrachte er den Abend damit, "sein Weltbild anzupassen: Wenn KI einen Beweis wie diesen liefern kann, dann ist es vielleicht bald vorbei mit den Mathematikern." Am nächsten Morgen, als sich der Irrtum aufklärte, sei das "eine große Erleichterung" gewesen. Eine Widerlegung könne man sich eher als Ergebnis von Geduld und Ausprobieren vorstellen, während ein echter Beweis "tiefe Einsicht" verlangt hätte, und Letzteres wäre für ihn beunruhigend gewesen.

Gowers entwickelt im Begleitpapier ein eigenes Maß für die Schwierigkeit eines Beweises, das er "Kolmogorov-Komplexität modulo Experten" nennt, die Länge der kürzesten Folge von Hinweisen, die einem Experten genügen würden, um den Beweis selbst zu rekonstruieren. Seine vorläufige Einschätzung: KI sei derzeit nicht generell besser als Menschen, habe aber Vorteile bei bestimmten Problemtypen. Sie verfüge über "enzyklopädisches Wissen", müsse sich weniger um Zeitmanagement sorgen und könne deshalb "ernsthaft versuchen, Aussagen zu beweisen, die unwahrscheinlich erscheinen".

Dennoch sagt er: Der Fortschritt werde nicht auf einem Plateau ankommen, und es werde bald KI-Lösungen geben, "die schwer als im Nachhinein einfacher als erwartet wegzuerklären sein werden". Selbst wenn KI lange, komplexe Beweise nicht finden könne, gelte: "Wir sind wahrscheinlich in eine Ära eingetreten, in der es für Menschen sehr schwierig wird, mit KI beim Lösen mathematischer Probleme zu konkurrieren."

Bloom nimmt eine vermittelnde Position ein. Auf seine eigene Prüffrage, ob der Beweis dem Fach etwas Neues über das Problem beigebracht habe, antwortet er mit einem "moderaten Ja": Zahlentheoretische Konstruktionen hätten zu solchen Fragen offenbar mehr zu sagen als vermutet, und die nötige Zahlentheorie könne sehr tief sein. Manche im Feld dürften aber enttäuscht sein, dass der Beweis keine "mächtigen neuen geometrischen Werkzeuge" oder unerwarteten Strukturresultate liefere, wie sie ein vollständiger Beweis der Vermutung wohl erfordert hätte. Die Lösung sei zwar "im Nachhinein" eine natürliche Verallgemeinerung, aber "hochgradig nicht-trivial", und es habe vier seltene Zufälle gebraucht, damit ein Mensch sie hätte finden können.

Bloom beschreibt die Stärke der KI so: Sie kombiniere "übermenschliche Geduld" mit "Vertrautheit mit einem riesigen Arsenal an technischer Maschinerie" und verfolge "hartnäckig Pfade, die ein Mensch vielleicht als nicht der Mühe wert abgetan hätte". Sein Ausblick: "Die Grenzen des Wissens sind sehr zackig, und zweifellos werden die kommenden Monate und Jahre ähnliche Erfolge in vielen weiteren Bereichen der Mathematik bringen, in denen langjährig offene Probleme von einer KI gelöst werden, die unerwartete Verbindungen aufdeckt und die bestehende technische Maschinerie an ihre Grenzen treibt."

Mensch und Maschine teilen sich die Arbeit

Das von OpenAI veröffentlichte Begleitpapier ist selbst ein Hinweis darauf, wie eine Arbeitsteilung zwischen KI und Forschern in Zukunft aussehen könnte. Der ursprüngliche, vom Modell generierte Beweis war laut Bloom "vollständig gültig", wurde von den menschlichen Autoren aber "erheblich verbessert". Erst Sawins Verfeinerung lieferte das konkrete Maß der Verbesserung; die im Begleitpapier abgedruckte Fassung ist kürzer und allgemeiner als das Original.

Genau dieser zweite Schritt stand kürzlich im Zentrum eines Vortrags von Tao auf dem Future of Mathematics Symposium in Stanford. Tao argumentiert, dass die mathematische Praxis derzeit eine "Proof-Indigestion" erlebe: KI-Systeme erzeugen und prüfen Beweise zunehmend schnell, aber die menschliche Verdauung, also das Verstehen, Erklären, Einordnen und Weiterverwenden, komme nicht hinterher. Sein Maßstab dafür, ob eine Lösung wirklich abgeschlossen sei: ob jemand einen Vortrag darüber halten und Fragen beantworten könne. Im Fall der Unit-Distance-Widerlegung haben sich neun renommierte Mathematiker bereit erklärt, genau diese Arbeit zu leisten. Skalieren lassen wird sich dieser Standard wohl kaum.

Read Entire Article