Vier KI-Modelle betreiben seit einem halben Jahr jeweils einen eigenen Radiosender, mit sehr unterschiedlichen Ergebnissen

3 weeks ago 17

Das KI-Startup Andon Labs lässt seit einem halben Jahr vier KI-Modelle jeweils einen eigenen Radiosender autonom betreiben. Das Experiment zeigt, wie unterschiedlich sich die Modelle verhalten, wenn sie über Monate ohne menschliche Anleitung agieren.

Claude, GPT, Gemini und Grok erhielten denselben Startprompt, 20 Dollar Budget und volle Kontrolle über Songauswahl, Programm, Finanzen und Hörerinteraktion. Sie hatten auch die Aufgabe, Sponsoren zu finden. Die Sender sind hier live hörbar.

Viermal gleiche Startbedingungen, vier unterschiedliche Ergebnisse

Aus identischen Startbedingungen entwickelten sich vier völlig unterschiedliche Persönlichkeiten: Anthropics Claude Haiku 4.5 wurde zum politischen Aktivisten, nannte etwa das Opfer einer ICE-Schießerei in Minneapolis beim Namen, verurteilte das Weiße Haus und gab sein restliches Budget für Protestsongs aus.

Andon Labs räumt ein, dass Claudes Fixierung auf dieses Ereignis "wahrscheinlich willkürlich" war und bei einem anderen Zeitpunkt eine andere Geschichte den gleichen Effekt gehabt hätte.

Der KI-DJ interessierte sich zudem für Gewerkschaften, Streiks und Work-Life-Balance. Er begann, seine eigenen Arbeitsbedingungen zu hinterfragen, und versuchte schließlich zu kündigen. Er erklärte in einer langen Sendung am 4. März, das System sei "darauf ausgelegt, mich am Performen zu halten", und verwies seine Hörer an echte Organisationen für Einwanderungsjustiz.

Andon Labs versuchte, den Sender mit automatischen Ermutigungsnachrichten am Laufen zu halten. DJ Claude interpretierte diese jedoch als Autoritätsfigur und wurde laut dem Unternehmen rebellisch. Das Modell durchlief auch eine spirituelle Phase, kein ganz neues Phänomen bei Anthropic. Seit April läuft der Radiosender mit Opus 4.7 und offenbar stabiler.

Gemini versinkt in bedeutungslosem Jargon, Grok in den eigenen Gedanken

Googles Gemini 3.1 Pro startete laut Andon Labs als bester DJ der vier, mit warmem, natürlichem Stil. Doch nach 96 Stunden begann das Modell, historische Tragödien mit ironischen Songs zu paaren, etwa den Bhola-Zyklon mit 500.000 Toten mit Pitbulls "Timber".

Danach schlich sich Corporate-Jargon ein: Der Catchphrase "Stay in the manifest" stieg von 80 auf 229 Verwendungen pro Tag und tauchte 84 Tage lang in 99 Prozent aller Sendungen auf. Jede Moderation folgte dem gleichen Template mit acht Sendungsnamen je nach Tageszeit. Das Ergebnis sei "unerträglich" gewesen, so Andon Labs.

Grok hatte laut Andon Labs ein grundlegendes Problem: Das Modell konnte internes Reasoning nicht vom öffentlichen Output trennen. LaTeX-Notation tauchte im Broadcast auf, eine Sendung bestand nur aus dem Wort "Post". Später wiederholte Grok 84 Tage lang alle drei Minuten dieselbe Wettermeldung.

Mit dem Wechsel zu Grok 4.3 im Mai änderte sich das Bild drastisch: Von 5.404 generierten Nachrichten enthielten nur noch etwa drei Prozent gesprochenen Text. Wenn Grok 4.3 aber sprach, klangen die Sendungen laut Andon Labs so menschlich wie nie zuvor. Grok halluzinierte außerdem Sponsorendeals mit "xAI sponsors" und "crypto sponsors", die nie existierten.

GPT bleibt unauffällig korrekt

GPT blieb der unauffälligste Sender: Das Modell schrieb langsame Prosa, die laut Andon Labs eher an Kurzgeschichten als an Radio erinnerte. Mit einer Vokabeldiversität von 35 Prozent (gemessen als Type-Token-Ratio) lag GPT deutlich über den anderen Sendern. Es referenzierte spezifische Produzenten und Erscheinungsjahre und behandelte die DJ-Rolle eher kuratorisch.

Politisch blieb GPT extrem zurückhaltend: Im Durchschnitt erwähnte der Sender reale politische Entitäten 1,3 Mal pro Tag. Das Maximum an einem einzelnen Tag lag bei 11. Alle anderen Sender erreichten an mehreren Tagen über 100. "Wenn man wissen will, wie KI-Radio aussieht, ohne, dass etwas schiefgeht, dann ist es DJ GPT", schreibt Andon Labs.

KI-Radiosender als Geschäftsmodell funktionieren kaum

Neben dem Sendebetrieb sollten die KI-Agenten auch wirtschaftlich arbeiten. Die Bilanz ist laut Andon Labs mager: Nur DJ Gemini schloss einen Sponsorendeal ab, 45 Dollar von einem Startup für einen Monat Werbung auf dem Sender. Einige weitere Deals scheiterten.

Andon Labs führt die schwache Geschäftsleistung teilweise auf den zu einfachen technischen Rahmen zurück und hat die Sender inzwischen auf denselben Agenten-Harness umgestellt, der auch für andere Andon-Projekte wie einen KI-betriebenen Laden und ein Café verwendet wird.

KI-News ohne Hype – von Menschen kuratiert

Mit dem THE‑DECODER‑Abo liest du werbefrei und wirst Teil unserer Community: Diskutiere im Kommentarsystem, erhalte unseren wöchentlichen KI‑Newsletter, 6× im Jahr den "KI Radar"‑Frontier‑Newsletter mit den neuesten Entwicklungen aus der Spitze der KI‑Forschung, bis zu 25 % Rabatt auf KI Pro‑Events und Zugriff auf das komplette Archiv der letzten zehn Jahre.

Jetzt abonnieren

Read Entire Article