Build 2026: Microsofts neue KI-Modelle überholen Google bei Bildern, doch das erste Reasoning-Modell ist ein halbes Jahr im Rückstand

4 days ago 5

Auf der Build 2026 hat Microsoft sieben neue KI-Modelle aus eigener Entwicklung vorgestellt, darunter erstmals ein Reasoning-Modell. Parallel führt der Konzern eine neue Tuning-Methode und einen autonomen Hintergrundagenten ein.

Im Zentrum der Ankündigung steht MAI-Thinking-1, Microsofts erstes Reasoning-Modell. Laut Microsoft-AI-Chef Mustafa Suleyman handelt es sich um ein 1-Billionen-Parameter-Modell mit 35 Milliarden aktiven Parametern und einem Kontextfenster von 128.000 Tokens, das für mehrstufige Anweisungen, lange Kontexte und Codegenerierung ausgelegt ist.

Microsoft gibt an, MAI-Thinking-1 ziehe bei zentralen Software-Engineering-Benchmarks mit führenden Modellen gleich und sei in eigenen Blind-Vergleichen gegen Anthropics Sonnet 4.6 bevorzugt worden. Das Modell sei "von Grund auf mit sauberen Daten trainiert worden, ohne Distillation aus Modellen Dritter", so Suleyman, was als Seitenhieb auf Praktiken anderer Labore zu lesen ist. Ein Blick in die veröffentlichten Benchmarks verortet das Modell allerdings in etwa auf dem Niveau von Deepseek V3.2.

Bild: Microsoft

Eine Modellfamilie für sechs Aufgabenbereiche

Neben dem Reasoning-Modell umfasst die MAI-Familie sechs weitere Systeme: MAI-Code-1-Flash, ein agentisches Coding-Modell mit fünf Milliarden Parametern, soll laut Microsoft mit Anthropics Haiku vergleichbar sein, dabei aber günstiger arbeiten. Es ist in GitHub Copilot und Visual Studio Code eingebunden.

MAI-Image-2.5 deckt Text-zu-Bild und Bildbearbeitung ab und setzt sich im Bild-Benchmark Arena-Score auf Platz zwei hinter GPT-Image-2 und vor Googles Nano-Banana-Modelle. MAI-Transcribe-1.5 wird als schnellstes Transkriptionsmodell mit Unterstützung für 43 Sprachen beworben. MAI-Voice-2 erzeugt Sprache in 15 Sprachen und kann Stimmen aus kurzen Samples adaptieren.

Alle Modelle teilen laut Microsoft dieselbe Datenbasis, Infrastruktur und Evaluierungslogik. Sie sind über Azure Foundry verfügbar, und Entwickler können erstmals die Gewichte selbst feintunen.

Frontier Tuning als wirtschaftliches Argument

Microsoft koppelt die Modelle an zudem ein Konzept namens Frontier Tuning: Kunden sollen über Reinforcement-Learning-Umgebungen Modelle direkt an ihren Arbeitsabläufen ausrichten können. Die wertvollsten Trainingsdaten seien dabei die tatsächlichen Arbeitsspuren eines Agenten innerhalb einer Organisation.

In einem internen Test habe ein für Excel getuntes MAI-Modell die Leistung von GPT-5.4 erreicht, dabei aber bis zu zehnmal effizienter gearbeitet. Bei McKinsey habe ein angepasstes MAI-Modell die höchste Win-Rate aller getesteten Systeme erzielt, ebenfalls bei etwa einem Zehntel der Kosten.

Scout als erster Autopilot-Agent

Als dritte Säule führt Microsoft eine neue Agentenkategorie ein, die der Konzern "Autopilots" nennt: dauerhaft aktive Agenten mit eigener Identität, die autonom im Hintergrund arbeiten. Erster Vertreter ist Microsoft Scout, integriert in Teams, Outlook, OneDrive und SharePoint.

Scout soll Meetings über Zeitzonen hinweg koordinieren, Vorbereitungsunterlagen erstellen, anstehende Arbeitsergebnisse im Kalender einplanen und ins Stocken geratene Entscheidungen erkennen, bevor sie zum Hindernis werden. Über die Komponente Work IQ baut der Agent laut Microsoft ein Kontextgedächtnis für Arbeitsweisen und Prioritäten auf.

Jeder Agent arbeitet unter einer eigenen Entra-Identität, mit eng begrenzten Zugriffsrechten, Sandbox-Ausführung über Microsoft Execution Containers und verpflichtenden menschlichen Freigaben bei sensiblen Aktionen. Zugangsdaten werden außerdem auf die jeweilige Aufgabe begrenzt und aus Protokollen entfernt. Ob das ausreicht, wird sich im Praxiseinsatz zeigen, da bisherige Agentensysteme regelmäßig an genau jenen Stellen scheiterten, an denen Sprachmodell und externe Daten aufeinandertreffen.

Scout ist zunächst als experimentelle Version über das Frontier-Programm verfügbar und erfordert eine Intune-Konfiguration sowie eine GitHub-Copilot-Lizenz.

Hardware, Betriebssystem und ein Klinikmodell

Flankiert werden die Software-Ankündigungen von weiteren Bausteinen einer breiteren KI-Strategie. Mit Project Solara stellt Microsoft ein Android-basiertes Betriebssystem vor, das Agenten geräteübergreifend laufen lassen soll, gemeinsam entwickelt mit Qualcomm und MediaTek. Auf der Build-Bühne zeigte der Konzern beispielhaft einen Desktop-Hub und ein digitales Badge als mögliche Trägergeräte.

Für lokale KI-Entwicklung führt Microsoft die Surface RTX Spark Dev Box ein, ausgestattet mit Nvidias Arm-basiertem Spark-RTX-Chip und 128 GB Unified Memory. Preis und vollständige Spezifikationen nannte Microsoft noch nicht.

Im Bereich Healthcare kündigte Microsoft eine Kooperation mit der Mayo Clinic an, um gemeinsam ein klinisches Foundation Model zu entwickeln. Das Modell soll zunächst im Klinikbetrieb der Mayo Clinic eingesetzt und später über Azure Foundry verfügbar werden. Eigentümerin bleibt die Mayo Clinic.

Microsoft beschreibt das übergeordnete Ziel als "Humanist Superintelligence": KI-Systeme, die Werkzeuge bleiben und unter menschlicher Kontrolle stehen. Suleyman kündigt für das kommende Jahr eine schnelle Skalierung von Rechenleistung und Fähigkeiten an, auch gestützt auf Microsofts eigene Maia-200-Chips.

KI-News ohne Hype – von Menschen kuratiert

Mit dem THE‑DECODER‑Abo liest du werbefrei und wirst Teil unserer Community: Diskutiere im Kommentarsystem, erhalte unseren wöchentlichen KI‑Newsletter, 6× im Jahr den "KI Radar"‑Frontier‑Newsletter mit den neuesten Entwicklungen aus der Spitze der KI‑Forschung, bis zu 25 % Rabatt auf KI Pro‑Events und Zugriff auf das komplette Archiv der letzten zehn Jahre.

Jetzt abonnieren

Read Entire Article