Neues Mistral-Flaggschiff bündelt drei Modelle in einem und bringt Cloud-Agenten für Vibe

1 month ago 14

Mistral hat mit Mistral Medium 3.5 ein neues Flaggschiff vorgestellt, das die bisher getrennten Modelle für Chat, Reasoning und Code unter einem Dach zusammenführen soll. Parallel dazu führt das französische Unternehmen in seinem Coding-Tool Vibe asynchrone Cloud-Agenten ein und stattet Le Chat mit einem neuen agentischen Modus aus.

Mistral Medium 3.5 ist laut Modellkarte ein Dense-Modell mit 128 Milliarden Parametern und einem Kontextfenster von 256.000 Tokens. "Dense" bedeutet: Für jedes erzeugte Token müssen sämtliche 128 Milliarden Parameter geladen und aktiviert werden. Das macht Inferenz vergleichsweise teuer. Dafür ist es einfacher zu betreiben und vermutlich robuster im Produktbetrieb.

Dabei weiß der Hersteller eigentlich, dass es auch anders geht: Mistral Large 3 nutzt eine Mixture-of-Experts-Architektur (MoE) mit 675 Milliarden Gesamtparametern, von denen pro Token nur 41 Milliarden aktiviert werden. Mistral Small 4 bringt es auf 119 Milliarden Parameter, aktiviert davon aber nur 6 Milliarden. Auch Konkurrenten wie Deepseek oder Qwen verschieben ihre Spitzenmodelle seit Längerem in Richtung MoE, weil sich so bei vergleichbarer Antwortqualität günstigere Inferenz erzielen lässt.

Dass Mistral sein neues Flaggschiff stattdessen als reines Dense-Modell baut, wirkt vor diesem Hintergrund eher konservativ: weniger auf maximale Inferenzökonomie getrimmt, dafür einfacher als ein einheitliches Produktmodell für Chat, Reasoning, Code und Agenten.

Mistral wirbt damit, dass sich das Modell auf vier GPUs selbst hosten lasse. In der Praxis dürfte diese Schwelle für viele Anwender außerhalb gut ausgestatteter Rechenzentren weiterhin außer Reichweite liegen.

Reasoning auf Knopfdruck und ein neu trainierter Vision-Encoder

Inhaltlich folgt das Modell dem Branchentrend, Reasoning nicht mehr in einem separaten Modell auszulagern, sondern pro Anfrage über einen Parameter zuzuschalten. Über reasoning_effort lässt sich zwischen schnellen Antworten und einem Modus für komplexere agentische Abläufe umschalten. Den Vision-Encoder hat Mistral von Grund auf neu trainiert, um variable Bildgrößen und Seitenverhältnisse zu verarbeiten.

SWE-Bench Verified, τ³-Telecom, τ³-Airline, τ³-Retail, τ³-Banking und BrowseComp.

In den vom Unternehmen veröffentlichten Benchmarks erreicht Medium 3.5 nach eigenen Angaben 77,6 Prozent auf SWE-Bench Verified und 91,4 Prozent auf τ³-Telecom. Damit ersetzt es laut Mistral sowohl Medium 3.1 als auch das Reasoning-Modell Magistral in Le Chat sowie Devstral 2 in der Vibe-CLI.

Modified MIT statt Apache 2.0

Die Gewichte stehen auf Hugging Face zum Download bereit, allerdings nicht unter der bei Mistral früher verbreiteten Apache-2.0-Lizenz. Stattdessen kommt eine "Modified MIT License" zum Einsatz, die kommerzielle und nicht-kommerzielle Nutzung erlaubt, aber Ausnahmen für Unternehmen mit hohem Umsatz vorsieht. Das ist ein Unterschied zu Modellen wie Mistral Large 3 oder Small 4, die unter Apache 2.0 stehen.

Über die API kostet Medium 3.5 1,50 US-Dollar pro Million Input-Tokens und 7,50 US-Dollar pro Million Output-Tokens.

Coding-Agenten verlassen das Notebook

Die zweite Ankündigung dürfte für Entwickler interessanter sein als das Modell selbst: Mistrals Coding-Tool Vibe bekommt sogenannte Remote Agents, die in der Cloud laufen, mehrere parallel und ohne, dass ein Entwickler permanent zusehen muss. Lokale Sitzungen lassen sich nach Mistrals Beschreibung samt Verlauf, Aufgabenstatus und Genehmigungen in die Cloud verschieben.

Jeder Agent arbeitet in einer isolierten Sandbox und kann nach Abschluss einen Pull Request öffnen. Vibe verbindet sich mit GitHub, Linear, Jira, Sentry sowie Slack oder Teams. Als Anwendungsfälle nennt Mistral Routineaufgaben wie Modul-Refactorings, Test-Generierung, Dependency-Upgrades oder Bug-Fixes.

Die Cloud-Variante baut technisch auf Workflows aus Mistral Studio auf, die das Unternehmen ursprünglich intern und für Enterprise-Kunden entwickelt hatte. Neu ist das Konzept nicht: OpenAI, Anthropic und Cursor bieten ähnliche Setups bereits an.

Work Mode in Le Chat mit aktiven Konnektoren

Parallel führt Mistral einen Work Mode in Le Chat ein, der ebenfalls auf Medium 3.5 läuft. Vorgesehen ist er für mehrstufige Aufgaben über mehrere Tools hinweg, etwa um E-Mails, Nachrichten oder Kalendereinträge aufzuarbeiten oder strukturierte Recherchen zu erstellen.

Konnektoren zu Mailbox, Kalender, Dokumenten und anderen Systemen sind im Work Mode laut Mistral standardmäßig aktiv. Das senkt die Hürde für komplexe Workflows, verschiebt aber auch die Verantwortung für Datenflüsse stärker auf den Nutzer. Vor sensiblen Aktionen wie dem Versenden einer Nachricht oder dem Schreiben in fremde Systeme fordert Le Chat eine explizite Bestätigung an. Verfügbar ist Work Mode in den Pro-, Team- und Enterprise-Tarifen.

KI-News ohne Hype – von Menschen kuratiert

Mit dem THE‑DECODER‑Abo liest du werbefrei und wirst Teil unserer Community: Diskutiere im Kommentarsystem, erhalte unseren wöchentlichen KI‑Newsletter, 6× im Jahr den "KI Radar"‑Frontier‑Newsletter mit den neuesten Entwicklungen aus der Spitze der KI‑Forschung, bis zu 25 % Rabatt auf KI Pro‑Events und Zugriff auf das komplette Archiv der letzten zehn Jahre.

Jetzt abonnieren

Read Entire Article