MiniMax-M1: Neues Open-Source-Modell soll Deepseek R1 übertrumpfen

6 months ago 7

Max ist leitender Redakteur bei THE DECODER. Als studierter Philosoph beschäftigt er sich mit dem Bewusstsein, KI und der Frage, ob Maschinen wirklich denken können oder nur so tun als ob.

Das chinesische KI-Startup MiniMax hat mit MiniMax-M1 ein neues Open-Source-Sprachmodell veröffentlicht, das Deepseeks R1 schlagen soll. Das Reasoning-Modell bietet eine sehr große Kontextlänge von bis zu einer Million Tokens und einem "Denk"-Budget von bis zu 80.000 Tokens. Das Modell wurde mit einem besonders sparsamen Reinforcement-Learning-Verfahren trainiert, soll deutlich effizienter sein als anderen Open-Source-Modelle und ist unter Apache-2.0-Lizenz kostenlos nutzbar. MiniMax-M1 übertrifft andere offene Modelle wie DeepSeek-R1-0528 und Qwen3-235B-A22B in mehreren Benchmarks. Beim OpenAI MRCR-Test zeigt M1 ebenfalls starke Leistung und kommt an das bisher beste Modell Gemini 2.5 Pro heran – dabei geht es um komplexe Aufgaben mit mehreren Schritten, bei denen das Modell präzise Informationen aus langen Texten kombinieren muss. In einigen Bereichen bleiben geschlossene Modelle wie OpenAI o3 und Gemini 2.5 Pro weiter stärker, doch MiniMax-M1 verringert den Abstand teilweise deutlich. Das Modell ist in zwei Varianten auf Hugging Face verfügbar.

Bild: MiniMax

Unterstütze unsere unabhängige, frei zugängliche Berichterstattung. Jeder Betrag hilft und sichert unsere Zukunft. Jetzt unterstützen:

Max ist leitender Redakteur bei THE DECODER. Als studierter Philosoph beschäftigt er sich mit dem Bewusstsein, KI und der Frage, ob Maschinen wirklich denken können oder nur so tun als ob.

Read Entire Article