Google legt mit Gemini 3 nach und schiebt das nächste große Modell in den Ring. Offiziell sieht sich der Konzern damit wieder ein Stück näher an einer allgemeinen KI. Marketing-Sprech mal beiseite: Spannend ist vor allem, was das Ding in Benchmarks und im Alltag abliefert – und wo Google die Weichen für Entwickler stellt.
Gemini 3 Pro ist der Startpunkt. Die Vorabversion steckt ab sofort in mehreren Google-Produkten, etwa in der Gemini-App und im KI-Modus der Suche, teils aber nur mit Abo. Dazu kommt Gemini 3 Deep Think als erweiterter Modus für umfangreiches Schlussfolgern, der zuerst von Sicherheitsteams durchgekaut wird, bevor er bei Google-AI-Ultra-Abos landet.
Benchmarks? Gemini 3 Pro schlägt Gemini 2.5 Pro quer durch die Bank. Im LMArena-Ranking steht das Modell derzeit mit 1.501 Punkten an der Spitze. In anspruchsvollen Tests wie Humanity’s Last Exam liegt es bei 37,5 % ohne Tools, bei GPQA Diamond bei 91,9 %. In der Mathematik schiebt sich Gemini 3 Pro im MathArena-Apex-Benchmark auf 23,4 %. Dazu kommen multimodale Tests: 81 % bei MMMU-Pro, 87,6 % bei Video-MMMU. Bei SimpleQA Verified stehen 72,1 %, was ein Plus bei der faktischen Genauigkeit andeutet. Kurz gesagt: Papierform stimmt, gerade bei komplexen Aufgaben in Naturwissenschaft und Mathe.
Deep Think sitzt noch eine Etage höher. Dieser Modus soll dann aktiv werden, wenn Aufgaben mehr Schritte brauchen und reines Durchrattern nicht reicht. In den Tests legt Deep Think beim Humanity’s Last Exam auf 41,0 % zu (wieder ohne Tools), GPQA Diamond geht auf 93,8 %. Beim ARC-AGI-Benchmark erreicht der Modus mit Code-Nutzung 45,1 % (ARC Prize Verified). Damit versucht Google zu zeigen, dass das Modell neue Problemtypen nicht nur mit bekannten Patterns abwickelt, sondern sich eher an generelle Problemlösung herantastet.
Der praktische Teil: Lernalltag, Medienmix, langes Gedächtnis. Gemini 3 soll Inhalte aus Text, Bildern, Audio, Videos und Code zusammenführen. Das Modell bringt ein Kontextfenster von 1.000.000 Tokens mit. Damit lassen sich ganze Dokumentensammlungen, längere Videos oder große Codebasen reinwerfen, ohne alles vorher zerstückeln zu müssen. Google nennt als Beispiele handgeschriebene Familienrezepte, die das Modell erkennt, übersetzt und als Kochbuch aufbereitet, wissenschaftliche Papers, aus denen interaktive Karteikarten oder Visualisierungen gebaut werden, oder Sportvideos, bei denen Schwachstellen im Spiel analysiert und Trainingspläne ausgespuckt werden.

In der Google-Suche hängt Gemini 3 bereits im KI-Modus. Dort gibt es neue Oberflächen mit generativer KI: visuell aufbereitete Themen, interaktive Darstellungen, Simulationen, alles generiert auf Basis der Suchanfrage. Wer sich etwa in ein Bio-Thema wie RNA-Polymerase einarbeiten will, bekommt statt reiner Linkliste eher einen kompakten, grafisch aufgebohrten Einstieg, so Google. Es gibt auch noch extrem viel Wissenswertes für Entwickler, was diese mal bei Interesse direkt bei Google nachlesen können. Dort gibt es auch Ansichten, was genau wo ab wann verfügbar ist.
Transparenz: In diesem Artikel sind Partnerlinks enthalten. Durch einen Klick darauf gelangt ihr direkt zum Anbieter. Solltet ihr euch dort für einen Kauf entscheiden, erhalten wir eine kleine Provision. Für euch ändert sich am Preis nichts. Partnerlinks haben keinerlei Einfluss auf unsere Berichterstattung.

1 month ago
3



