Street View trifft Weltmodell: Googles Project Genie generiert begehbare Versionen echter Orte

2 weeks ago 10

Google Deepmind koppelt sein Weltmodell Genie mit Street-View-Bildern und ermöglicht damit interaktive, KI-generierte Umgebungen, deren Ausgangspunkt ein realer Ort ist. 

Nutzer setzen einen Pin auf einer Karte, wählen optional einen Stil wie "Ocean World", "Desert Sands", "Stone Age" oder "B&W film" und beschreiben eine Figur. Genie 3 erzeugt daraus eine begehbare Welt, deren Startpunkt mit der Street-View-Realität verbunden ist. Laut Google basiert die Funktion auf "Maps Imagery Grounding", einer Schnittstelle, die Entwickler bereits zur Erstellung KI-gestützter Visualisierungen aus Street View nutzen.

Das Unternehmen demonstriert die Möglichkeiten unter anderem mit einer unter Wasser gesetzten Golden Gate Bridge und den Fort Worth Stockyards in Texas im Stil der 1920er-Jahre.

Googles Datenschatz als Wettbewerbsvorteil

Der eigentliche Hebel der Ankündigung liegt in der Datenbasis. Mit Street View verfügt Google über jahrelang gesammeltes Bildmaterial von Straßen, Gebäudeinneren, Wasserwegen und entlegenen Gegenden, das per Auto, Trekker oder gar Kamel erfasst wurde. Diese Sammlung wird nun zum Trainings- und Verankerungssubstrat für generative Welten und unterscheidet Genie von Konkurrenzmodellen.

Google bewirbt Genie aber nicht primär als Konsumprodukt. Das Weltmodell soll KI-Agenten und Robotern eine Umgebung bieten, in der sie navigieren, schlussfolgern und lernen können. So nutzt etwa der von Deepmind entwickelte Agent SIMA 2 Genie als Trainingsumfeld, Waymo wiederum setzt es laut Google für die Simulation realistischer Straßenszenarien im autonomen Fahren ein. Mit der Street-View-Anbindung lassen sich diese Trainings künftig an konkreten geografischen Orten verankern.

Demos zwischen Tech-Demo und Game-Vorschau

Wie das in der Praxis aussieht, zeigt Bilawal Sidhu, ein ehemaliger Google-Produktmanager für AR/VR und 3D Maps, in einer Reihe getesteter Prompts. Er rast in einem Formel-1-Wagen mit Google-Maps-Lackierung den Las Vegas Strip hinunter, fährt als Eichhörnchen auf einem Roller am Palace of Fine Arts vorbei, navigiert mit einem Boot über Austins Lady Bird Lake und spaziert dank indoor erfassten Street-View-Materials durch das Weiße Haus. "Vielleicht wird GTA 7 eher so aussehen als ein traditionelles Spiel", spekuliert Sidhu.

Woot! You can now simulate real world places by grounding Genie 3 experiences with Street View imagery.

Google sitting on the mother lode of real world data, and is starting to put it to work!

Let's dive into some prompts & locations I tested... pic.twitter.com/TlXSWNx08h

— Bilawal Sidhu (@bilawalsidhu) May 19, 2026

Die Beispiele illustrieren die Bandbreite, von urbanen Wahrzeichen über Innenräume bis zu Wasserflächen, gleichzeitig aber auch die noch sichtbaren Bruchstellen: weiche Texturen, instabile Geometrie, surreale Übergänge.

Verfügbarkeit und Grenzen

Project Genie inklusive Street-View-Grounding rollt für Abonnenten von Google AI Ultra (200 US-Dollar pro Monat, ab 18 Jahren) global aus. Die Verankerung mit echten Orten funktioniert zunächst nur für Standorte in den USA, eine Ausweitung ist geplant.

Deepmind weist selbst darauf hin, dass es sich um einen experimentellen Forschungsprototyp handelt und an "schärferen und genaueren" Details gearbeitet werde. Die aktuelle Version eignet sich damit eher für kreatives Erkunden als für seriöse Simulation, auch wenn der Pfad in Richtung Agenten- und Robotertraining vorgezeichnet ist.

KI-News ohne Hype – von Menschen kuratiert

Mit dem THE‑DECODER‑Abo liest du werbefrei und wirst Teil unserer Community: Diskutiere im Kommentarsystem, erhalte unseren wöchentlichen KI‑Newsletter, 6× im Jahr den "KI Radar"‑Frontier‑Newsletter mit den neuesten Entwicklungen aus der Spitze der KI‑Forschung, bis zu 25 % Rabatt auf KI Pro‑Events und Zugriff auf das komplette Archiv der letzten zehn Jahre.

Jetzt abonnieren

Read Entire Article