Google DeepMind stellt Genie 3 vor: KI generiert interaktive 3D-Welten in Echtzeit

5 months ago 6

Google DeepMind hat heute mit Genie 3 ein neues KI-Modell vorgestellt, das in der Lage ist, auf Basis von Textbeschreibungen interaktive 3D-Welten zu generieren. Die Welten lassen sich in Echtzeit mit 24 Bildern pro Sekunde erkunden und bleiben mehrere Minuten lang konsistent, bei einer Auflösung von 720p. Schaut man sich die Demos an, dann ist das technisch durchaus beeindruckend.

Das System baut auf den Vorgängern Genie 1 und 2 auf und erweitert deren Fähigkeiten laut Google deutlich. Während die früheren Versionen bereits Umgebungen für KI-Agenten erzeugen konnten, ermöglicht Genie 3 nun erstmals die Interaktion in Echtzeit bei verbesserter Konsistenz und Realitätsnähe.

Die generierten Welten umfassen ein breites Spektrum: von naturgetreuen Landschaften mit physikalisch korrektem Verhalten von Wasser, Licht und Umgebung bis hin zu fantastischen Szenarien. Das System kann sowohl reale Orte nachbilden als auch fiktive Welten erschaffen.

Eine technische Neuerung ist die oben erwähnt Fähigkeit zur Konsistenz über längere Zeiträume. Wenn ein Nutzer nach einer Minute an einen bereits besuchten Ort zurückkehrt, greift das System auf die gespeicherten Informationen zurück und stellt die Umgebung unverändert dar.

Neben der Navigation können auch Ereignisse per Text ausgelöst werden, etwa Wetteränderungen oder das Hinzufügen neuer Objekte. Diese Funktion erweitert die Möglichkeiten für das Training von KI-Agenten in unerwarteten Situationen.

Die Technologie hat allerdings auch Grenzen: Der Aktionsradius ist eingeschränkt, die Interaktion mehrerer Agenten ist komplex und reale Orte lassen sich nicht mit absoluter geografischer Genauigkeit nachbilden. Auch die Darstellung von Text und die Interaktionsdauer von wenigen Minuten sind noch limitiert.

Google DeepMind startet zunächst mit einer beschränkten Forschungsvorschau für ausgewählte Wissenschaftler und Entwickler. Zukünftig soll Genie 3 auch für weitere Tester zugänglich gemacht werden. Mögliche Anwendungsgebiete sieht das Unternehmen in Bildung, Training und der Entwicklung autonomer Systeme.

Transparenz: In diesem Artikel sind Partnerlinks enthalten. Durch einen Klick darauf ge­lan­gt ihr direkt zum Anbieter. Solltet ihr euch dort für einen Kauf entscheiden, erhalten wir ei­ne kleine Provision. Für euch ändert sich am Preis nichts. Partnerlinks haben keinerlei Einfluss auf unsere Berichterstattung.

Read Entire Article