![]()
In der neuesten Beta-Version der Gemini Android App zeichnet sich eine interessante Entwicklung ab. Die App wird wohl künftig Audio-Dateien verarbeiten können, wie ein APK-Teardown der Version 16.30.59.sa.arm64 zeigt. Die Integration von Audio-Funktionen in die Chat-Oberfläche ist bereits erkennbar. Nutzer können MP3-Dateien hochladen und sehen dann einen „Talk live about this“-Button. Die Funktion selbst ist allerdings noch nicht einsatzbereit. Aktuell reagiert Gemini entweder gar nicht auf die hochgeladenen Audiodateien oder liefert fehlerhafte Interpretationen.
Technisch gesehen ist die Audio-Verarbeitung für Gemini kein Neuland. Die API von Gemini unterstützt bereits die Analyse von Audio-Input und kann Inhalte beschreiben, zusammenfassen oder transkribieren. Das System verarbeitet gängige Formate wie MP3, WAV und FLAC. Auch zeitliche Markierungen wie „von 2:30 bis 3:29“ werden erkannt.
Nach der erfolgreichen Integration von Bildern in die Gemini-App erscheint die Erweiterung um Audio-Funktionen als logischer nächster Schritt. Ein konkretes Startdatum für das Feature steht noch nicht fest. Die entdeckten Code-Fragmente deuten aber darauf hin, dass Google aktiv an der Implementierung arbeitet.
Transparenz: In diesem Artikel sind Partnerlinks enthalten. Durch einen Klick darauf gelangt ihr direkt zum Anbieter. Solltet ihr euch dort für einen Kauf entscheiden, erhalten wir eine kleine Provision. Für euch ändert sich am Preis nichts. Partnerlinks haben keinerlei Einfluss auf unsere Berichterstattung.

5 months ago
6


