Google Gemini für Android erhält Audio-Unterstützung

5 months ago 6


In der neuesten Beta-Version der Gemini Android App zeichnet sich eine interessante Entwicklung ab. Die App wird wohl künftig Audio-Dateien verarbeiten können, wie ein APK-Teardown der Version 16.30.59.sa.arm64 zeigt. Die Integration von Audio-Funktionen in die Chat-Oberfläche ist bereits erkennbar. Nutzer können MP3-Dateien hochladen und sehen dann einen „Talk live about this“-Button. Die Funktion selbst ist allerdings noch nicht einsatzbereit. Aktuell reagiert Gemini entweder gar nicht auf die hochgeladenen Audiodateien oder liefert fehlerhafte Interpretationen.

Technisch gesehen ist die Audio-Verarbeitung für Gemini kein Neuland. Die API von Gemini unterstützt bereits die Analyse von Audio-Input und kann Inhalte beschreiben, zusammenfassen oder transkribieren. Das System verarbeitet gängige Formate wie MP3, WAV und FLAC. Auch zeitliche Markierungen wie „von 2:30 bis 3:29“ werden erkannt.

Nach der erfolgreichen Integration von Bildern in die Gemini-App erscheint die Erweiterung um Audio-Funktionen als logischer nächster Schritt. Ein konkretes Startdatum für das Feature steht noch nicht fest. Die entdeckten Code-Fragmente deuten aber darauf hin, dass Google aktiv an der Implementierung arbeitet.

Transparenz: In diesem Artikel sind Partnerlinks enthalten. Durch einen Klick darauf ge­lan­gt ihr direkt zum Anbieter. Solltet ihr euch dort für einen Kauf entscheiden, erhalten wir ei­ne kleine Provision. Für euch ändert sich am Preis nichts. Partnerlinks haben keinerlei Einfluss auf unsere Berichterstattung.

Read Entire Article