Google führt neue KI- und Eingabehilfefunktionen für Android und Chrome ein

7 months ago 8

Apple hat neulich erst seine Bemühungen für die Bedienungshilfen auf seinen Geräten untermauert – nun prescht auch Google nach vorne. Der Konzern rollt pünktlich zum Global Accessibility Awareness Day neue Funktionen aus, die Menschen mit Einschränkungen den Alltag mit Smartphone und Browser erleichtern sollen. Der Schwerpunkt liegt dabei auf KI-gestützten Verbesserungen für Android und Chrome.

Neu ist die Erweiterung von TalkBack, dem Android-Screenreader. Die Integration von Gemini ermöglicht es nun nicht nur Bildbeschreibungen zu generieren, sondern auch Fragen zu Bildern zu stellen. Wenn etwa ein Freund ein Foto seiner neuen Gitarre schickt, können Nutzer nach Details wie Marke und Farbe fragen. Die Funktion arbeitet auch mit kompletten Bildschirminhalten, praktisch beim Online-Shopping.

Für gehörlose Menschen bringt Google die „Expressive Captions“ auf ein neues Level. Die Echtzeit-Untertitel erkennen jetzt auch die Länge von gesprochenen Worten – aus einem einfachen „Tor“ wird dann „Toooooor“ in der Anzeige. Zusätzlich werden mehr Geräusche wie Pfeifen oder Räuspern erkannt. Diese Features gibt es vorerst nur in englischer Sprache und auf Geräten mit Android 15.

Beim Chrome-Browser hat Google ebenfalls nachgelegt. PDF-Dokumente werden jetzt automatisch per OCR analysiert, sodass auch eingescannte Texte mit Screenreadern vorgelesen werden können. Die neue „Page Zoom“-Funktion für Android erlaubt es, Texte zu vergrößern ohne das Layout der Webseite zu beeinflussen – analog zur Desktop-Version.

Für Entwickler öffnet Google die Euphonia-Projektressourcen via GitHub. Damit können sie eigene Audio-Tools entwickeln, die auch nicht-standardisierte Sprache besser erkennen. In Afrika unterstützt Google.org zudem die University College London beim Aufbau von Spracherkennungsmodellen für zehn afrikanische Sprachen.

Auch im Bildungsbereich gibt es Fortschritte: Chromebooks unterstützen nun bei College Board’s Bluebook-Prüfungsapp sämtliche Google-Accessibility-Features wie ChromeVox und Diktierfunktion.

Transparenz: In diesem Artikel sind Partnerlinks enthalten. Durch einen Klick darauf ge­lan­gt ihr direkt zum Anbieter. Solltet ihr euch dort für einen Kauf entscheiden, erhalten wir ei­ne kleine Provision. Für euch ändert sich am Preis nichts. Partnerlinks haben keinerlei Einfluss auf unsere Berichterstattung.

Read Entire Article