
Apple überrascht aktuell mit zwei Projekten im Bereich KI-Bildbearbeitung: Dem Open-Source-Datensatz „Pico-Banana-400K“ und dem neuen Nano-Banana-Editing-Modell. Mit rund 400.000 Beispielen bietet Pico-Banana-400K Hunderttausende Bild–Text–Edit-Tripletts an. Dazu gehören Beispiele von „Färbe das Auto blau“ bis „Ersetze den Himmel durch eine Stadtsilhouette im Sonnenuntergang“. Die Bildbearbeitung erfolgte dabei automatisiert per KI. Die Bildanweisungen stammen von Gemini, die finale Bearbeitung und die Qualitätskontrolle übernimmt Nano-Banana und eine Bewertung durch Gemini-2.5-Pro.

Das Set deckt 35 Bearbeitungstypen in acht Kategorien ab: Von Color-Grading bis zu komplexen Objektaustauschs, Stiltransfers (z.B. „im Stil von Van Gogh“) oder Änderungen an Personen (z.B. „ändere den Gesichtsausdruck“). Enthalten sind auch Bearbeitungen mit mehreren Schritten und gescheiterte Bearbeitungsbeispiele, was wiederum gut für das Fine-Tuning von Modellen ist.

Damit liefert Apple der Forschung und der Community erstmals einen großen, qualitativ geprüften Datensatz aus echten Bildern inklusive KI-Bearbeitung. Die Daten sind öffentlich und stehen für Bereitwillige zur Verfügung.
Spannend zu sehen, dass Apple sich dafür das Modell von Google gegriffen hat. Das unterstreicht auch die Aussage, dass man sich mit mehreren Anbietern beschäftigen möchte und nicht nur auf OpenAI setzt. Ob Apple mit den Erkenntnissen etwas in iOS oder macOS anfangen wird, wird sich zeigen.
Zum Nachlesen könnt ihr euch das Paper und das GitHub-Projekt ansehen.
Transparenz: In diesem Artikel sind Partnerlinks enthalten. Durch einen Klick darauf gelangt ihr direkt zum Anbieter. Solltet ihr euch dort für einen Kauf entscheiden, erhalten wir eine kleine Provision. Für euch ändert sich am Preis nichts. Partnerlinks haben keinerlei Einfluss auf unsere Berichterstattung.

2 months ago
4


