
Nano Banana Pro prompted by THE DECODER
Was passt zu einer Zutat? Die Antwort hängt davon ab, ob man einen Rezeptbegleiter oder einen Geschmacksverwandten sucht. Bisherige KI-Modelle für Zutaten haben beides vermischt. Das Start-up Kaikaku.AI trennt die beiden Perspektiven in einer neuen Arbeit auf.
Jakub Radzikowski und Josef Chen stellen mit "Epicure" drei nahezu identische KI-Modelle vor. Sie unterscheiden sich nur im Trainingsmaterial: Das erste Modell, "Cooc", sieht ausschließlich, welche Zutaten in echten Rezepten gemeinsam vorkommen. Das zweite, "Chem", sieht nur, welche Aromamoleküle die Zutaten teilen. Es stützt sich auf die Chemiedatenbank FlavorDB. Das dritte, "Core", mischt beides.
Jeder Punkt ist eine Zutat, ähnliche Zutaten liegen nah beieinander. Obwohl die Modelle nie erfahren haben, aus welcher Küche eine Zutat stammt, sortieren sie sich von selbst zu klaren Länderküchen-Gruppen. | Bild: Radzikowski & ChenDieselbe Frage, drei Antworten
Der Unterschied wird an konkreten Anfragen sichtbar. Tippt man "Hühnchen" ein, antwortet Cooc mit Knoblauch, Zwiebel und schwarzem Pfeffer. Das sind Zutaten, die in Rezepten häufig daneben stehen. Chem antwortet mit Rindfleisch oder Schwein, also Zutaten mit verwandtem Aromaprofil. Bei "Basilikum" liefert Cooc Petersilie, Olivenöl und Parmesan, die typische Pasta-Vorratskammer. Chem liefert Oregano, Estragon und Rosmarin, die Kräuter-Verwandtschaft.
Getestet wird, wie genau sich Eigenschaften wie fruchtig, bitter oder der Proteingehalt aus dem Modell ablesen lassen. Je weiter rechts ein Punkt, desto zuverlässiger, und das chemiebasierte Chem-Modell schneidet insgesamt am besten ab. | Bild: Radzikowski & ChenDas chemiegetriebene Modell schneidet laut den Autoren auch dort besser ab, wo es eigentlich nichts wissen sollte. Geschmacksrichtungen wie süß, sauer oder bitter und Nährwerte wie Eiweiß- oder Fettgehalt sind im Trainingsmaterial nicht direkt kodiert. Trotzdem ordnet Chem Zutaten entlang dieser Achsen klarer als die anderen Varianten. Die chemische Verwandtschaft wirkt offenbar als Umweg, der das Modell auch für andere kulinarische Konzepte sensibilisiert.
Mehrsprachiger Korpus statt englisches Übergewicht
Das bisher umfassendste öffentliche Zutaten-Modell, FlavorGraph, basiert auf einem englischsprachigen Rezeptkorpus. Epicure verarbeitet dagegen 4,14 Millionen Rezepte aus elf Quellen in sieben Sprachen. Darunter sind Chinesisch, Russisch, Vietnamesisch, Türkisch, Indonesisch und Deutsch. Eine Pipeline auf Basis von Claude und Gemini-Embeddings übersetzt und bereinigt rund 200.000 Rohbegriffe mit Schreibvarianten, Markennamen und Zubereitungshinweisen zu 1.790 sauberen Zutaten.
Hier geht es darum, wie unverwechselbar die Zutaten einer Küche sind. Die südasiatische Küche sticht am klarsten heraus, die westatlantische am wenigsten, und Chem trennt die Regionen in jedem Fall am schärfsten. | Bild: Radzikowski & ChenDer Korpus bleibt allerdings ungleich verteilt. Etwa die Hälfte des Materials stammt aus ostasiatischen Quellen, während lateinamerikanische, osteuropäische und südasiatische Küchen nur einstellige Anteile beisteuern. Zudem ist nur knapp ein Drittel der Zutaten direkt in der Chemiedatenbank verankert. Die übrigen erreichen das chemische Signal nur indirekt über verwandte Zutaten.
Ein Drehknopf für die Richtung
Auf dem fertigen Modell laufen zwei Bedienformen. Die erste ist die einfache Nachbarsuche, also die Frage, welche Zutaten einer anderen am nächsten liegen. Bei der zweiten lässt sich eine Saat-Zutat um einen einstellbaren Winkel in eine Zielrichtung verschieben. Bei null Grad bleibt das Original unangetastet, bei sechzig Grad dominiert die Zielnachbarschaft.
Ganz ohne vorgegebene Kategorien findet die Analyse zusammengehörige Zutatengruppen; die Gruppen werden anschließend mit Claude-generierten Labels versehen, etwa Dessert-Zutaten oder asiatische Wok-Grundzutaten. | Bild: Radzikowski & ChenDreht man "Reis" leicht in Richtung Südasien, tauchen Curryblatt, Urad Dal, Chana Dal und Bockshornkleesamen auf. Dreht man "Hähnchen" stärker in Richtung verarbeiteter westatlantischer Küche, landet man bei Cream of Chicken Soup, Crescent Roll und Ranch Dressing, also typischen US-amerikanischen Home-Cooking-Zutaten.
Interessant wird es, wenn die kulturelle Färbung nicht vorgegeben ist. Dreht man "Schokolade" in Richtung "süßes Gebäck", landen Cooc und Core bei westlichen Backzutaten wie Kakao, Vanille und Backpulver. Chem landet bei einem ostasiatischen Dessert-Cluster mit roter Bohnenpaste, Matcha-Pulver und violetter Süßkartoffel. Die Wahl des Modells bestimmt also auch die kulturelle Heimat der Antwort.
Die gepunktete Linie zeigt, wie ähnlich rein zufällig zusammengewürfelte Zutaten wären. Die tatsächlich gefundenen Gruppen liegen weit rechts davon, sind also echte, inhaltlich zusammenpassende Gruppen und kein Zufallsprodukt. | Bild: Radzikowski & ChenAutoren bauen Roboter-Restaurants
Hinter der Arbeit steht ein Restaurant-Tech-Start-up. Kaikaku wurde 2023 in London gegründet und betreibt mit "Common Room" ein eigenes robotergestütztes Restaurant im Brunswick Centre, das langfristig zur Kette ausgebaut werden soll.
Das Unternehmen nutzt eigene Machine-Learning-Systeme, um Zutaten zu wiegen und zu portionieren. Die Maschine namens "Fusion" soll theoretisch 360 Schüsseln pro Stunde ausgeben können. Zum System gehören außerdem eine ML-gestützte Bestandsverwaltung und 3D-gedruckte lebensmittelechte Komponenten. Finanziert hat sich das Unternehmen über eine Pre-Seed-Runde von rund 1,8 Millionen US-Dollar im Jahr 2024.
Vor diesem Hintergrund liegt das Interesse an einer maschinenlesbaren Karte der Zutatenwelt nahe. Ein Modell, das auf Knopfdruck zwischen Rezeptbegleiter und Aromaverwandtem wechselt, Zutaten zwischen Küchen übersetzt oder entlang von Achsen wie "fettig" oder "fermentiert" verschiebt, wäre an mehreren Stellen nützlich. Es könnte bei der Menüentwicklung in einem Bowl-Restaurant helfen, bei Ersatzvorschlägen für Lieferengpässe oder bei der Skalierung neuer Standorte.
Ob das in der Praxis trägt, bleibt offen. Modellgewichte und Datensatz sind inzwischen auf Hugging Face verfügbar, womit eine unabhängige Überprüfung grundsätzlich möglich wird. Die in der Arbeit gezeigten Treffer sind allerdings handverlesen. Gerade in den dünn vertretenen Regionen wie Südasien oder Lateinamerika dürften die Antworten deutlich weniger stabil ausfallen als bei den dominanten ostasiatischen und westlichen Küchen.
Auch die Vokabularbereinigung hängt an Ausgaben von Sprachmodellen, die selbst kulturelle Voreingenommenheiten mitbringen. Dass Schokolade in Richtung "süßes Gebäck" bei einer Variante bei Matcha landet, ist ein hübscher Effekt. Er sagt aber wenig darüber aus, wie verlässlich solche Rotationen jenseits der gezeigten Beispiele funktionieren.
Mitautor Josef Chen bewirbt das Modell auf X als "das größte mehrsprachige Food-Modell, das je gebaut wurde" und spricht davon, "das gesamte menschliche Kochen in zwei Megabyte komprimiert" zu haben. Auf epicure.kaikaku.ai steht eine ältere Version des Modells als Demo zur Verfügung.
KI-News ohne Hype – von Menschen kuratiert
Mit dem THE‑DECODER‑Abo liest du werbefrei und wirst Teil unserer Community: Diskutiere im Kommentarsystem, erhalte unseren wöchentlichen KI‑Newsletter, 6× im Jahr den "KI Radar"‑Frontier‑Newsletter mit den neuesten Entwicklungen aus der Spitze der KI‑Forschung, bis zu 25 % Rabatt auf KI Pro‑Events und Zugriff auf das komplette Archiv der letzten zehn Jahre.
- Zugriff auf alle THE DECODER Artikel.
- Lesen ohne Ablenkung – keine Google-Werbebanner.
- Zugang zum Kommentarsystem und Austausch mit der Community.
- Wöchentlicher KI-Newsletter.
- 6× jährlich: “KI Radar” – Deep-Dives zu den wichtigsten KI-Themen.
- Bis zu 25 % Rabatt auf KI Pro Online-Events.
- Zugang zum kompletten Archiv der letzten zehn Jahre.
- Die neuesten KI‑Infos von The Decoder – klar und auf den Punkt.



