KI-Modell trennt zwei Arten, wie Köche über Zutaten denken

1 week ago 7

Image description

Nano Banana Pro prompted by THE DECODER

Was passt zu einer Zutat? Die Antwort hängt davon ab, ob man einen Rezeptbegleiter oder einen Geschmacksverwandten sucht. Bisherige KI-Modelle für Zutaten haben beides vermischt. Das Start-up Kaikaku.AI trennt die beiden Perspektiven in einer neuen Arbeit auf.

Jakub Radzikowski und Josef Chen stellen mit "Epicure" drei nahezu identische KI-Modelle vor. Sie unterscheiden sich nur im Trainingsmaterial: Das erste Modell, "Cooc", sieht ausschließlich, welche Zutaten in echten Rezepten gemeinsam vorkommen. Das zweite, "Chem", sieht nur, welche Aromamoleküle die Zutaten teilen. Es stützt sich auf die Chemiedatenbank FlavorDB. Das dritte, "Core", mischt beides.

Drei 2-D-UMAP-Projektionen der Epicure-Modelle Cooc, Core und Chem mit je 1.790 Zutaten, eingefärbt nach acht Küchen-Makroregionen; East Asian, South Asian, Latin American und Mediterranean bilden klar getrennte Cluster.

Dieselbe Frage, drei Antworten

Der Unterschied wird an konkreten Anfragen sichtbar. Tippt man "Hühnchen" ein, antwortet Cooc mit Knoblauch, Zwiebel und schwarzem Pfeffer. Das sind Zutaten, die in Rezepten häufig daneben stehen. Chem antwortet mit Rindfleisch oder Schwein, also Zutaten mit verwandtem Aromaprofil. Bei "Basilikum" liefert Cooc Petersilie, Olivenöl und Parmesan, die typische Pasta-Vorratskammer. Chem liefert Oregano, Estragon und Rosmarin, die Kräuter-Verwandtschaft.

Drei Diagramme, die für 14 Aroma-, fünf Geschmacks- und acht Nährwert-Eigenschaften zeigen, wie zuverlässig sich die jeweilige Eigenschaft im Modell wiederfinden lässt; höhere Werte bedeuten zuverlässiger, das Modell Chem liegt fast überall vorn.

Das chemiegetriebene Modell schneidet laut den Autoren auch dort besser ab, wo es eigentlich nichts wissen sollte. Geschmacksrichtungen wie süß, sauer oder bitter und Nährwerte wie Eiweiß- oder Fettgehalt sind im Trainingsmaterial nicht direkt kodiert. Trotzdem ordnet Chem Zutaten entlang dieser Achsen klarer als die anderen Varianten. Die chemische Verwandtschaft wirkt offenbar als Umweg, der das Modell auch für andere kulinarische Konzepte sensibilisiert.

Mehrsprachiger Korpus statt englisches Übergewicht

Das bisher umfassendste öffentliche Zutaten-Modell, FlavorGraph, basiert auf einem englischsprachigen Rezeptkorpus. Epicure verarbeitet dagegen 4,14 Millionen Rezepte aus elf Quellen in sieben Sprachen. Darunter sind Chinesisch, Russisch, Vietnamesisch, Türkisch, Indonesisch und Deutsch. Eine Pipeline auf Basis von Claude und Gemini-Embeddings übersetzt und bereinigt rund 200.000 Rohbegriffe mit Schreibvarianten, Markennamen und Zubereitungshinweisen zu 1.790 sauberen Zutaten.

Diagramm, das für acht Küchenregionen zeigt, wie deutlich sich ihre typischen Zutaten vom Rest abheben; je weiter rechts, desto eindeutiger, die südasiatische Küche liegt vorn, die westatlantische hinten.

Der Korpus bleibt allerdings ungleich verteilt. Etwa die Hälfte des Materials stammt aus ostasiatischen Quellen, während lateinamerikanische, osteuropäische und südasiatische Küchen nur einstellige Anteile beisteuern. Zudem ist nur knapp ein Drittel der Zutaten direkt in der Chemiedatenbank verankert. Die übrigen erreichen das chemische Signal nur indirekt über verwandte Zutaten.

Ein Drehknopf für die Richtung

Auf dem fertigen Modell laufen zwei Bedienformen. Die erste ist die einfache Nachbarsuche, also die Frage, welche Zutaten einer anderen am nächsten liegen. Bei der zweiten lässt sich eine Saat-Zutat um einen einstellbaren Winkel in eine Zielrichtung verschieben. Bei null Grad bleibt das Original unangetastet, bei sechzig Grad dominiert die Zielnachbarschaft.

Drei Karten, in denen das Modell jeweils selbst gefundene Zutatengruppen farbig markiert und mit automatisch erzeugten Bezeichnungen wie „Sweet confections and dessert ingredients" oder „Chinese wok cooking essentials" versieht.

Dreht man "Reis" leicht in Richtung Südasien, tauchen Curryblatt, Urad Dal, Chana Dal und Bockshornkleesamen auf. Dreht man "Hähnchen" stärker in Richtung verarbeiteter westatlantischer Küche, landet man bei Cream of Chicken Soup, Crescent Roll und Ranch Dressing, also typischen US-amerikanischen Home-Cooking-Zutaten.

Interessant wird es, wenn die kulturelle Färbung nicht vorgegeben ist. Dreht man "Schokolade" in Richtung "süßes Gebäck", landen Cooc und Core bei westlichen Backzutaten wie Kakao, Vanille und Backpulver. Chem landet bei einem ostasiatischen Dessert-Cluster mit roter Bohnenpaste, Matcha-Pulver und violetter Süßkartoffel. Die Wahl des Modells bestimmt also auch die kulturelle Heimat der Antwort.

Drei Häufigkeitsdiagramme für Cooc, Core und Chem; die rot markierten, vom Modell gefundenen Zutatengruppen liegen deutlich rechts der gepunkteten Linie, die einer zufälligen Zusammenstellung entspricht.

Autoren bauen Roboter-Restaurants

Hinter der Arbeit steht ein Restaurant-Tech-Start-up. Kaikaku wurde 2023 in London gegründet und betreibt mit "Common Room" ein eigenes robotergestütztes Restaurant im Brunswick Centre, das langfristig zur Kette ausgebaut werden soll.

Das Unternehmen nutzt eigene Machine-Learning-Systeme, um Zutaten zu wiegen und zu portionieren. Die Maschine namens "Fusion" soll theoretisch 360 Schüsseln pro Stunde ausgeben können. Zum System gehören außerdem eine ML-gestützte Bestandsverwaltung und 3D-gedruckte lebensmittelechte Komponenten. Finanziert hat sich das Unternehmen über eine Pre-Seed-Runde von rund 1,8 Millionen US-Dollar im Jahr 2024.

Vor diesem Hintergrund liegt das Interesse an einer maschinenlesbaren Karte der Zutatenwelt nahe. Ein Modell, das auf Knopfdruck zwischen Rezeptbegleiter und Aromaverwandtem wechselt, Zutaten zwischen Küchen übersetzt oder entlang von Achsen wie "fettig" oder "fermentiert" verschiebt, wäre an mehreren Stellen nützlich. Es könnte bei der Menüentwicklung in einem Bowl-Restaurant helfen, bei Ersatzvorschlägen für Lieferengpässe oder bei der Skalierung neuer Standorte.

Ob das in der Praxis trägt, bleibt offen. Modellgewichte und Datensatz sind inzwischen auf Hugging Face verfügbar, womit eine unabhängige Überprüfung grundsätzlich möglich wird. Die in der Arbeit gezeigten Treffer sind allerdings handverlesen. Gerade in den dünn vertretenen Regionen wie Südasien oder Lateinamerika dürften die Antworten deutlich weniger stabil ausfallen als bei den dominanten ostasiatischen und westlichen Küchen.

Auch die Vokabularbereinigung hängt an Ausgaben von Sprachmodellen, die selbst kulturelle Voreingenommenheiten mitbringen. Dass Schokolade in Richtung "süßes Gebäck" bei einer Variante bei Matcha landet, ist ein hübscher Effekt. Er sagt aber wenig darüber aus, wie verlässlich solche Rotationen jenseits der gezeigten Beispiele funktionieren.

Mitautor Josef Chen bewirbt das Modell auf X als "das größte mehrsprachige Food-Modell, das je gebaut wurde" und spricht davon, "das gesamte menschliche Kochen in zwei Megabyte komprimiert" zu haben. Auf epicure.kaikaku.ai steht eine ältere Version des Modells als Demo zur Verfügung.

KI-News ohne Hype – von Menschen kuratiert

Mit dem THE‑DECODER‑Abo liest du werbefrei und wirst Teil unserer Community: Diskutiere im Kommentarsystem, erhalte unseren wöchentlichen KI‑Newsletter, 6× im Jahr den "KI Radar"‑Frontier‑Newsletter mit den neuesten Entwicklungen aus der Spitze der KI‑Forschung, bis zu 25 % Rabatt auf KI Pro‑Events und Zugriff auf das komplette Archiv der letzten zehn Jahre.

Jetzt abonnieren