DeepSeek: Chinas KI-Modell R1 kostete nur 294.000 Dollar im Training

3 months ago 5

Max ist leitender Redakteur bei THE DECODER. Als studierter Philosoph beschäftigt er sich mit dem Bewusstsein, KI und der Frage, ob Maschinen wirklich denken können oder nur so tun als ob.

Laut einem Fachartikel in „Nature“ hat das Training des R1-Sprachmodells des chinesischen KI-Unternehmens Deepseek lediglich 294.000 US-Dollar gekostet. Dabei kamen 512 speziell für den chinesischen Markt entwickelte Nvidia-H800-Chips zum Einsatz. Laut Nvidia hat das Unternehmen die Chips vor der Verkaufssperre erhalten. In Paper räumt Deepseek ein, in der Vorbereitungsphase für ein kleineres Modell zusätzlich A100-Chips verwendet zu haben. US-Behörden hatten zuvor vermutet, das Unternehmen verfüge über nicht genehmigte H100-Chips.

Die geringen Kosten blenden jedoch die Kosten für das zugrundeliegende Deepseek-V3-Modell aus. Allerdings sind auch diese stark umstritten und die Schätzungen schwanken je nach Quelle zwischen ein- und dreistelligen Millionenbeträgen. Die von Deepseek kommunizierten geringen Kosten hatten zu starken Kurseinbrüchen am Tech-Markt geführt.

Unterstütze unsere unabhängige, frei zugängliche Berichterstattung. Jeder Betrag hilft und sichert unsere Zukunft. Jetzt unterstützen:

Max ist leitender Redakteur bei THE DECODER. Als studierter Philosoph beschäftigt er sich mit dem Bewusstsein, KI und der Frage, ob Maschinen wirklich denken können oder nur so tun als ob.

Read Entire Article