Heim Nachricht Deepseek AI Development kostet 1,6 Milliarden US -Dollar und entlarvt den Mythos für Erschwinglichkeit

Deepseek AI Development kostet 1,6 Milliarden US -Dollar und entlarvt den Mythos für Erschwinglichkeit

Autor : Violet Aktualisieren : Apr 12,2025

Der neue Chatbot von Deepseek stellte sich mit einem faszinierenden Versprechen vor: "Hallo, ich wurde erstellt, damit Sie alles fragen und eine Antwort erhalten können, die Sie sogar überraschen könnte." Diese Aussage fasst die Essenz dessen zusammen, was Deepseek auf dem wettbewerbsfähigen KI -Markt erreichen soll, auf dem kürzlich einer der größten Aktienkurs von NVIDIA aufgrund der Auswirkungen von Deepseek zu verzeichnen war.

Deepseek -Test Bild: Ensigame.com

Das KI -Modell von Deepseek stammt aufgrund seiner innovativen Architektur- und Trainingsmethoden. Hier sind die Schlüsseltechnologien, die es unterscheiden:

Multi-Token-Vorhersage (MTP) : Im Gegensatz zu herkömmlichen Modellen, die jeweils ein Wort vorhersagen, prognostiziert Deepseeks MTP mehrere Wörter gleichzeitig, indem verschiedene Teile eines Satzes analysiert werden. Diese Methode steigert nicht nur die Genauigkeit, sondern verbessert auch die Effizienz des Modells.

Mischung von Experten (MOE) : Deepseek V3 verwendet eine MOE -Architektur unter Verwendung von 256 neuronalen Netzwerken, wobei acht für jede Token -Verarbeitungsaufgabe aktiviert werden. Dieser Ansatz beschleunigt das KI -Training und verbessert die Leistung erheblich.

Multi-Head Latent Achtung (MLA) : MLA konzentriert sich auf die wichtigsten Teile eines Satzes, indem sie wiederholte Schlüsseldetails aus Textfragmenten extrahiert. Dies verringert die Wahrscheinlichkeit, dass wichtige Informationen fehlen, sodass die KI wichtige Nuancen effektiv erfassen kann.

Obwohl sie behauptet, ein wettbewerbsfähiges KI -Modell mit einem minimalen Budget von 6 Millionen US -Dollar für die Schulung von Deepseek V3 mit nur 2048 Grafikprozessoren entwickelt zu haben, zeigt weitere Untersuchungen ein komplexeres Bild.

Deepseek v3 Bild: Ensigame.com

Analysten der semianalyse stellten fest, dass Deepseek eine riesige Computerinfrastruktur betreibt, die rund 50.000 Nvidia Hopper -GPUs umfasst. Dies umfasst 10.000 H800 -Einheiten, weitere 10.000 H100 und zusätzliche H20 -GPUs, die sich in mehreren Rechenzentren für KI -Schulungen, -forschung und Finanzmodellierung ausbreiten. Die Gesamtinvestition in Server beträgt ungefähr 1,6 Milliarden US -Dollar, wobei die operativen Ausgaben auf 944 Mio. USD geschätzt werden.

Deepseek ist eine Tochtergesellschaft des chinesischen Hedgefonds-High-Flyer, das 2023 das Startup ausschaltete, um sich auf KI-Technologien zu konzentrieren. Im Gegensatz zu vielen Startups, die sich auf Cloud -Anbieter verlassen, besitzt Deepseek seine Rechenzentren, wodurch die optimierte AI -Modelloptimierung die volle Kontrolle über schnelle Innovationen ermöglicht wird. Das Unternehmen ist selbstfinanziert, was seine Flexibilität und Entscheidungsgeschwindigkeit verbessert.

Deepseek Bild: Ensigame.com

Deepseek zieht auch Top -Talente an, wobei einige Forscher jährlich über 1,3 Millionen US -Dollar verdienen, hauptsächlich von führenden chinesischen Universitäten. Die Behauptung des Unternehmens, sein jüngstes Modell für nur 6 Millionen US -Dollar auszubilden, scheint unrealistisch zu sein, wenn man den breiteren Kontext berücksichtigt. Diese Abbildung macht nur die GPU-Nutzung während der Vorausbildung aus und schließt Forschungskosten, Modellverfeinerung, Datenverarbeitung und Gesamtkosten der gesamten Infrastruktur aus.

Seit seiner Gründung hat Deepseek über 500 Millionen US -Dollar in die KI -Entwicklung investiert. Die kompakte Struktur ermöglicht eine aktive und effektive Implementierung von KI -Innovationen, im Gegensatz zu größeren, bürokratischeren Unternehmen.

Deepseek Bild: Ensigame.com

Deepseeks Reise zeigt, dass ein gut finanziertes unabhängiges KI-Unternehmen tatsächlich mit Branchenriesen konkurrieren kann. Experten stellen jedoch fest, dass der Erfolg auf erhebliche Investitionen, technische Durchbrüche und ein starkes Team und nicht auf ein "revolutionäres Budget" für die KI -Entwicklung zurückzuführen ist. Trotzdem bleiben die Kosten von Deepseek deutlich niedriger als die seiner Konkurrenten. Während Deepseek beispielsweise 5 Millionen US -Dollar für R1 ausgab, kostete Chatgpt4O die Ausbildung von 100 Millionen US -Dollar.

Es ist jedoch immer noch billiger als seine Konkurrenten.