Hogar Noticias Deepseek AI Development cuesta $ 1.6 mil millones, desacreditando el mito de la asequibilidad

Deepseek AI Development cuesta $ 1.6 mil millones, desacreditando el mito de la asequibilidad

Autor : Violet Actualizar : Apr 12,2025

El nuevo chatbot de Deepseek se presentó con una promesa cautivadora: "Hola, fui creado para que puedas pedir cualquier cosa y obtener una respuesta que incluso te sorprenda". Esta declaración encapsula la esencia de lo que Deepseek tiene como objetivo lograr en el mercado competitivo de IA, que recientemente vio una de las mayores caídas del precio de las acciones de Nvidia debido al impacto de Deepseek.

Prueba de Speeek Imagen: ensigame.com

El modelo de IA de Deepseek se destaca debido a su innovadora arquitectura y métodos de capacitación. Estas son las tecnologías clave que lo diferencian:

Predicción múltiple (MTP) : a diferencia de los modelos tradicionales que predicen una palabra a la vez, MTP de Deepseek pronostica múltiples palabras simultáneamente analizando diferentes partes de una oración. Este método no solo aumenta la precisión, sino que también mejora la eficiencia del modelo.

Mezcla de expertos (MOE) : Deepseek V3 emplea una arquitectura MOE, utilizando 256 redes neuronales, con ocho activadas para cada tarea de procesamiento de tokens. Este enfoque acelera el entrenamiento de IA y mejora significativamente el rendimiento.

Atención latente múltiple (MLA) : MLA se centra en las partes más significativas de una oración extrayendo repetidamente detalles clave de los fragmentos de texto. Esto reduce la posibilidad de perder información crucial, lo que permite que la IA capture matices importantes de manera efectiva.

A pesar de afirmar haber desarrollado un modelo de IA competitivo con un presupuesto mínimo de $ 6 millones para capacitar a Deepseek V3 utilizando solo 2048 procesadores gráficos, una mayor investigación revela una imagen más compleja.

Deepseek v3 Imagen: ensigame.com

Los analistas de Semianalysis descubrieron que Deepseek opera una vasta infraestructura computacional, que comprende alrededor de 50,000 GPU de la tolva NVIDIA. Esto incluye 10,000 unidades H800, otras 10,000 H100 y GPU H20 adicionales, distribuidos en múltiples centros de datos para capacitación de IA, investigación y modelado financiero. La inversión total en servidores es de aproximadamente $ 1.6 mil millones, con gastos operativos estimados en $ 944 millones.

Deepseek es una subsidiaria del Fondo de cobertura chino High-Flyer, que salió de la startup en 2023 para centrarse en las tecnologías de IA. A diferencia de muchas nuevas empresas que dependen de los proveedores de la nube, Deepseek posee sus centros de datos, lo que le da un control total sobre la optimización del modelo de IA y permite la innovación rápida. La compañía está autofinanciada, lo que mejora su flexibilidad y velocidad de toma de decisiones.

Veterano Imagen: ensigame.com

Deepseek también atrae al máximo talento, con algunos investigadores ganando más de $ 1.3 millones anuales, principalmente de las principales universidades chinas. El reclamo de la compañía de capacitar a su último modelo por solo $ 6 millones parece poco realista cuando se considera el contexto más amplio. Esta cifra solo representa el uso de la GPU durante la capacitación previa y excluye los gastos de investigación, el refinamiento del modelo, el procesamiento de datos y los costos generales de infraestructura.

Desde su inicio, Deepseek ha invertido más de $ 500 millones en desarrollo de IA. Su estructura compacta permite la implementación activa y efectiva de innovaciones de IA, a diferencia de las empresas más grandes y burocráticas.

Veterano Imagen: ensigame.com

El viaje de Deepseek ilustra que una compañía de IA independiente bien financiada puede competir con los gigantes de la industria. Sin embargo, los expertos señalan que su éxito se debe a inversiones sustanciales, avances técnicos y un equipo fuerte, en lugar de un "presupuesto revolucionario" para el desarrollo de la IA. A pesar de esto, los costos de Deepseek siguen siendo significativamente más bajos que los de sus competidores. Por ejemplo, mientras que Deepseek gastó $ 5 millones en R1, la capacitación de ChatGPT4O costó $ 100 millones.

Sin embargo, sigue siendo más barato que sus competidores.