家訊息 DeepSeek AI開發的費用為16億美元，揭穿了負擔能力神話

DeepSeek AI開發的費用為16億美元，揭穿了負擔能力神話

作者 : Violet 更新 : Apr 12,2025

DeepSeek的新聊天機器人以一個令人著迷的諾言介紹了自己：“嗨，我被創建了，您可以問任何東西，並得到一個甚至可能讓您感到驚訝的答案。”該聲明囊括了DeepSeek目標在競爭激烈的AI市場中的目標，最近由於DeepSeek的影響，NVIDIA最大的股票價格下跌之一。

DeepSeek測試圖片：ensigame.com

DeepSeek的AI模型由於其創新的建築和培訓方法而脫穎而出。以下是區分它的關鍵技術：

多語預測（MTP） ：與一次預測一個單詞的傳統模型不同，DeepSeek的MTP通過分析句子的不同部分同時預測了多個單詞。這種方法不僅提高了準確性，還提高了模型的效率。

專家的混合物（MOE） ：DeepSeek V3採用MOE架構，利用256個神經網絡，每個令牌處理任務都激活了8個。這種方法加速了AI訓練並大大提高了性能。

多頭潛在註意力（MLA） ：MLA通過反復從文本片段中提取關鍵細節來關注句子的最重要部分。這減少了缺少關鍵信息的機會，從而使AI有效地捕獲了重要的細微差別。

儘管聲稱已經開發了一種競爭性的AI模型，該模型僅使用2048個圖形處理器來培訓DeepSeek V3的預算最低，但進一步的調查顯示了一個更複雜的情況。

DeepSeek V3 圖片：ensigame.com

半分析的分析師發現，DeepSeek經營著大量的計算基礎設施，包括約50,000個NVIDIA HOPPER GPU。其中包括10,000個H800單元，另外10,000 h100和額外的H20 GPU，分佈在多個數據中心，以進行AI培訓，研究和財務建模。對服務器的總投資約為16億美元，運營費用估計為9.44億美元。

DeepSeek是中國對沖基金高飛行員的子公司，該基金在2023年脫穎而出，專注於AI技術。與許多依靠雲提供商的初創公司不同，DeepSeek擁有其數據中心，使其完全控制AI模型優化並實現快速創新。該公司是自籌資金的，可以提高其靈活性和決策速度。

DeepSeek 圖片：ensigame.com

DeepSeek還吸引了頂尖人才，一些研究人員每年收入超過130萬美元，主要來自中國領先的大學。在考慮更廣泛的環境時，該公司對僅600萬美元培訓其最新模式的培訓似乎是不現實的。該圖僅說明在預培訓期間使用GPU，並排除了研究費用，改進，數據處理和整體基礎設施成本。

自成立以來，DeepSeek已在AI開發方面投資了超過5億美元。它的緊湊結構允許積極有效地實施AI創新，這與更大，更官僚的公司不同。

DeepSeek 圖片：ensigame.com

DeepSeek的旅程表明，一家資金充足的獨立AI公司確實可以與行業巨頭競爭。但是，專家指出，其成功是由於大量投資，技術突破和強大的團隊，而不是為AI開發的“革命性預算”。儘管如此，DeepSeek的成本仍大大低於其競爭對手。例如，儘管DeepSeek在R1上花費了500萬美元，但Chatgpt4o的培訓耗資1億美元。

但是，它仍然比競爭對手便宜。