訊息 DeepSeek AI開發的費用為16億美元,揭穿了負擔能力神話

DeepSeek AI開發的費用為16億美元,揭穿了負擔能力神話

作者 : Violet 更新 : Apr 12,2025

DeepSeek的新聊天機器人以一個令人著迷的諾言介紹了自己:“嗨,我被創建了,您可以問任何東西,並得到一個甚至可能讓您感到驚訝的答案。”該聲明囊括了DeepSeek目標在競爭激烈的AI市場中的目標,最近由於DeepSeek的影響,NVIDIA最大的股票價格下跌之一。

DeepSeek測試圖片:ensigame.com

DeepSeek的AI模型由於其創新的建築和培訓方法而脫穎而出。以下是區分它的關鍵技術:

多語預測(MTP) :與一次預測一個單詞的傳統模型不同,DeepSeek的MTP通過分析句子的不同部分同時預測了多個單詞。這種方法不僅提高了準確性,還提高了模型的效率。

專家的混合物(MOE) :DeepSeek V3採用MOE架構,利用256個神經網絡,每個令牌處理任務都激活了8個。這種方法加速了AI訓練並大大提高了性能。

多頭潛在註意力(MLA) :MLA通過反復從文本片段中提取關鍵細節來關注句子的最重要部分。這減少了缺少關鍵信息的機會,從而使AI有效地捕獲了重要的細微差別。

儘管聲稱已經開發了一種競爭性的AI模型,該模型僅使用2048個圖形處理器來培訓DeepSeek V3的預算最低,但進一步的調查顯示了一個更複雜的情況。

DeepSeek V3圖片:ensigame.com

半分析的分析師發現,DeepSeek經營著大量的計算基礎設施,包括約50,000個NVIDIA HOPPER GPU。其中包括10,000個H800單元,另外10,000 h100和額外的H20 GPU,分佈在多個數據中心,以進行AI培訓,研究和財務建模。對服務器的總投資約為16億美元,運營費用估計為9.44億美元。

DeepSeek是中國對沖基金高飛行員的子公司,該基金在2023年脫穎而出,專注於AI技術。與許多依靠雲提供商的初創公司不同,DeepSeek擁有其數據中心,使其完全控制AI模型優化並實現快速創新。該公司是自籌資金的,可以提高其靈活性和決策速度。

DeepSeek圖片:ensigame.com

DeepSeek還吸引了頂尖人才,一些研究人員每年收入超過130萬美元,主要來自中國領先的大學。在考慮更廣泛的環境時,該公司對僅600萬美元培訓其最新模式的培訓似乎是不現實的。該圖僅說明在預培訓期間使用GPU,並排除了研究費用,改進,數據處理和整體基礎設施成本。

自成立以來,DeepSeek已在AI開發方面投資了超過5億美元。它的緊湊結構允許積極有效地實施AI創新,這與更大,更官僚的公司不同。

DeepSeek圖片:ensigame.com

DeepSeek的旅程表明,一家資金充足的獨立AI公司確實可以與行業巨頭競爭。但是,專家指出,其成功是由於大量投資,技術突破和強大的團隊,而不是為AI開發的“革命性預算”。儘管如此,DeepSeek的成本仍大大低於其競爭對手。例如,儘管DeepSeek在R1上花費了500萬美元,但Chatgpt4o的培訓耗資1億美元。

但是,它仍然比競爭對手便宜。