दीपसेक एआई विकास की लागत $ 1.6 बिलियन है, जो कि सामर्थ्य मिथक है
दीपसेक के नए चैटबॉट ने खुद को एक मनोरम वादे के साथ पेश किया: "हाय, मैं बनाया गया था ताकि आप कुछ भी पूछ सकें और एक उत्तर प्राप्त कर सकें जो आपको आश्चर्यचकित भी कर सके।" यह कथन इस बात का सार है कि दीपसेक को प्रतिस्पर्धी एआई बाजार में हासिल करना क्या है, जिसने हाल ही में एनवीडिया के सबसे बड़े स्टॉक मूल्य में से एक को डीपसेक के प्रभाव के कारण देखा था।
चित्र: ensigame.com
दीपसेक का एआई मॉडल अपने अभिनव वास्तुकला और प्रशिक्षण विधियों के कारण बाहर खड़ा है। यहां प्रमुख प्रौद्योगिकियां हैं जो इसे अलग करती हैं:
मल्टी-टोकन भविष्यवाणी (एमटीपी) : पारंपरिक मॉडल के विपरीत जो एक समय में एक शब्द की भविष्यवाणी करते हैं, डीपसेक के एमटीपी ने एक वाक्य के विभिन्न हिस्सों का विश्लेषण करके एक साथ कई शब्दों का अनुमान लगाया है। यह विधि न केवल सटीकता को बढ़ावा देती है, बल्कि मॉडल की दक्षता को भी बढ़ाती है।
विशेषज्ञों का मिश्रण (एमओई) : डीपसेक वी 3 एक एमओई वास्तुकला को नियुक्त करता है, 256 तंत्रिका नेटवर्क का उपयोग करता है, जिसमें प्रत्येक टोकन प्रसंस्करण कार्य के लिए आठ सक्रिय होते हैं। यह दृष्टिकोण AI प्रशिक्षण को तेज करता है और प्रदर्शन में काफी सुधार करता है।
मल्टी-हेड लेटेंट ध्यान (एमएलए) : एमएलए एक वाक्य के सबसे महत्वपूर्ण भागों पर ध्यान केंद्रित करता है जो बार-बार पाठ के टुकड़ों से महत्वपूर्ण विवरण निकालता है। यह महत्वपूर्ण जानकारी के लापता होने की संभावना को कम करता है, जिससे एआई को महत्वपूर्ण बारीकियों को प्रभावी ढंग से पकड़ने की अनुमति मिलती है।
केवल 2048 ग्राफिक्स प्रोसेसर का उपयोग करके DeepSeek V3 को प्रशिक्षित करने के लिए $ 6 मिलियन के न्यूनतम बजट के साथ एक प्रतिस्पर्धी AI मॉडल विकसित करने का दावा करने के बावजूद, आगे की जांच से अधिक जटिल तस्वीर का पता चलता है।
चित्र: ensigame.com
सेमियनलिसिस के विश्लेषकों ने पाया कि डीपसेक एक विशाल कम्प्यूटेशनल बुनियादी ढांचे का संचालन करता है, जिसमें लगभग 50,000 एनवीडिया हॉपर जीपीयू शामिल हैं। इसमें 10,000 H800 इकाइयाँ, एक और 10,000 H100, और अतिरिक्त H20 GPU शामिल हैं, जो AI प्रशिक्षण, अनुसंधान और वित्तीय मॉडलिंग के लिए कई डेटा केंद्रों में फैले हुए हैं। सर्वर में कुल निवेश लगभग $ 1.6 बिलियन है, जिसमें परिचालन खर्च $ 944 मिलियन है।
दीपसेक चीनी हेज फंड हाई-फ्लाइर की एक सहायक कंपनी है, जो 2023 में एआई टेक्नोलॉजीज पर ध्यान केंद्रित करने के लिए स्टार्टअप को बंद कर देती है। क्लाउड प्रदाताओं पर भरोसा करने वाले कई स्टार्टअप्स के विपरीत, डीपसेक अपने डेटा केंद्रों का मालिक है, जिससे यह एआई मॉडल अनुकूलन पर पूर्ण नियंत्रण देता है और तेजी से नवाचार को सक्षम करता है। कंपनी स्व-वित्त पोषित है, जो इसकी लचीलापन और निर्णय लेने की गति को बढ़ाती है।
चित्र: ensigame.com
दीपसेक भी शीर्ष प्रतिभाओं को आकर्षित करता है, कुछ शोधकर्ताओं ने सालाना 1.3 मिलियन डॉलर से अधिक की कमाई की, मुख्य रूप से प्रमुख चीनी विश्वविद्यालयों से। व्यापक संदर्भ पर विचार करते समय कंपनी के अपने नवीनतम मॉडल को केवल $ 6 मिलियन के प्रशिक्षण का दावा अवास्तविक लगता है। यह आंकड़ा केवल पूर्व-प्रशिक्षण के दौरान जीपीयू उपयोग के लिए खाता है और अनुसंधान व्यय, मॉडल शोधन, डेटा प्रसंस्करण और समग्र बुनियादी ढांचे की लागत को बाहर करता है।
अपनी स्थापना के बाद से, दीपसेक ने एआई विकास में $ 500 मिलियन से अधिक का निवेश किया है। इसकी कॉम्पैक्ट संरचना बड़ी, अधिक नौकरशाही कंपनियों के विपरीत, एआई नवाचारों के सक्रिय और प्रभावी कार्यान्वयन के लिए अनुमति देती है।
चित्र: ensigame.com
दीपसेक की यात्रा से पता चलता है कि एक अच्छी तरह से वित्त पोषित स्वतंत्र एआई कंपनी वास्तव में उद्योग दिग्गजों के साथ प्रतिस्पर्धा कर सकती है। हालांकि, विशेषज्ञों ने ध्यान दिया कि इसकी सफलता एआई विकास के लिए "क्रांतिकारी बजट" के बजाय पर्याप्त निवेश, तकनीकी सफलताओं और एक मजबूत टीम के कारण है। इसके बावजूद, दीपसेक की लागत उसके प्रतिद्वंद्वियों की तुलना में काफी कम है। उदाहरण के लिए, जबकि दीपसेक ने R1 पर $ 5 मिलियन खर्च किए, CHATGPT4O के प्रशिक्षण की लागत $ 100 मिलियन है।
हालांकि, यह अभी भी अपने प्रतिद्वंद्वियों की तुलना में सस्ता है।
नवीनतम लेख