कंपनियां

चीन की DeepSeek ने AI की दुनिया में मचाई हलचल, अमेरिका की ChatGPT और Gemini को चुनौती

चीन की DeepSeek लैब ने अपने ओपन-सोर्स AI मॉडल्स के जरिए ग्लोबल AI इंडस्ट्री में मचाई हलचल, OpenAI को दे रही सीधी चुनौती।

Published by
वसुधा मुखर्जी   
Last Updated- January 27, 2025 | 5:33 PM IST

चीन की AI रिसर्च लैब DeepSeek ने हाल ही में ऐसा कारनामा किया है जिसने आर्टिफिशियल इंटेलिजेंस (AI) की दुनिया को चौंका दिया है। इस लैब ने अपना नया ओपन-सोर्स मॉडल DeepSeek-R1 लॉन्च किया है, जो न केवल OpenAI जैसे दिग्गजों को टक्कर दे रहा है, बल्कि कई मामलों में उनसे बेहतर प्रदर्शन कर रहा है। खास बात यह है कि DeepSeek ने यह उपलब्धि बेहद कम लागत में हासिल की है, जिससे ग्लोबल AI उद्योग में एक नई बहस छिड़ गई है।

DeepSeek क्या है और कैसे बना यह सपना हकीकत?

DeepSeek चीन की एक स्वतंत्र AI रिसर्च लैब है, जिसकी शुरुआत 2023 में लियांग वेनफेंग ने की थी। इसका मूल जुड़ाव High-Flyer नाम के एक हेज फंड से है, जो फाइनेंशियल डेटा एनालिसिस में एडवांस्ड कंप्यूटिंग का इस्तेमाल करता था। हालांकि, लियांग ने AI के क्षेत्र में कुछ बड़ा करने के लिए High-Flyer के रिसोर्सेस को DeepSeek की तरफ मोड़ दिया।

DeepSeek को चीन की Baidu और Alibaba जैसी बड़ी कंपनियों का समर्थन नहीं है। यह पूरी तरह से स्वतंत्र रूप से काम करती है। लियांग का मकसद केवल मुनाफा कमाना नहीं, बल्कि वैज्ञानिक खोजों के जरिए दुनिया को नई तकनीकों से परिचित कराना है।

DeepSeek-R1: AI की दुनिया का नया सितारा

DeepSeek का नया मॉडल DeepSeek-R1 AI की दुनिया में एक नई मिसाल बन चुका है। यह मॉडल अपनी बेहतरीन रीजनिंग क्षमता, मैथ और कोडिंग जैसे कार्यों में शानदार प्रदर्शन कर रहा है। DeepSeek ने न केवल अपने प्रमुख मॉडल को ओपन-सोर्स किया है, बल्कि इसके छोटे वर्जन भी डेवलपर्स के लिए उपलब्ध कराए हैं। इन सभी मॉडल्स को MIT लाइसेंस के तहत लॉन्च किया गया है, जिससे डेवलपर्स इन्हें फाइन-ट्यून और कस्टमाइज कर सकते हैं।

इस मॉडल की सबसे खास बात इसकी किफायती ट्रेनिंग तकनीक है। DeepSeek ने नई टेक्नोलॉजीज, जैसे मल्टी-हेड लैटेंट अटेंशन (MLA) और मिश्रण-ऑफ-एक्सपर्ट्स का इस्तेमाल किया, जिससे इसकी लागत बहुत कम हो गई। रिपोर्ट्स के अनुसार, DeepSeek ने अपने मॉडल को Meta के Llama मॉडल की तुलना में केवल 10% रिसोर्स में ट्रेन किया।

लियांग वेनफेंग: DeepSeek के पीछे का दिमाग

DeepSeek के संस्थापक लियांग वेनफेंग का सफर बेहद प्रेरणादायक है। 1985 में जन्मे लियांग ने झेजियांग यूनिवर्सिटी से इंजीनियरिंग की पढ़ाई की और उसके बाद फाइनेंशियल हेज फंड इंडस्ट्री में कदम रखा। लेकिन उनका असली सपना AI की दुनिया में कुछ बड़ा करना था।

DeepSeek में लियांग ने चीन की टॉप यूनिवर्सिटीज़, जैसे पेकिंग यूनिवर्सिटी और चिंगहुआ यूनिवर्सिटी, के युवा रिसर्चर्स को मौका दिया। ये युवा वैज्ञानिक न केवल अपनी पढ़ाई में एक्सिलेंट थे, बल्कि नए इनोवेशन के लिए भी पूरी तरह समर्पित थे। लियांग का मानना है कि युवा दिमाग ज्यादा साहसी होते हैं और जोखिम उठाने को तैयार रहते हैं, जो AI जैसी तकनीकी क्षेत्र में जरूरी है।

अमेरिकी प्रतिबंध और DeepSeek की स्मार्ट रणनीति

2022 में अमेरिका ने चीन पर एडवांस्ड चिप्स, जैसे Nvidia H100, की सप्लाई पर रोक लगा दी। इससे चीन की AI इंडस्ट्री को झटका लगा। लेकिन DeepSeek ने इस चुनौती को अपने फायदे में बदल दिया।

DeepSeek ने अपने मॉडल को ट्रेन करने के लिए किफायती और स्मार्ट तकनीकों का सहारा लिया। उन्होंने कस्टम डेटा एक्सचेंज और मेमोरी ऑप्टिमाइजेशन जैसे उपाय अपनाए, जिससे सीमित संसाधनों में भी बेहतरीन परिणाम मिले। इन रणनीतियों ने यह साबित कर दिया कि AI की दुनिया में सफलता केवल महंगे संसाधनों पर निर्भर नहीं करती।

DeepSeek ने अपनी तकनीकों में तीन बड़े बदलाव किए:

कस्टम कम्युनिकेशन स्कीम्स: चिप्स के बीच डेटा शेयरिंग को इतना स्मार्ट बना दिया कि मेमोरी की बचत होने लगी।
मेमोरी ऑप्टिमाइजेशन: फील्ड साइज को घटाकर संसाधनों का अधिकतम इस्तेमाल किया।
मिक्स-ऑफ-मॉडल्स: छोटे-छोटे मॉडलों को जोड़कर ऐसे रिजल्ट दिए जो बड़े मॉडल्स को टक्कर देते हैं।

ओपन-सोर्स मॉडल से बढ़ती DeepSeek की धाक

DeepSeek ने अपने AI मॉडल्स को ओपन-सोर्स करके पूरी दुनिया का ध्यान खींचा है। MIT लाइसेंस के तहत, कोई भी डेवलपर इन मॉडल्स का इस्तेमाल कर सकता है और अपनी जरूरत के हिसाब से इन्हें कस्टमाइज कर सकता है। इस कदम से न केवल AI तकनीकों तक पहुंच आसान हुई है, बल्कि पश्चिमी कंपनियों के दबदबे को भी चुनौती दी गई है।

AI की नई रेस: अमेरिका बनाम चीन

DeepSeek की इस सफलता ने अमेरिका को झकझोर कर रख दिया है। अमेरिका अब अपनी बादशाहत बचाने के लिए बड़े प्रोजेक्ट्स पर काम कर रहा है। हालांकि, DeepSeek ने दिखा दिया है कि AI की दुनिया में केवल बड़े निवेश और महंगे चिप्स से ही काम नहीं चलता।

First Published : January 27, 2025 | 5:26 PM IST