facebookmetapixel
Editorial: टिकाऊ कर व्यवस्था से ही बढ़ेगा भारत में विदेशी निवेशपीएसयू के शीर्ष पदों पर निजी क्षेत्र के उम्मीदवारों का विरोधपहले कार्यकाल की उपलब्धियां तय करती हैं किसी मुख्यमंत्री की राजनीतिक उम्रवित्त वर्ष 2026 की दूसरी तिमाही के दौरान प्रतिभूतियों में आई तेजीलक्जरी ईवी सेगमेंट में दूसरे नंबर पर जेएसडब्ल्यू एमजी मोटर इंडियाअगले तीन साल के दौरान ब्रिटेन में 5,000 नई नौकरियां सृजित करेगी टीसीएसभारत में 50 करोड़ पाउंड निवेश करेगी टाइड, 12 महीने में देगी 800 नौकरियांसरकार ने विद्युत अधिनियम में ऐतिहासिक संशोधन किया पेश, क्रॉस-सब्सिडी के बोझ से मिलेगी राहतअर्थव्यवस्था बंद कर विकास की गति सीमित कर रहा भारत: जेरोनिम जेटल्मेयरTata Trusts की बैठक में टाटा संस विवाद पर चर्चा नहीं, न्यासियों ने परोपकारी पहल पर ध्यान केंद्रित किया

चीन की DeepSeek ने AI की दुनिया में मचाई हलचल, अमेरिका की ChatGPT और Gemini को चुनौती

चीन की DeepSeek लैब ने अपने ओपन-सोर्स AI मॉडल्स के जरिए ग्लोबल AI इंडस्ट्री में मचाई हलचल, OpenAI को दे रही सीधी चुनौती।

Last Updated- January 27, 2025 | 5:33 PM IST
Deepseek

चीन की AI रिसर्च लैब DeepSeek ने हाल ही में ऐसा कारनामा किया है जिसने आर्टिफिशियल इंटेलिजेंस (AI) की दुनिया को चौंका दिया है। इस लैब ने अपना नया ओपन-सोर्स मॉडल DeepSeek-R1 लॉन्च किया है, जो न केवल OpenAI जैसे दिग्गजों को टक्कर दे रहा है, बल्कि कई मामलों में उनसे बेहतर प्रदर्शन कर रहा है। खास बात यह है कि DeepSeek ने यह उपलब्धि बेहद कम लागत में हासिल की है, जिससे ग्लोबल AI उद्योग में एक नई बहस छिड़ गई है।

DeepSeek क्या है और कैसे बना यह सपना हकीकत?

DeepSeek चीन की एक स्वतंत्र AI रिसर्च लैब है, जिसकी शुरुआत 2023 में लियांग वेनफेंग ने की थी। इसका मूल जुड़ाव High-Flyer नाम के एक हेज फंड से है, जो फाइनेंशियल डेटा एनालिसिस में एडवांस्ड कंप्यूटिंग का इस्तेमाल करता था। हालांकि, लियांग ने AI के क्षेत्र में कुछ बड़ा करने के लिए High-Flyer के रिसोर्सेस को DeepSeek की तरफ मोड़ दिया।

DeepSeek को चीन की Baidu और Alibaba जैसी बड़ी कंपनियों का समर्थन नहीं है। यह पूरी तरह से स्वतंत्र रूप से काम करती है। लियांग का मकसद केवल मुनाफा कमाना नहीं, बल्कि वैज्ञानिक खोजों के जरिए दुनिया को नई तकनीकों से परिचित कराना है।

DeepSeek-R1: AI की दुनिया का नया सितारा

DeepSeek का नया मॉडल DeepSeek-R1 AI की दुनिया में एक नई मिसाल बन चुका है। यह मॉडल अपनी बेहतरीन रीजनिंग क्षमता, मैथ और कोडिंग जैसे कार्यों में शानदार प्रदर्शन कर रहा है। DeepSeek ने न केवल अपने प्रमुख मॉडल को ओपन-सोर्स किया है, बल्कि इसके छोटे वर्जन भी डेवलपर्स के लिए उपलब्ध कराए हैं। इन सभी मॉडल्स को MIT लाइसेंस के तहत लॉन्च किया गया है, जिससे डेवलपर्स इन्हें फाइन-ट्यून और कस्टमाइज कर सकते हैं।

इस मॉडल की सबसे खास बात इसकी किफायती ट्रेनिंग तकनीक है। DeepSeek ने नई टेक्नोलॉजीज, जैसे मल्टी-हेड लैटेंट अटेंशन (MLA) और मिश्रण-ऑफ-एक्सपर्ट्स का इस्तेमाल किया, जिससे इसकी लागत बहुत कम हो गई। रिपोर्ट्स के अनुसार, DeepSeek ने अपने मॉडल को Meta के Llama मॉडल की तुलना में केवल 10% रिसोर्स में ट्रेन किया।

लियांग वेनफेंग: DeepSeek के पीछे का दिमाग

DeepSeek के संस्थापक लियांग वेनफेंग का सफर बेहद प्रेरणादायक है। 1985 में जन्मे लियांग ने झेजियांग यूनिवर्सिटी से इंजीनियरिंग की पढ़ाई की और उसके बाद फाइनेंशियल हेज फंड इंडस्ट्री में कदम रखा। लेकिन उनका असली सपना AI की दुनिया में कुछ बड़ा करना था।

DeepSeek में लियांग ने चीन की टॉप यूनिवर्सिटीज़, जैसे पेकिंग यूनिवर्सिटी और चिंगहुआ यूनिवर्सिटी, के युवा रिसर्चर्स को मौका दिया। ये युवा वैज्ञानिक न केवल अपनी पढ़ाई में एक्सिलेंट थे, बल्कि नए इनोवेशन के लिए भी पूरी तरह समर्पित थे। लियांग का मानना है कि युवा दिमाग ज्यादा साहसी होते हैं और जोखिम उठाने को तैयार रहते हैं, जो AI जैसी तकनीकी क्षेत्र में जरूरी है।

अमेरिकी प्रतिबंध और DeepSeek की स्मार्ट रणनीति

2022 में अमेरिका ने चीन पर एडवांस्ड चिप्स, जैसे Nvidia H100, की सप्लाई पर रोक लगा दी। इससे चीन की AI इंडस्ट्री को झटका लगा। लेकिन DeepSeek ने इस चुनौती को अपने फायदे में बदल दिया।

DeepSeek ने अपने मॉडल को ट्रेन करने के लिए किफायती और स्मार्ट तकनीकों का सहारा लिया। उन्होंने कस्टम डेटा एक्सचेंज और मेमोरी ऑप्टिमाइजेशन जैसे उपाय अपनाए, जिससे सीमित संसाधनों में भी बेहतरीन परिणाम मिले। इन रणनीतियों ने यह साबित कर दिया कि AI की दुनिया में सफलता केवल महंगे संसाधनों पर निर्भर नहीं करती।

DeepSeek ने अपनी तकनीकों में तीन बड़े बदलाव किए:

कस्टम कम्युनिकेशन स्कीम्स: चिप्स के बीच डेटा शेयरिंग को इतना स्मार्ट बना दिया कि मेमोरी की बचत होने लगी।
मेमोरी ऑप्टिमाइजेशन: फील्ड साइज को घटाकर संसाधनों का अधिकतम इस्तेमाल किया।
मिक्स-ऑफ-मॉडल्स: छोटे-छोटे मॉडलों को जोड़कर ऐसे रिजल्ट दिए जो बड़े मॉडल्स को टक्कर देते हैं।

ओपन-सोर्स मॉडल से बढ़ती DeepSeek की धाक

DeepSeek ने अपने AI मॉडल्स को ओपन-सोर्स करके पूरी दुनिया का ध्यान खींचा है। MIT लाइसेंस के तहत, कोई भी डेवलपर इन मॉडल्स का इस्तेमाल कर सकता है और अपनी जरूरत के हिसाब से इन्हें कस्टमाइज कर सकता है। इस कदम से न केवल AI तकनीकों तक पहुंच आसान हुई है, बल्कि पश्चिमी कंपनियों के दबदबे को भी चुनौती दी गई है।

AI की नई रेस: अमेरिका बनाम चीन

DeepSeek की इस सफलता ने अमेरिका को झकझोर कर रख दिया है। अमेरिका अब अपनी बादशाहत बचाने के लिए बड़े प्रोजेक्ट्स पर काम कर रहा है। हालांकि, DeepSeek ने दिखा दिया है कि AI की दुनिया में केवल बड़े निवेश और महंगे चिप्स से ही काम नहीं चलता।

First Published - January 27, 2025 | 5:26 PM IST

संबंधित पोस्ट