facebookmetapixel
अमेरिका और यूरोप की नीति में बदलाव से एशियाई इलेक्ट्रिक वाहन उद्योग को झटका, EV कंपनियां मुश्किल में‘आम आदमी को उठाना पड़ सकता है बैंकिंग सिस्टम का नुकसान’, रॉबर्ट कियोसाकी ने लोगों को क्यों चेताया?पिरामल फाइनेंस श्रीराम लाइफ में 14.72% हिस्सेदारी Sanlam ग्रुप को बेचेगी, ₹600 करोड़ का सौदाEPFO का बड़ा फैसला: नौकरी बदलते समय वीकेंड और छुट्टियां अब सर्विस ब्रेक नहीं मानी जाएंगीइस साल इनकम टैक्स रिटर्न फाइल करने में लोगों की ये गलतियां पड़ीं भारी, रिफंड अटका और मिला नोटिसजापान की MUFG श्रीराम फाइनेंस में 20% खरीदेगी हिस्सेदारी, ₹39,618 करोड़ का निवेशस्मार्टफोन चमके, कपड़ा डूबा- भारत के निर्यात की अंदरूनी कहानी₹546 करोड़ जब्ती पर बड़ा मोड़, अवधूत साठे की याचिका पर SAT में 9 जनवरी को सुनवाईकम रिस्क में नियमित आमदनी? कैसे चुनें बेहतर फिक्स्ड इनकम म्युचुअल फंडIPO की राह पर अदाणी एयरपोर्ट्स, 2030 तक ₹1 लाख करोड़ निवेश का प्लान

चीन की DeepSeek ने AI की दुनिया में मचाई हलचल, अमेरिका की ChatGPT और Gemini को चुनौती

चीन की DeepSeek लैब ने अपने ओपन-सोर्स AI मॉडल्स के जरिए ग्लोबल AI इंडस्ट्री में मचाई हलचल, OpenAI को दे रही सीधी चुनौती।

Last Updated- January 27, 2025 | 5:33 PM IST
Deepseek

चीन की AI रिसर्च लैब DeepSeek ने हाल ही में ऐसा कारनामा किया है जिसने आर्टिफिशियल इंटेलिजेंस (AI) की दुनिया को चौंका दिया है। इस लैब ने अपना नया ओपन-सोर्स मॉडल DeepSeek-R1 लॉन्च किया है, जो न केवल OpenAI जैसे दिग्गजों को टक्कर दे रहा है, बल्कि कई मामलों में उनसे बेहतर प्रदर्शन कर रहा है। खास बात यह है कि DeepSeek ने यह उपलब्धि बेहद कम लागत में हासिल की है, जिससे ग्लोबल AI उद्योग में एक नई बहस छिड़ गई है।

DeepSeek क्या है और कैसे बना यह सपना हकीकत?

DeepSeek चीन की एक स्वतंत्र AI रिसर्च लैब है, जिसकी शुरुआत 2023 में लियांग वेनफेंग ने की थी। इसका मूल जुड़ाव High-Flyer नाम के एक हेज फंड से है, जो फाइनेंशियल डेटा एनालिसिस में एडवांस्ड कंप्यूटिंग का इस्तेमाल करता था। हालांकि, लियांग ने AI के क्षेत्र में कुछ बड़ा करने के लिए High-Flyer के रिसोर्सेस को DeepSeek की तरफ मोड़ दिया।

DeepSeek को चीन की Baidu और Alibaba जैसी बड़ी कंपनियों का समर्थन नहीं है। यह पूरी तरह से स्वतंत्र रूप से काम करती है। लियांग का मकसद केवल मुनाफा कमाना नहीं, बल्कि वैज्ञानिक खोजों के जरिए दुनिया को नई तकनीकों से परिचित कराना है।

DeepSeek-R1: AI की दुनिया का नया सितारा

DeepSeek का नया मॉडल DeepSeek-R1 AI की दुनिया में एक नई मिसाल बन चुका है। यह मॉडल अपनी बेहतरीन रीजनिंग क्षमता, मैथ और कोडिंग जैसे कार्यों में शानदार प्रदर्शन कर रहा है। DeepSeek ने न केवल अपने प्रमुख मॉडल को ओपन-सोर्स किया है, बल्कि इसके छोटे वर्जन भी डेवलपर्स के लिए उपलब्ध कराए हैं। इन सभी मॉडल्स को MIT लाइसेंस के तहत लॉन्च किया गया है, जिससे डेवलपर्स इन्हें फाइन-ट्यून और कस्टमाइज कर सकते हैं।

इस मॉडल की सबसे खास बात इसकी किफायती ट्रेनिंग तकनीक है। DeepSeek ने नई टेक्नोलॉजीज, जैसे मल्टी-हेड लैटेंट अटेंशन (MLA) और मिश्रण-ऑफ-एक्सपर्ट्स का इस्तेमाल किया, जिससे इसकी लागत बहुत कम हो गई। रिपोर्ट्स के अनुसार, DeepSeek ने अपने मॉडल को Meta के Llama मॉडल की तुलना में केवल 10% रिसोर्स में ट्रेन किया।

लियांग वेनफेंग: DeepSeek के पीछे का दिमाग

DeepSeek के संस्थापक लियांग वेनफेंग का सफर बेहद प्रेरणादायक है। 1985 में जन्मे लियांग ने झेजियांग यूनिवर्सिटी से इंजीनियरिंग की पढ़ाई की और उसके बाद फाइनेंशियल हेज फंड इंडस्ट्री में कदम रखा। लेकिन उनका असली सपना AI की दुनिया में कुछ बड़ा करना था।

DeepSeek में लियांग ने चीन की टॉप यूनिवर्सिटीज़, जैसे पेकिंग यूनिवर्सिटी और चिंगहुआ यूनिवर्सिटी, के युवा रिसर्चर्स को मौका दिया। ये युवा वैज्ञानिक न केवल अपनी पढ़ाई में एक्सिलेंट थे, बल्कि नए इनोवेशन के लिए भी पूरी तरह समर्पित थे। लियांग का मानना है कि युवा दिमाग ज्यादा साहसी होते हैं और जोखिम उठाने को तैयार रहते हैं, जो AI जैसी तकनीकी क्षेत्र में जरूरी है।

अमेरिकी प्रतिबंध और DeepSeek की स्मार्ट रणनीति

2022 में अमेरिका ने चीन पर एडवांस्ड चिप्स, जैसे Nvidia H100, की सप्लाई पर रोक लगा दी। इससे चीन की AI इंडस्ट्री को झटका लगा। लेकिन DeepSeek ने इस चुनौती को अपने फायदे में बदल दिया।

DeepSeek ने अपने मॉडल को ट्रेन करने के लिए किफायती और स्मार्ट तकनीकों का सहारा लिया। उन्होंने कस्टम डेटा एक्सचेंज और मेमोरी ऑप्टिमाइजेशन जैसे उपाय अपनाए, जिससे सीमित संसाधनों में भी बेहतरीन परिणाम मिले। इन रणनीतियों ने यह साबित कर दिया कि AI की दुनिया में सफलता केवल महंगे संसाधनों पर निर्भर नहीं करती।

DeepSeek ने अपनी तकनीकों में तीन बड़े बदलाव किए:

कस्टम कम्युनिकेशन स्कीम्स: चिप्स के बीच डेटा शेयरिंग को इतना स्मार्ट बना दिया कि मेमोरी की बचत होने लगी।
मेमोरी ऑप्टिमाइजेशन: फील्ड साइज को घटाकर संसाधनों का अधिकतम इस्तेमाल किया।
मिक्स-ऑफ-मॉडल्स: छोटे-छोटे मॉडलों को जोड़कर ऐसे रिजल्ट दिए जो बड़े मॉडल्स को टक्कर देते हैं।

ओपन-सोर्स मॉडल से बढ़ती DeepSeek की धाक

DeepSeek ने अपने AI मॉडल्स को ओपन-सोर्स करके पूरी दुनिया का ध्यान खींचा है। MIT लाइसेंस के तहत, कोई भी डेवलपर इन मॉडल्स का इस्तेमाल कर सकता है और अपनी जरूरत के हिसाब से इन्हें कस्टमाइज कर सकता है। इस कदम से न केवल AI तकनीकों तक पहुंच आसान हुई है, बल्कि पश्चिमी कंपनियों के दबदबे को भी चुनौती दी गई है।

AI की नई रेस: अमेरिका बनाम चीन

DeepSeek की इस सफलता ने अमेरिका को झकझोर कर रख दिया है। अमेरिका अब अपनी बादशाहत बचाने के लिए बड़े प्रोजेक्ट्स पर काम कर रहा है। हालांकि, DeepSeek ने दिखा दिया है कि AI की दुनिया में केवल बड़े निवेश और महंगे चिप्स से ही काम नहीं चलता।

First Published - January 27, 2025 | 5:26 PM IST

संबंधित पोस्ट