facebookmetapixel
Advertisement
नोकिया ने भारत में नेतृत्व ढांचा बदला, समर मित्तल और विभा मेहरा को नई जिम्मेदारीनिप्पॉन स्टील इंडिया के सीईओ उम्मेन जून में सेवानिवृत्त होंगेजेएसडब्ल्यू मोटर्स ने दसॉ सिस्टम्स से किया करार, ईवी डिजाइन और उत्पादन को मिलेगी रफ्तारफेम-2 के बकाये अटके, ऑटो कंपनियां अब भी भुगतान के इंतजार मेंएलपीजी संकट में क्लबों का जुगाड़, लकड़ी के चूल्हे और इलेक्ट्रिक कुकिंग का सहारागैस पाइपलाइन विस्तार को रफ्तार, सरकार ने मंजूरी प्रक्रिया तेज कीदेश में एलपीजी सप्लाई की कोई कमी नहीं, घबराने की जरूरत नहीं: सरकारStock Market Update: शेयर बाजार की कमजोर शुरुआत, सेंसेक्स 800 से ज्यादा अंक टूटा; निफ्टी 23100 के करीबStocks to Watch Today: IREDA से लेकर RIL और Infosys तक, शुक्रवार को इन 10 स्टॉक्स में रखें नजरअगर युद्ध एक महीने और जारी रहा तो दुनिया में खाद्य संकट संभव: मैट सिम्पसन

चीन की DeepSeek ने AI की दुनिया में मचाई हलचल, अमेरिका की ChatGPT और Gemini को चुनौती

Advertisement

चीन की DeepSeek लैब ने अपने ओपन-सोर्स AI मॉडल्स के जरिए ग्लोबल AI इंडस्ट्री में मचाई हलचल, OpenAI को दे रही सीधी चुनौती।

Last Updated- January 27, 2025 | 5:33 PM IST
Deepseek

चीन की AI रिसर्च लैब DeepSeek ने हाल ही में ऐसा कारनामा किया है जिसने आर्टिफिशियल इंटेलिजेंस (AI) की दुनिया को चौंका दिया है। इस लैब ने अपना नया ओपन-सोर्स मॉडल DeepSeek-R1 लॉन्च किया है, जो न केवल OpenAI जैसे दिग्गजों को टक्कर दे रहा है, बल्कि कई मामलों में उनसे बेहतर प्रदर्शन कर रहा है। खास बात यह है कि DeepSeek ने यह उपलब्धि बेहद कम लागत में हासिल की है, जिससे ग्लोबल AI उद्योग में एक नई बहस छिड़ गई है।

DeepSeek क्या है और कैसे बना यह सपना हकीकत?

DeepSeek चीन की एक स्वतंत्र AI रिसर्च लैब है, जिसकी शुरुआत 2023 में लियांग वेनफेंग ने की थी। इसका मूल जुड़ाव High-Flyer नाम के एक हेज फंड से है, जो फाइनेंशियल डेटा एनालिसिस में एडवांस्ड कंप्यूटिंग का इस्तेमाल करता था। हालांकि, लियांग ने AI के क्षेत्र में कुछ बड़ा करने के लिए High-Flyer के रिसोर्सेस को DeepSeek की तरफ मोड़ दिया।

DeepSeek को चीन की Baidu और Alibaba जैसी बड़ी कंपनियों का समर्थन नहीं है। यह पूरी तरह से स्वतंत्र रूप से काम करती है। लियांग का मकसद केवल मुनाफा कमाना नहीं, बल्कि वैज्ञानिक खोजों के जरिए दुनिया को नई तकनीकों से परिचित कराना है।

DeepSeek-R1: AI की दुनिया का नया सितारा

DeepSeek का नया मॉडल DeepSeek-R1 AI की दुनिया में एक नई मिसाल बन चुका है। यह मॉडल अपनी बेहतरीन रीजनिंग क्षमता, मैथ और कोडिंग जैसे कार्यों में शानदार प्रदर्शन कर रहा है। DeepSeek ने न केवल अपने प्रमुख मॉडल को ओपन-सोर्स किया है, बल्कि इसके छोटे वर्जन भी डेवलपर्स के लिए उपलब्ध कराए हैं। इन सभी मॉडल्स को MIT लाइसेंस के तहत लॉन्च किया गया है, जिससे डेवलपर्स इन्हें फाइन-ट्यून और कस्टमाइज कर सकते हैं।

इस मॉडल की सबसे खास बात इसकी किफायती ट्रेनिंग तकनीक है। DeepSeek ने नई टेक्नोलॉजीज, जैसे मल्टी-हेड लैटेंट अटेंशन (MLA) और मिश्रण-ऑफ-एक्सपर्ट्स का इस्तेमाल किया, जिससे इसकी लागत बहुत कम हो गई। रिपोर्ट्स के अनुसार, DeepSeek ने अपने मॉडल को Meta के Llama मॉडल की तुलना में केवल 10% रिसोर्स में ट्रेन किया।

लियांग वेनफेंग: DeepSeek के पीछे का दिमाग

DeepSeek के संस्थापक लियांग वेनफेंग का सफर बेहद प्रेरणादायक है। 1985 में जन्मे लियांग ने झेजियांग यूनिवर्सिटी से इंजीनियरिंग की पढ़ाई की और उसके बाद फाइनेंशियल हेज फंड इंडस्ट्री में कदम रखा। लेकिन उनका असली सपना AI की दुनिया में कुछ बड़ा करना था।

DeepSeek में लियांग ने चीन की टॉप यूनिवर्सिटीज़, जैसे पेकिंग यूनिवर्सिटी और चिंगहुआ यूनिवर्सिटी, के युवा रिसर्चर्स को मौका दिया। ये युवा वैज्ञानिक न केवल अपनी पढ़ाई में एक्सिलेंट थे, बल्कि नए इनोवेशन के लिए भी पूरी तरह समर्पित थे। लियांग का मानना है कि युवा दिमाग ज्यादा साहसी होते हैं और जोखिम उठाने को तैयार रहते हैं, जो AI जैसी तकनीकी क्षेत्र में जरूरी है।

अमेरिकी प्रतिबंध और DeepSeek की स्मार्ट रणनीति

2022 में अमेरिका ने चीन पर एडवांस्ड चिप्स, जैसे Nvidia H100, की सप्लाई पर रोक लगा दी। इससे चीन की AI इंडस्ट्री को झटका लगा। लेकिन DeepSeek ने इस चुनौती को अपने फायदे में बदल दिया।

DeepSeek ने अपने मॉडल को ट्रेन करने के लिए किफायती और स्मार्ट तकनीकों का सहारा लिया। उन्होंने कस्टम डेटा एक्सचेंज और मेमोरी ऑप्टिमाइजेशन जैसे उपाय अपनाए, जिससे सीमित संसाधनों में भी बेहतरीन परिणाम मिले। इन रणनीतियों ने यह साबित कर दिया कि AI की दुनिया में सफलता केवल महंगे संसाधनों पर निर्भर नहीं करती।

DeepSeek ने अपनी तकनीकों में तीन बड़े बदलाव किए:

कस्टम कम्युनिकेशन स्कीम्स: चिप्स के बीच डेटा शेयरिंग को इतना स्मार्ट बना दिया कि मेमोरी की बचत होने लगी।
मेमोरी ऑप्टिमाइजेशन: फील्ड साइज को घटाकर संसाधनों का अधिकतम इस्तेमाल किया।
मिक्स-ऑफ-मॉडल्स: छोटे-छोटे मॉडलों को जोड़कर ऐसे रिजल्ट दिए जो बड़े मॉडल्स को टक्कर देते हैं।

ओपन-सोर्स मॉडल से बढ़ती DeepSeek की धाक

DeepSeek ने अपने AI मॉडल्स को ओपन-सोर्स करके पूरी दुनिया का ध्यान खींचा है। MIT लाइसेंस के तहत, कोई भी डेवलपर इन मॉडल्स का इस्तेमाल कर सकता है और अपनी जरूरत के हिसाब से इन्हें कस्टमाइज कर सकता है। इस कदम से न केवल AI तकनीकों तक पहुंच आसान हुई है, बल्कि पश्चिमी कंपनियों के दबदबे को भी चुनौती दी गई है।

AI की नई रेस: अमेरिका बनाम चीन

DeepSeek की इस सफलता ने अमेरिका को झकझोर कर रख दिया है। अमेरिका अब अपनी बादशाहत बचाने के लिए बड़े प्रोजेक्ट्स पर काम कर रहा है। हालांकि, DeepSeek ने दिखा दिया है कि AI की दुनिया में केवल बड़े निवेश और महंगे चिप्स से ही काम नहीं चलता।

Advertisement
First Published - January 27, 2025 | 5:26 PM IST

संबंधित पोस्ट

Advertisement
Advertisement
Advertisement