जेनरेटिव एआई की प्रगति को देखते हुए डेटा सुरक्षा का विषय और गंभीर हो गया है। भारत को भी इस संबंध में कानून तैयार कर इनका क्रियान्वयन करना चाहिए। बता रहे हैं प्रसेनजित दत्ता
पिछले आधे दशक में आर्टिफिशल इंटेलिजेंस (AI) के क्षेत्र में काफी प्रगति हुई है। एआई में इस विशेष प्रगति से डीप लर्निंग और मशीन लर्निंग एल्गोरिद्म तकनीक काफी आधुनिक हो गई हैं और अब गणना करने की क्षमता और आंकड़ों की उपलब्धता दोनों ही बढ़ गई हैं।
हालांकि, इस प्रगति पर सही अर्थ में उन्हीं लोगों ने नजर रखी है जो एआई या डिजिटल तकनीक में दिलचस्पी रखते हैं। पिछले साल नवंबर में ओपनएआई ने चैटजीपीटी और डॉल-ई शुरू किया और लोगों को यह दिखाया कि ये स्वाभाविक एवं सरल भाषा में कमांड देने पर क्या परिणाम ला सकते हैं।
पलक झपकते ही चैटजीपीटी और एआई लोगों के घरों और दफ्तरों में चर्चा के प्रमुख केंद्र बन गए। लोग चैटजीपीटी का इस्तेमाल करने के लिए आतुर हो गए और कई लोग तो इसकी क्षमताएं देखकर अचंभित रह गए। जिन लोगों को कुछ समय पहले तक एआई के बारे में बहुत जानकारी नहीं थी वे भी जेनरेटिव एआई, लार्ज लैंग्वेज मॉडल्स (एलएलएम), जेनरेटिव एडवर्सरियल नेटवर्क्स (जीएएन) और ह्यूरिस्टिक्स की चर्चा करने लगे।
भारत में भी कई लोग एआई की खूबियों और खामियों पर चर्चा
खूबियों के साथ ही एआई की क्षमताओं एवं जोखिमों पर भी बातें होने लगीं। कुछ लोगों ने कहा कि एआई से कई महत्त्वपूर्ण उपलब्धियां हासिल होंगी और मानव की कई समस्याओं का समाधान हो जाएगा। कुछ दूसरे लोगों ने एआई को लेकर डरावनी तस्वीर पेश की और कहना शुरू कर दिया कि यह मानव के लिए जलवायु परिवर्तन से भी बड़ा खतरा साबित होगा।
भारत में भी कई लोग एआई की खूबियों और खामियों पर चर्चा कर रहे हैं मगर वे सूचना, इसके प्रकार, बौद्धिक संपदा से जुड़ी चिंताओं और इन सबसे ऊपर डेटा की सुरक्षा जैसे गंभीर विषयों पर बहस नहीं कर रहे हैं।
इन सभी तकनीकी बातों से इतर आजकल के ज्यादातर एआई प्रोग्राम और अल्गोरिद्म आंकड़ों के एक बड़े समूह का अध्ययन करने के बाद सीखे-समझे जाते हैं। इसे बेहतर तरीके से समझने के लिए एक ऐसे व्यक्ति का उदाहरण लेते हैं जो कोई विषय सीखने का प्रयास कर रहा है। कोई व्यक्ति किसी विषय पर जितनी सामग्री का अध्ययन करता है और जितनी बार उन्हें पढ़ता है उतना ही फायदा मिलता है।
एआई एल्गोरिद्म भी कुछ इसी तरह काम करता है। यही कारण है कि जिस डेटा या सामग्री से एआई एल्गोरिद्म सीखता है वह इसकी सफलता या विफलता के लिए अत्यंत आवश्यक हो जाता है। कई दूसरे एआई भी हैं मगर डीप लर्निंग या मशीन लर्निंग और एलएलएम वे एआई हैं जिन पर इन दिनों सर्वाधिक चर्चा हो रही है।
जेनरेटिव एआई प्रोग्राम जैसे ओपनएआई का चैटजीपीटी और डॉल-ई या गूगल के बार्ड को बड़े पैमाने पर डेटा की जरूरत होती है और उसके बाद ही वे आपको प्रभावित करने की क्षमता हासिल कर पाते हैं। ये एलएलएम बड़ी मात्रा में शाब्दिक (कभी-कभी तस्वीर) को लेकर पहले से ही प्रशिक्षित रहते हैं इसलिए मानव की तरह शब्द एवं चित्र तैयार कर पाते हैं।
डेटा जितना बड़ा एवं बेहतर होगा एआई प्रोग्राम उतना ही बेहतर सीख पाएगा, बशर्ते कि शोधकर्ताओं का अल्गोरिद्म सही हो। यही कारण है कि लार्ज लैंग्वेज मॉडल और जेनरेटिव एआई प्रोग्राम के लिए उच्च गुणवत्ता वाले डेटा महत्त्वपूर्ण होते हैं। ये प्रोग्राम रोज ही सुर्खियों में रहते हैं। ओपनएआई (OpenAI) और चैटजीपीटी (CHatGPT) की घर-घर चर्चा शुरू होने और लोगों के जेहन में एलएलएम और जेनरेटिव एआई के आने से पहले ही दुनिया भर में नीति निर्धारक नागरिकों की निजी जानकारियों की सुरक्षा को लेकर चिंतित होने लगे थे।
इस चिंता का कारण यह था कि बड़ी कंपनियां निःशुल्क सेवाएं या काफी सस्ती सेवाएं देकर लोगों से उनकी संवेदनशील जानकारियां बटोर रही थीं। उदाहरण के लिए गूगल की खोज सेवा इसलिए निःशुल्क है क्योंकि यह यूजर से संग्रहीत आंकड़ों के आधार पर विज्ञापन से काफी रकम कमा रही है।
फेसबुक, इंस्टाग्राम, ट्विटर और अन्य सोशल मीडिया प्लेटफॉर्म के मामले में भी यही बात लागू होती है। जो कंपनियां- जैसे एमेजॉन और ऐपल- निःशुल्क सेवाएं नहीं देती हैं वे भी आपसे सारी सूचनाएं ले रही हैं। आप जितनी बार इनका इस्तेमाल करते हैं उतनी बार ये आप से आपसे जुड़ी जानकारियां ले लेती हैं। इन चिंताओं के बीच कई देशों में डेटा सुरक्षा कानून बनाए गए और डेटा से जुड़े विषयों से निपटने के लिए इनमें संशोधन किए गए। हाल में जेनरेटिव एआई में प्रगति को देखते हुए यह विषय और गंभीर हो गया है। इसे देखते हुए चीन से लेकर यूरोपीय संघ तक के देश एआई के नियमन की बातें करने लगे हैं। जानकारियों के इस्तेमाल के दौरान सुरक्षा सुरक्षित करना और पर्याप्त सावधानी बरतने पर इन नियम-कायदों का विशेष जोर है।
चीन के बाद भारत डिजिटल डेटा सृजित करने वाला दुनिया का संभवतः दूसरा सबसे बड़ा देश
इन नियम-शर्तों के केंद्र में लोगों की उदाहरण के लिए यूरोपीय संघ का डेटा कानून सर्वाधिक व्यापक है जिसमें नागरिकों की निजता एवं सुरक्षा को ध्यान में रखा गया है। इन दिशानिर्देशों में विस्तृत एआई नियमन भी जोड़े जाएंगे जिन्हें अंतिम रूप दिया जा रहा है।
चीन के बाद भारत डिजिटल डेटा सृजित करने वाला दुनिया का संभवतः दूसरा सबसे बड़ा देश है। हमारी बढ़ती आबादी और ब्रॉडबैंड एवं डिजिटल सेवाओं पर सरकार के जोर के बीच यह संभव हो गया है। मगर एक देश के रूप में डेटा निजता की सुरक्षा के लिए नियम तय करने में भी हम पीछे रहे हैं। डेटा सुरक्षा एवं निजता कानून के मसौदे भी ठीक तरीके से तैयार नहीं किए गए हैं। इस संबंध में एक और मसौदा तैयार है और संसद में यह जल्द ही प्रस्तुत किया जाएगा।
दुनिया के दूसरे सतर्क देशों से उलट भारत एआई के नियमन को लेकर ‘रुको एवं देखो’ रखने की नीति के साथ आगे बढ़ रहा है। भारत सरकार नीति निर्धारक भारतीय नागरिकों के लिए पैदा होने वाले जोखिम को लेकर अधिक चिंतित नहीं दिख रही हैं। भारत के लोगों की ज्यादातर जानकारियां असुरक्षित हैं।
वक्त का तकाजा यही कहता है कि भारत को जल्द से जल्द डेटा कानून तैयार कर इसे पारित करा लेना चाहिए क्योंकि यह कोई ऐसा विषय नहीं है जिस पर वाद-विवाद किया जा सके। मगर कानून तैयार करना पहला कदम होगा। पश्चिमी देशों के उलट कानून लागू करने की भारत की संस्थागत क्षमता कमजोर रही है। डिजिटल खंड में केवल कानून बनाने से कुछ नहीं होगा, अगर इसके क्रियान्वयन की क्षमता साथ-साथ तैयार नहीं होती है। ये दोनों ही बातें प्राथमिकता बन गई हैं जिन्हें लेकर अब और देरी नहीं की जा सकती है।
(लेखक बिज़नेस टुडे और बिज़नेसवर्ल्ड के पूर्व संपादक और संपादकीय सलाहकार संस्था प्रोजेकव्यू के संस्थापक हैं।)