चंद रोज पहले गूगल ने प्रकाशकों को एक स्विच मुहैया कराया जिसकी मदद से उनकी वेबसाइट सर्च इंजन के लिए तो उपलब्ध होती लेकिन गूगल के बार्ड जैसे जेनरेटिव आर्टिफिशल इंटेलिजेंस (एआई) मॉडल के प्रशिक्षण के लिए नहीं। गूगल के विस्तारित टूल का इस्तेमाल करके वेब प्रकाशक इस बात पर नियंत्रण कर सकते हैं कि उनकी सामग्री खोज के लिए उपलब्ध होगी या फिर एआई मॉडल के प्रशिक्षण के लिए भी जो ऐसी सामग्री से सीखते हैं।
गूगल ने शायद यह टूल इसलिए बनाया होगा कि शायद उसे वास्तव में यह यकीन हो कि कंटेंट तैयार करने वालों और प्रकाशकों का इस बात पर नियंत्रण होना चाहिए कि उनके डेटा का किस प्रकार इस्तेमाल किया जाएगा। या फिर शायद उसने यह कदम इसलिए उठाया होगा ताकि कंटेंट तैयार करने वाले लोगों और वेब प्रकाशकों के साथ लंबी कानूनी लड़ाई से बचा जा सके। चाहे जो भी हो इसने डेटा और कंटेंट स्वामित्व के मसले को उछाल दिया जो ओपन एआई के चैट जीपीटी के आगमन के बाद जेनरेटिव एआई से सबका परिचय हो जाने के बाद काफी विवादित मुद्दा बन गया।
गत नवंबर में चैट जीपीटी के आगमन के बाद कुछ बातें एकदम स्पष्ट हो गई थीं। पहली बात, चैटजीपीटी तथा अन्य मॉडल चाहे जितने जादुई प्रतीत हुए हों लेकिन अभी भी उनमें कई कमियां हैं जिन्हें दूर करने की आवश्यकता है। अगर उन पर ज्यादा दबाव डाला जाए और उनका इस्तेमाल लंबे समय तक किया जाए तो वे भ्रमित हो जाते हैं। समय के साथ उनके जवाब की गुणवत्ता कम होती जाती है और कई बार वे काल्पनिक जवाब भी देने लगते हैं।
Also read: बेटियों के लिए उत्तराधिकार की राह अब आसान
इसके अलावा अधिक प्रासंगिक बात यह है कि ओपनएआई ने अपने जेनरेटिव एआई मॉडलों को प्रशिक्षित करने के लिए एक वेब क्रॉलर बनाया जो कंटेंट निर्माताओं या कॉपीराइट धारकों से बिना इजाजत लेने जैसे कदम उठाए बिना ही इंटरनेट से सामग्री उठा सकता है। जेनरेटिव एआई में उस दौर के अन्य उदाहरणों ने भी यही किया।
जॉन ग्रीशम, जॉर्ज आर आर मार्टिन, जॉनथन फ्रांजेन, डेविड बाल्डसी और माइकल कॉनेली समेत प्रमुख लेखकों के एक समूह ने ओपनएआई पर मुकदमा किया है। अन्य प्रमुख लेखक तथा कंटेंट निर्माता, चित्रकार और छायाकार आदि भी जल्दी ही मुकदमा कर सकते हैं। दरअसल यह मसला हल होना है कि क्या जेनरेटिव एआई मॉडल के पास यह अधिकार है कि वे बिना इजाजत लिए इंटरनेट से सामग्री उठाएं और फिर बिना लोगों को भुगतान किए या उनकी इजाजत लिए सामग्री का इस्तेमाल प्रशिक्षण के उद्देश्य से करें।
गूगल के गूगल एक्सटेंडेड टूल के सामने आने के पहले ही द न्यूयॉर्क टाइम्स और मीडियम समेत कई प्रकाशकों ने अपनी वेबसाइट को सुरक्षित रखने के उपाय किए हैं और ऐसे टूल का इस्तेमाल शुरू कर दिया है जिनकी मदद से उनकी सामग्री का इस्तेमाल जेनरेटिव एआई मॉडल अपने प्रशिक्षण के लिए नहीं कर सकेंगे। खबरों के मुताबिक द टाइम्स ऑफ इंडिया, द हिंदुस्तान टाइम्स, द हिंदू और दैनिक भास्कर ने अपनी वेबसाइटों को ओपनएआई के वेब क्रॉलर से बचाने के उपाय अपना लिए हैं।
Also read: उपयुक्त एवं सक्षम बोर्ड का गठन होगा चुनौतीपूर्ण
जेनरेटिव एआई में ओपनएआई, गूगल, मेटा, एंथ्रोपिक और अन्य प्रमुख हैं। उनके लिए यह अच्छी खबर नहीं है कि वेबसाइट प्रकाशक और लेखक अपनी सामग्री तक उनकी पहुंच को रोक रहे हैं। अगर उनकी पहुंच निरंतर अच्छी सामग्री तक नहीं हो पाएगी तो अरबों डॉलर की राशि लगाकर विकसित किए गए उनके ये सॉफ्टवेयर निरंतर परिष्कृत नहीं हो पाएंगे और गलतियां करने लगेंगे।
बड़ी एआई कंपनियों के पास शायद तकनीकी रूप से चतुराई भरे तरीके हों और उनकी मदद से वे इन वेबसाइटों के बचाव के तरीकों की काट निकाल लें। बहरहाल, ऐसा करने से कानूनी रूप से उनकी स्थिति कमजोर होगी। प्रमुख लेखकों, बड़े वेब प्रकाशकों और अन्य सामग्री तैयार करने वालों को भुगतान करना भी एक विकल्प है। सवाल यह है कि क्या वे अपनी जरूरत की सारी सामग्री के लिए भुगतान कर सकेंगे। जेनरेटिव एआई मॉडल को बहुत अधिक सामग्री की आवश्यकता है और नित नई सामग्री की उनकी आवश्यकता की पूर्ति आसानी से नहीं हो सकती है।
एआई कंपनियों ने मॉडलों को प्रशिक्षित करने के लिए ‘सिंथेटिक’ डेटा के विचार के साथ खिलवाड़ किया था। सिंथेटिक डेटा का निर्माण मशीनों द्वारा किया जाता है। वे यह डेटा बनाते हुए इंसानों द्वारा बनाए जाने वाले डेटा का अनुकरण करती हैं। दुर्भाग्य की बात है कि इससे उन्हें वांछित नतीजे नहीं हासिल हुए।
इस बात की पूरी संभावना है कि जेनरेटिव एआई क्षेत्र की बड़ी कंपनियां आगे चलकर प्रमुख प्रकाशकों और लेखकों, चित्रकारों और छायाकारों को भुगतान करने के लिए तैयार हो जाएंगी ताकि नई सामग्री तक उनकी पहुंच बनी रह सके। भले ही वे अपनी इच्छा से ऐसा न करें लेकिन उन्हें संभवत: नए कानूनों के साथ-साथ मौजूदा मुकदमों में अदालती फैसलों के संयोजन की मदद से नियंत्रित करने की आवश्यकता होगी। छोटे, स्वतंत्र कंटेंट तैयार करने वालों को बहुत अधिक कुछ हासिल होने की उम्मीद नहीं है।
Also read: लोकतंत्र, एक राष्ट्र-एक चुनाव और सरकार
कई देशों ने ऐसे मसौदा कानून और नियमन बनाने भी शुरू कर दिए हैं ताकि वे जेनरेटिव एआई की वजह से बदले हुए हालात और उत्पन्न हुए मुद्दों से निपट सकें। यूरोप तेजी से आगे बढ़ा है और साथ ही चीन भी। अन्य देश भी उन बारीकियों से निपटने के तरीके तलाश कर रहे हैं जिन्हें कानून के जरिये हल करने की आवश्यकता है।
दूसरी ओर भारतीय नीति निर्माता बहुत सुस्त रहे हैं। डिजिटल पर्सनल डेटा संरक्षण अधिनियम, 2023 जेनरेटिव एआई के कारण उत्पन्न चुनौती को हल करने में सक्षम नहीं है। डिजिटल इंडिया ऐक्ट पर काम चल रहा है लेकिन अभी यह स्पष्ट नहीं है कि इसमें क्या होगा और इसके दायरे में क्या-क्या आएगा। भारतीय नीति निर्माताओं को यह समझने की आवश्यकता है कि हम दुनिया के किसी भी अन्य देश की तुलना में अधिक डिजिटल डेटा उत्पन्न करते हैं।
इस क्षेत्र में हमसे आगे केवल चीन है। इससे समझा जा सकता है कि यह जेनरेटिव एआई मॉडल के लिए कितना उपयोगी है। यही वजह है कि देश में उत्पन्न होने वाले डेटा और अन्य सामग्री के लिए नियमन और नियमों का स्पष्ट होना आवश्यक है। ऐसा इसलिए कि इनका इस्तेमाल जेनरेटिव एआई मॉडल को प्रशिक्षित करने के लिए किया जा सकता है।
(लेखक बिज़नेस टुडे और बिज़नेस वर्ल्ड के पूर्व संपादक और संपादकीय परामर्श संस्था प्रोजैक व्यू के संस्थापक हैं)