हाल ही में आई कुछ खोजपरक रिपोर्टों में कहा गया है कि चीन की डेटा एनालिटिक्स कंपनी शेन्हुआ डेटा इन्फॉर्मेशन टेक्नॉलजी ने करीब 10,000 भारतीय नागरिकों से जुड़े आंकड़े जुटाए हैं। इन लोगों में कई बड़ी हस्तियां भी शामिल हैं। सवाल है कि कोई कंपनी किस तरह ऐसे आंकड़े जुटाती है और उनका विश्लेषण करती है? सच तो यह है कि इनमें से बहुत सारा डेटा सार्वजनिक या अद्र्ध-सार्वजनिक होता है।आज का कोई भी व्यक्ति लगातार डेटा पैदा करता रहता है। सर्वोच्च न्यायालय ने 2017 में निजता को मौलिक अधिकार बताया था लेकिन भारत में निजी डेटा की निजता को सुरक्षा देने वाला कानून अब तक नहीं बना है। इस बारे में प्रस्तावित कानून में सरकार को अपनी मर्जी से हर तरह का डेटा जुटाने की खुली छूट दी गई है, लिहाजा इसके कानून बन जाने पर भी सरकारी निगरानी के खिलाफ नागरिकों को कोई सुरक्षा नहीं मिल पाएगी।अधिकतर लोगों ने सोशल मीडिया साइट पर अपनी प्रोफाइल बनाई हुई हैं। फेसबुक, इन्स्टाग्राम, व्हाट्सऐप, ट्विटर, टिकटॉक और यूट्यूब जैसे तमाम प्लेटफॉर्म पर लोगों के अकाउंट हैं। इसके अलावा लोगों की ईमेल आईडी भी होती हैं जिनमें से ज्यादातर गूगल की जीमेल पर हैं। लोग अपना ब्लॉग बनाते हैं या पेशेवर या निजी वेबसाइट भी बनाते हैं। कई लोगों ने लिंक्डइन और कुछ दूसरी पेशेवर साइट पर भी अकाउंट बना रखे हैं। कुछ लोग अपवर्क और वीवर्क रिमोटली जैसी गिग साइट से भी जुड़े हुए हैं। अकादमिक विशेषज्ञ अपने शोधपत्रों एवं उद्धरणों का जिक्र करते हैं और उनके विश्वविद्यालय से संबद्धता भी ऑनलाइन नजर आती है। ऐसा बहुत सारा डेटा कानूनी तरीके से और आसानी से जुटाया जा सकता है। ये डेटा संग्राहक (कलेक्टर) किसी के कामकाजी जीवन, आर्थिक स्थिति, शैक्षणिक पृष्ठभूमि, मनोरंजन संबंधी पसंद, दोस्तों, राजनीतिक रुझान और सामाजिक दृष्टिकोण जैसे तमाम पहलुओं के बारे में जानकारी जुटा सकते हैं।किसी व्यक्ति की किसी जगह पर मौजूदगी संबंधी जानकारी भी उपयोगी होती है। निजता संबंधी प्रस्तावित कानून में भी इसे निजी डेटा नहीं माना गया है। फूड डिलिवरी सेवा और टैक्सी कैब जैसे कई कारोबार स्थान संबंधी जानकारियों पर आधारित होते हैं।आपके फोन का एक विशिष्ट अंतरराष्टï्रीय मोबाइल उपकरण पहचान (आईएमईआई) नंबर होता है। दो सिम वाले फोन में दो आईएमईआई नंबर होते हैं। इस तरह किसी भी हैंडसेट को सिम के साथ ट्रैक किया जा सकता है। हरेक सिम का भी विशिष्ट नंबर होता है। आईएमईआई और सिम के नंबर क्लोन किए जा सकते हैं लेकिन वह न तो आम है और न ही कानूनी।अगर आपका फोन ऑन होते ही सबसे नजदीकी मोबाइल टावर से संपर्क स्थापित करता है। इस तरह आपके दूरसंचार सेवा प्रदाता को आपकी मौजूदगी वाले क्षेत्र के बारे में पता चल जाता है। अगर फोन में जीपीएस ऑन है तो आपकी वास्तविक लोकेशन भी पता चल जाती है। आरोग्य सेतु ऐप लोकेशन की जानकारी का ही इस्तेमाल करता है। ब्लूटुथ ऑन होने पर भी लोकेशन पता चल जाता है। ऐंड्रॉयड ऑपरेटिंग प्रणाली में वाई-फाई नेटवर्क तलाशने पर लोकेशन डेटा भी दर्ज हो जाता है। इसका मतलब है कि वाई-फाई ऑन रखने से हम अपनी लोकेशन भी बता देते हैं। शॉपिंग मॉल में लगे हार्डवेयर बीकॉन औररेडियो आवृत्ति पहचान (आरएफआईडी), मेट्रो पास एवं टॉल पर इस्तेमाल होने वाले स्मार्ट कार्ड से भी लोकेशन की जानकारी मिलती है। विज्ञापनों के सर्वर को भी विज्ञापन की जगह के बारे में पता होता है।इस डेटा को कई तरह से हासिल किया जा सकता है। ऐसे गुमनाम डेटा का बहुत बड़ा बाजार है। थोड़ी अतिरिक्त जानकारी की मदद से गुमनाम डेटा को अक्सर गुमनामी से बाहर निकाला जा सकता है और चिह्नित लोगों के साथ उसे संबद्ध किया जा सकता है। कई हैंडसेट में विनिर्माता द्वारा क्लॉउड बैकअप सेवा भी दी जाती है। वह क्लॉउड सर्वर लॉगिंग की जगह हो सकता है। उबर और जोमैटो जैसे कई ऐप लोकेशन मांगते हैं। अगर आप फोन सेटिंग्स में जाएं तो पता चलेगा कि कई ऐप लोकेशन डेटा का इस्तेमाल करते हैं। अगर लोकेशन डेटा को एक डिजिटल मानचित्र से जोड़ें और कुछ अन्य सूचनाएं भी मिल जाएं तो हम किसी फोन उपभोक्ता की 24 घंटे की गतिविधियों के बारे में बेहद सटीक अनुमान लगा सकते हैं। इसके अलावा लेनदेन संबंधी डेटा भी होता है। उम्मीद है कि क्रेडिट कार्ड एवं डेबिट कार्ड सेवाएं नेटबैंकिंग सेवाओं की तरह सुरक्षित हैं। लेकिन ई-कॉमर्स साइट पर खरीदारी करते समय आपके क्रेडिट एवं डेबिट कार्ड की जानकारियां भी दर्ज होती हैं और ये साइट उसे स्टोर कर लेती हैं। अगर डेटा कलेक्टर ने शॉपिंग ऐप तक पहुंच हासिल कर ली तो वह लेनदेन संबंधी जानकारियां भी ले सकता है।जब कृत्रिम मेधा (एआई) के जरिये उन सूचनाओं के अंबार में से पैटर्न तलाशा जाता है तो अचंभित करने वाली बातें होती हैं। डिजिटल मार्केटिंग के एक बड़े हिस्से में लक्ष्य तक पहुंचने के लिए ऐसे विशाल डेटा का इस्तेमाल होता है। नेटफ्लिक्स, यूट्यूब और एमेजॉन पर दर्शक को अगले वीडियो या फिल्म के बारे में सुझाव देने के लिए एल्गोरिद्म का इस्तेमाल होता है। गूगल आपके ईमेल और ऑनलाइन सर्च से मिले पैटर्न के हिसाब से विज्ञापन भी भेजता है।वर्ष 2012 में अमेरिकी खुदरा विक्रेता टारगेट ने एक बड़े विवाद को जन्म दिया था जब उसने एक उपभोक्ता को होने वाले बच्चे के जन्म का बधाई संदेश भेज दिया था। साइट ने ऑनलाइन सर्च और खरीदारी रुझान के आधार पर बच्चे के जन्म का अंदाजा लगाकर संदेश भेजा था। जबकि वह खरीदार एक नाबालिग लड़की थी और उसके मां-बाप को गर्भावस्था के बारे में कोई खबर नहीं थी।डेटा माइनिंग की सटीकता एवं दायरा दोनों ही अचंभित करता है। मान लीजिए कि आप तिरुवनंतपुरम में चिली बीफ फ्राई ऑर्डर करने के लिए क्रेडिट कार्ड का इस्तेमाल करते हैं। उस ऑर्डर की रसीद से यह भी पता चल सकता है कि आपने क्या और कहां खाया? जरा सोचें कि इस जानकारी के बाद गोरक्षा के लिए संवेदनशील इलाके में यात्रा करते समय आपकी हालत कैसी होगी?
