सांख्यिकी एवं कार्यक्रम कार्यान्वयन मंत्रालय (एमओएसपीआई) अपनी तरह का पहला साझा डेटा मंच (सीडीपी) बनाने की योजना बना रहा है। इसके साथ ही वह आधिकारिक आंकड़ों के लिए एक समर्पित एआई चालित लार्ज लैंग्वेंज मॉडल (एलएलएम) बनाने की योजना बना रहा है जिसमें विभिन्न मंत्रालयों और राष्ट्रीय लेखा प्रभाग से लगभग 300 आधिकारिक डेटासेट को एकीकृत कर एक विश्वसनीय प्लेटफॉर्म में लाया जाएगा।
इस योजना का स्वागत किया जाना चाहिए क्योंकि यह भारत के मूल सांख्यिकीय आंकड़ों तक एकीकृत डिजिटल छतरी के तहत पहुंच को बेहतर बनाएगी।
यह प्लेटफॉर्म बिखरे हुए पीडीएफ और अन्य स्प्रेडशीट की जगह एआई-सक्षम बहुभाषी और तलाश किए जाने योग्य डेटा उपलब्ध कराएगा। इससे नीति-निर्माताओं, शोधकर्ताओं और व्यवसायों को लाभ होगा। यह पहल हालिया सुधारों जैसे एमओएसपीआई के एआई पठनीय ईसांख्यिकी पोर्टल और प्रशासनिक डेटासेट्स को सामंजस्यपूर्ण बनाने की रूपरेखा के लिए पूरक का काम करती है।
एक सामंजस्यपूर्ण डेटा पारिस्थितिकी तंत्र विभागीय रूप से अलग-अलग मौजूद जानकारी को जोड़ सकता है जिससे इंटरऑपरेबिलिटी (विभिन्न प्रणालियों का मिलकर काम करना) सक्षम होगी, डेटा खोज में सुधार होगा और उन्नत विश्लेषण को मदद मिलेगी।
इससे भी ज्यादा महत्त्वपूर्ण यह है कि यह सरकारों को कार्यक्रमों की वास्तविक समय में निगरानी, कार्यान्वयन की खामियों की पहचान, दोहराव को कम करने और जुड़े हुए प्रशासनिक डेटासेट्स से अधिक विश्वसनीय अंतर्दृष्टि उत्पन्न करने की सुविधा देकर साक्ष्य आधारित और नागरिक केंद्रित नीति निर्माण को मजबूत कर सकता है।
आसानी से उपलब्ध डेटा व्यवसायों को भी विभिन्न रणनीतियों और निवेशों की योजना बनाने और उन्हें लागू करने में मदद करेगा। प्रस्तावित सीडीपी की संरचना उभरती अंतरराष्ट्रीय प्रथाओं का प्रतिबिंब है।
ब्रिटेन, नीदरलैंड, कनाडा, फिनलैंड और सिंगापुर जैसे देश एक समर्पित सांख्यिकीय भाषा मॉडल पर सत्यापित आधिकारिक डेटाबेस से जानकारी प्राप्त करने के लिए एलएलएम संयोजन का उपयोग कर रहे हैं। हालांकि प्रस्तावित एलएलएम की सफलता शामिल डेटा की गुणवत्ता पर निर्भर करेगी क्योंकि यह मौजूदा डेटासेट्स से जानकारी प्राप्त करता और संश्लेषित करता है।
यदि डेटासेट्स बिखरे हुए, असंगत या खराब ढंग से दस्तावेजीकृत रहते हैं तो एआई केवल मौजूदा कमियों की गति और पैमाना बढ़ा देगा। प्रशासनिक डेटा असंगत प्रारूपों में बनाए रखा जाते हैं। इन्हें अक्सर बिना सामान्य मेटाडेटा, मानकीकृत वर्गीकरण या विशिष्ट पहचानकर्ताओं के रखा जाता है जिससे विभागों के बीच अंतर-संचालनीयता सीमित हो जाती है।
इन तकनीकी खामियों को कुशल डेटा प्रबंधन पेशेवरों की कमी, असंगत वैचारिक परिभाषाओं और शासन एवं अनुपालन चिंताओं के कारण एजेंसियों के बीच डेटा साझा करने के प्रति संस्थागत सतर्क दृष्टिकोण और भी जटिल बना देता है।
सरकार का कार्यान्वयन खाका उचित ही स्वीकार करता है कि आर्टिफिशल इंटेलिजेंस (एआई) के उपयोग से पहले डेटा समन्वय सुनिश्चित करना आवश्यक है। इसलिए सबसे पहले डेटा की सफाई, उसका संरचनात्मक मानकीकरण तथा उसे एक केंद्रीकृत और विश्वसनीय भंडार में समेकित करने को प्राथमिकता दी जानी चाहिए।
यह भी अहम है कि सभी विभागों में डेटा रणनीति इकाइयों की स्थापना की जाए ताकि डेटा प्रबंधन की प्रक्रियाओं में बेहतर समन्वय, जवाबदेही और सतत निगरानी सुनिश्चित की जा सके।
साथ ही पूरे तंत्र में डेटा संग्रह और उपयोग की प्रक्रियाओं में एकरूपता लाने के लिए सरकार को औपचारिक निर्देशों के माध्यम से अनिवार्य मेटाडेटा मानक, एकीकृत वर्गीकरण प्रणाली और साझा पहचान संकेतकों को लागू करना होगा।
इस बदलाव को सफल बनाने के लिए डेटा प्रबंधन से जुड़े कर्मचारियों के क्षमता-विकास और प्रशिक्षण में निवेश भी अत्यंत महत्त्वपूर्ण होगा। इसके साथ ही भूमिका-आधारित पहुंच नियंत्रण, अंकेक्षण का क्रम और तकनीक के जरिये डेटा सुरक्षा के सिद्धांतों पर आधारित सुरक्षित डेटा-साझाकरण व्यवस्था को संस्थागत रूप दिया जाना चाहिए।
इससे डेटा के सुरक्षित आदान-प्रदान को बढ़ावा मिलेगा और विभिन्न संस्थाओं के बीच भरोसा भी मजबूत होगा। सीडीपी को केवल एक तकनीकी उन्नयन के रूप में नहीं बल्कि भारत की सांख्यिकीय शासन व्यवस्था में एक बुनियादी संरचनात्मक परिवर्तन के रूप में देखा जाना चाहिए।
मंत्रालय ने हाल के महीनों में विभिन्न डेटा श्रृंखलाओं को अद्यतन कर उन्हें अधिक विश्वसनीय और सुदृढ़ बनाया है जो सराहनीय है। यदि इस नई पहल को मजबूत संस्थागत ढांचे, निरंतर क्षमता निर्माण और प्रभावी रूप से लागू किए जा सकने वाले मानकों का समर्थन मिलता है तो यह भारत की बिखरी हुई सांख्यिकीय प्रणाली को एक एकीकृत, समझदार और आर्टिफिशल इंटेलिजेंस के लिए तैयार प्रणाली में बदलने की क्षमता रखती है।