टेक-ऑटो

AI Database: धार्मिक किताबों-बोलियों से सीखेगा एआईकोश

एआई मॉडल और लार्ज लैंग्वेज मॉडल के लिए धार्मिक और सांस्कृतिक सामग्री का उपयोग, स्थानीय भाषाओं में भी प्रसार

Published by
आशीष आर्यन   
Last Updated- April 14, 2025 | 10:43 PM IST

सरकार धार्मिक किताबों और वेद-पुराणों की सामग्री, लेख और तस्वीरों आदि की सहायता से एआईकोश डेटाबेस को मजबूत बनाने की योजना पर काम कर रही है। सूत्रों के मुताबिक यह तैयारी हिंदी, अंग्रेजी, तमिल, तेलुगू, कन्नड़, उर्दू समेत तमाम भाषाओं को लेकर की जा रही है।

एक वरिष्ठ सरकारी अधिकारी ने बिज़नेस स्टैंडर्ड को बताया कि स्थानीय बोलियों में लिखित-वर्णित धार्मिक सामग्री और मौखिक प्रसार वाली प्रेरक कहानियों को भी इसमें शामिल किया जाएगा। अधिकारी ने कहा, ‘इन किताबों में हजारों वर्षों की बुद्धिमता और अनुभव समाहित है। ऐसे में ये न केवल सटीक जानकारी का अहम स्रोत हैं बल्कि सभी तरह के एआई मॉडल को लेकर भी महत्त्वपूर्ण हैं। एलएलएम यानी लार्ज लैंग्वेज मॉडल जिन्हें कंपनियां इंडिया एआई मिशन के तहत विकसित करेंगी, में इनका इस्तेमाल किया जा सकता है।’

सूचना एवं प्रौद्योगिकी मंत्रालय ने 6 मार्च को एआईकोश नामक घरेलू डेटा सेट प्रस्तुत किया है जिसमें व्यक्तिगत डेटा के अलावा अन्य डेटा रखा जाएगा। इसका इस्तेमाल एआई मॉडल, ऐप्लीकेशंस, एलएलएम, स्माल लैंग्वेज मॉडल, लार्ज रीजनिंग मॉडल आदि में किया जा सकता है।

आईटी मंत्रालय ने कंपनियों और स्टार्टअप को स्वेच्छा से अपना गैर व्यक्तिगत डेटा साझा करने को कहा है ताकि इन एआई मॉडल को प्रशिक्षण दिया जा सके और बेहतर बनाया जा सके। इसके अलावा उसने लोक सभा सचिवालय के साथ एक समझौता ज्ञापन पर भी हस्ताक्षर किए हैं। इसके तहत संसद के व्यापक प्रश्नोत्तर भंडार, बीते सालों में सरकारों द्वारा प्रस्तुत रिपोर्ट, मंत्रालयों के एजेंडे की फाइलों और समितियों की बैठकों का उपयोग किया जा सकेगा।

नौ अप्रैल तक एआईकोश के प्लेटफॉर्म पर करीब 350 डेटासेट हैं और करीब 150 एआई मॉडल्स विकसित और पंजीकृत किए गए हैं जिनमें एलएलएम और एसएलएम दोनों शामिल हैं। विभिन्न मंत्रालयों के पास मौजूद डेटासेट का भी इस्तेमाल किया जा सकता है। एक अन्य अधिकारी ने कहा, ‘इनमें से अधिकांश डेटासेट ओपन गवर्नेंस डेटा प्लेटफॉर्म पर उपलब्ध हैं लेकिन हम इस संभावना पर काम रहे हैं कि कौन से अन्य गैर व्यक्तिगत तथा गोपनीय डेटा जुटाए जा सकते हैं।’

भारत का डेटासेट प्लेटफॉर्म 10,372 करोड़ रुपये के इंडिया एआई मिशन के सात स्तंभों में से एक है और इसका इरादा एआई ऐप्लीकेशंस, एलएलएम, एसएलएम और एआई टूल आदि के निर्माण के लिए गैर व्यक्तिगत डेटा तक पहुंच सुनिश्चित कराने का है। 2025-26 के बजट में सरकार ने इस योजना के लिए 200 करोड़ रुपये की राशि आवंटित की है। एक अधिकारी ने कहा कि एआईकोश प्लेटफॉर्म पर प्रस्तुत डेटासेट सरकार और निजी क्षेत्र के मुद्रीकरण के लिए उपलब्ध रहेंगे। उन्होंने यह भी कहा कि मंत्रालय ने यह बात संसद में भी स्पष्ट कर दी है।

First Published : April 14, 2025 | 10:43 PM IST