Representative image
सैन फ्रांसिस्को (अमेरिका) की रियल टाइम मशीन लर्निंग प्लेटफॉर्म टर्बोएमएल के संस्थापकों ने भारतीय भाषाओं पर आधारित AI Foundational models बनाने के लिए विश्व के सभी भारतीय मूल के Artificial Intelligence (एआई) शोधकर्ताओं को एक साथ लाने के लिए रणनीतिक पहल की है। कंपनी के संस्थापकों में से एक सिद्धार्थ भाटिया ने कहा है कि उन्होंने इलेक्ट्रॉनिकी एवं सूचना प्रौद्योगिकी मंत्रालय के साथ योजना पर चर्चा की है और हाल ही में उन्होंने केंद्रीय मंत्री अश्विनी वैष्णव के साथ मुलाकात भी की है। इस दौरान उन्होंने वैष्णव को 10 महीनों के भीतर 1.2 करोड़ डॉलर से भी कम लागत में भारतीय भाषाओं पर आधारित एआई मॉडल बनाने के अपने प्रयास के बारे में जानकारी दी है। परियोजना के लिए सिलिकन वैली के निवेशकों और अन्य वैश्विक निवेशकों से रकम मिलेगी।
भाटिया ने बताया कि वह चैटजीपीटी, एंथ्रोपिक क्लाउड, गूगल जेमिनी और मेटा लामा जैसे मॉडलों का नेतृत्व करने वाली टीमों से भारतीय विशेषज्ञों के साथ-साथ मूल ट्रांसफॉर्मर पेपर के योगदानकर्ताओं को साथ लाने वाले हैं। प्रस्तावित मॉडल एक लाभकारी इकाई होगी ताकि इससे भविष्य में फिर निवेश किया जा सके।
Also Read: भारत में सरकारी दक्षता विभाग कितना जरूरी
भाटिया ने कहा, ‘विस्तृत विश्लेषण के बाद हमने पाया कि इसके लिए 1.15 करोड़ डॉलर के निवेश की जरूरत होगी, जिसमें इसे दो चरणों में तैयार करने और ग्राफिक प्रोसेसिंग यूनिट (जीपीयू) की लागत शामिल होगी और इसके अलावा डेटासेट के प्रशिक्षण और लोगों की भर्तियों पर खर्च किया जाएगा। हम अधिकतर कार्य भारत में ही करेंगे और करीब 30 लोगों की मूल टीम के साथ इसे पूरा किया जाएगा। इसे पूरा होने में करीब 10 महीने का वक्त लगेगा।’ हालांकि, उन्होंने अपने प्रयासों में मदद के लिए सरकारी सहायता की संभावना से भी इनकार नहीं किया है।
भाटिया ने कहा कि निवेश लागत में जीपीयू के इस्तेमाल की मौजूदा वाणिज्यिक दर शामिल है। हालांकि इलेक्ट्रॉनिकी एवं सूचना प्रौद्योगिकी मंत्रालय की सब्सिडी योजना के तहत इसे घटाकर 1 डॉलर प्रति घंटा किया जा सकता है। उन्होंने कहा कि चीन में डीपसीक की पेशकश के साथ ही कई शोधकर्ता चैटजीपीटी और अन्य जैसे अरबों डॉलर में तैयार किए गए एआई मॉडल के विपरीत अब कम कीमत वाले एआई मॉडल तैयार करने के लिए नवोन्मेषी तरीके निकाल रहे हैं। उन्होंने कहा कि भारत में फाउंडेशनल मॉडल बनाने में सबसे बड़ी चुनौती भाषाई विविधता के साथ-साथ इंटरनेट स्केल डेटा की है।