इंडियाएआई मिशन के तहत चुनी गई एआई स्टार्टअप में से एक ज्ञानी डॉट एआई अगले सप्ताह इंडिया एआई इम्पैक्ट समिट में अपना वॉयस फाउंडेशन मॉडल पेश करेगी। कंपनी के सह-संस्थापक और मुख्य टेक्नॉलजी ऑफिसर अनंत नागराज ने यह जानकारी दी।
यह मॉडल 14 अरब पैरामीटर वॉयस एआई फाउंडेशन मॉडल पर बना है जो मल्टीलिंगुअल, रियल-टाइम स्पीच प्रोसेसिंग को एडवांस्ड रीजनिंग क्षमताओं के साथ डिलिवर करता है। मॉडल को लो-लेटेंसी, स्पीच-टू-स्पीच कम्युनिकेशन के लिए डिजाइन किया गया है और यह वास्तव में ग्राहक सहायता, शिक्षा, पहुंच और पब्लिक-फेसिंग सिस्टम से संबंधित इस्तेमाल के लिए है।
नागराज ने कहा, ‘हम छह भाषाओं में अपना वॉयस टू वॉयस फाउंडेशन मॉडल लॉन्च कर रहे हैं और अगले 18 महीनों में इसे सभी 22 भाषाओं तक इसका विस्तार करने का लक्ष्य रखा है।’ छह भाषाएँ हैं अंग्रेजी, हिंदी, कन्नड़, तेलुगु, तमिल और गुजराती।
ज्ञानी एक मल्टीलिंगुअल टेक्स्ट-टू-स्पीच मॉडल भी लॉन्च करेगी जिसमें किसी का भी हाइपर-रियलिस्टिक तरीके से वॉयस क्लोन करने की क्षमता है। वचना एसटीटी नाम से इसे 1,056 से अधिक रियल-वर्ल्ड डोमेन में फैले 10 लाख से अधिक घंटे के रियल-वर्ल्ड वॉयस डेटा के साथ प्रशिक्षित किया गया है।
इन्फोसिस के चेयरमैन नंदन नीलेकणि के अनुसार वॉयस एआई से भारत में सही तरीके से डिजिटल समानता लाने और अगला बड़ा बदलाव आने की उम्मीद है। उन्होंने पिछले महीने कहा, ‘जिस तरह यूपीआई ने सभी के लिए डिजिटल पेमेंट को आसान बना दिया, उसी तरह वॉयस-आधारित इंटरफेस कृषि, शिक्षा और अन्य क्षेत्रों में हर नागरिक के लिए अवसरों में बाधाओं को दूर कर सकते हैं। साक्षरता अब कोई बाधा नहीं रहेगी।’
सर्वम एआई भी उसी समय अपना सॉवरिन एआई मॉडल लेकर आने की उम्मीद कर रही है। कंपनी के सह-संस्थापक विवेक राघवन ने नवंबर में अपनी योजना की जानकारी दी थी। सर्वम और ज्ञानी के अलावा, सोकेट भी देश की भाषाई विविधता के लिए अनुकूल भारत का पहला ओपन-सोर्स 120 अरब पैरामीटर वाला फाउंडेशन मॉडल विकसित करेगा।