बिजनेस स्टैंडर्ड - कठिन डगर को पार कर एलेक्सा ने बोली हिंदी
 Search  BS Hindi  Web   BS E-Paper|      Follow us on 
Business Standard
Wednesday, January 22, 2020 10:06 AM     English | हिंदी

होम

|

बाजार

|

कंपनियां

|

अर्थव्यवस्था

|

मुद्रा

|

विश्लेषण

|

निवेश

|

जिंस

|

क्षेत्रीय

|

विशेष

|

विविध

|

अर्थनामा

 
होम अर्थव्यवस्था खबर

कठिन डगर को पार कर एलेक्सा ने बोली हिंदी

विभु रंजन मिश्रा /  December 08, 2019

आप एलेक्सा से उसके अविष्कारक का नाम पूछिए। एक सेकंड में आपको इसका जवाब मिल जाएगा क्योंकि शायद एमेजॉन लैब में विकसित करने के बाद उसे सबसे पहले यही सिखाया गया होगा। अगर आप एलेक्सा से पूछेंगे कि उसे इतना स्मार्ट किसने बनाया कि वह पल भर में भाषाएं सीख लेती हैं तो आपको कृत्रिम मेधा (एआई), मशीन लर्निंग, डीप लर्निंग, नैचुरल लैंग्वेज प्रोसेसिंग, बिग डेटा जैसी कई नई तकनीकों का नाम सुनने को मिलेगा। 

हालांकि वह आपको शायद यह नहीं बता सकेगी कि इन विशेष शिक्षण विधियों से वह प्रतिदिन और स्मार्ट तथा सक्षम बनती जा रही है तथा इन तरीकों को विकसित करने करे लिए एक पूरी टीम पर्दे के पीछे बैठी काम कर रही है। इन प्रयासों के चलते एमेजॉन ने पिछले महीने घोषणा की कि अब एलेक्सा हिंदी भाषा को समझ बोल सकती है। 

एलेक्सा की हिंदी परियोजना के पीछे चेन्नई में पैदा हुए प्रेम नटराजन की मुख्य भूमिका है और बेंगलूरु स्थित एमेजॉन मुख्यालय की यात्रा के दौरान बिज़नेस स्टैंडर्ड ने उनसे मुलाकात की। वह लॉस एंजलिस में रहते हैं और एलेक्सा एआई के उपाध्यक्ष तथा एमेजॉन पर नैचुरल लैंग्वेज के प्रमुख के तौर पर कार्यरत हैं। 

बोस्टन के टफ्ट्स विश्वविद्यालय से मशीन लर्निंग में पीएचडी करने के बाद उन्होंने अमेरिका में शोध एवं विकास के क्षेत्र की कंपनियों में करीब दो दशक का समय बिताया। इसके अलावा उन्होंने ऑप्टिकल कैरेक्टर, हैंडराइटिंग रिकॉग्निशन, स्पीच रिकॉग्निशन और नैचुरल लैंग्वेज प्रोसेसिंग पर भी अध्ययन किया। वर्ष 2015 तक नटराजन एलेक्सा की प्रगति को बाहर से देख रहे थे। जून 2018 में वह एमेजॉन आए और वहां हिंदी भाषा संबंधी परियोजना पर काम शुरू किया। उनकी देखरेख में बेंगलूरु में वैज्ञानिकों, भाषा जानकारों और डेटा वैज्ञानिकों की शोध टीम बनाई गई। 

यह काम काफी जटिल था। नटराजन बताते हैं, 'हिंदी के साथ बहुत सी चुनौतियां है। पहली समस्या आंकड़ों की अनुप्लब्धता है। फिर, दूसरी वैश्विक भाषाओं के विपरीत, हिंदी में उच्चारण या लेखन का कोई मानकीकरण नहीं है।' आप 'प्यार' शब्द को लीजिए। 'दिल विल प्यार व्यार' फिल्म में इसे 'प्यार' कहा गया तो वहीं 'प्यार का पंचनामा' फिल्म में  अंग्रेजी में एक अतिरिक्त 'ए' जोड़ दिया गया। प्यार को अंग्रेजी में लिखने पर एक अतिरिक्त 'ए' लिखने से सर्च इंजन सही खोज नहीं कर पाते। इसी तरह, देवनागरी लिपि में लिखे गए किसी भी शब्द को अलग-अलग जगह भिन्न तरीके से बोला जाता है। उदाहरण के लिए, कुछ लोग नदी को दरिया बोलते हैं तो कुछ दरीया।

इसके अलावा, स्थानीय बोलियां और उच्चारण के चलते चीजें और मुस्किल हो जाती हैं। इस सबका अर्थ है कि उनकी टीम को हिंदी शब्दों के लिए अलग से प्रोसेसिंग प्रणाली विकसित करनी थी और शब्दों का मानकीकरण करना जरूरी था। भारतीय अंग्रेजी समेत दूसरी सभी भाषाओं के लिए एमेजॉन कैटेंटिंव टेक्स्ट टू स्पीच (टीटीएस) तकनीक का उपयोग करती है। इसका अर्थ है कि सभी शब्दों को एक शृंखला में तैयार कर लिया जाता है या उन्हें विभिन्न हिस्सों में बांटकर एक नई आवाज में जोड़ दिया जाता है। 

लेकिन हिंदी के लिए एलेक्सा ने 'न्यूरल टीटीएस' का उपयोग करने का निर्णय लिया जिसे मशील लर्निंग का सबसे जटिल मॉडल माना जाता है। न्यीरल टीटीएस में इनपुट टेक्स्ट से सीधे स्पीच तैयार की जाती है और आवाज को अधिक प्राकृतिक बनाने की कोशिश होती है। नटराजन की टीम की दूसरी बड़ी समस्या यह थी कि किसी भी नई फिल्म की रिलीज के बाद हिंदी के कुछ नए शब्द बाजार में आ जाते हैं। अगर कोई व्यक्ति एलेक्सा से कहता है कि पीकू फिल्म का गाना चलाए, तो एलेक्सा के लिए पीकू बिल्कुल नया शब्द है। अगर तकनीक में इस समस्या का समाधान न किया जाए तो इससे ग्राहक अनुभव बेकार हो जाएगा। नई समस्याएं नए उपाय लेकर आती हैं। नटराजन और उनकी टीम ने शब्दों के बजाए फोनेटिक को आधार बनाकर एक  नई तकनीक विकसित की। 

नटराजन कहते हैं, 'जब हम शब्दों या ध्वनियों का प्रयोग करते हैं तो खोज अनुमान की सटीकता कम हो जाती है क्योंकि यह अनावश्यक परिणाम भी दे सकती है। इसका अर्थ है कि आपको  सटीकता बढ़ाते हुए समस्या का समाधान करना होगा।' इसका यह भी अर्थ है कि मशीनों से सीखने को स्वचालित करना होगा क्योंकि इस तरह की समस्याओं का समाधान मानव स्तर पर करना काफी जटिल है। नटराजन की टीम ने सीखने की नई तकनीक विकसित करने के लिए डीप लर्निंग फ्रेमवर्क का सहारा लिया जिससे एलेक्सा की स्वयं सीखने की क्षमता में तेजी लाई जा सके। 

मशीन लर्निंग मुख्यत: इनपुट डेटा, स्पीच सिग्नल और ट्रांसस्क्रिप्शन पर निर्भर करता है। एल्गोरिद्म इससे सीखता है और एक मॉडल विकसित करता है। इसके बाद इन्फेरेंस सिग्नल इस मॉडल की सहायता से परिणाम देता है। इस मॉडल के तहत पहले से सीखे गए मॉडल के जरिये इनपुट देने का कोई तरीका नहीं है। वह कहते हैं, 'लेकिन डीप लर्निंग की सहायता से इसे दो तरीकों से सीखने के कारगर माध्यम में बदला जा सकता है। पहला, एक भाषा के दोबारा उपयोग हो सकने वाले संसाधन को दूसरी भाषा में बदलना। दूसरा, अधिक डेटा रखने वाले क्षेत्रों से जानकारी कम डेटा वाले क्षेत्रों में हस्तांतरित करना।'

सक्रिय लर्र्निंग में किसी विशेष योग्यता स्तर पर पहुंचने के लिए बहुत अधिक प्रशिक्षण संबंधी डेटा की आवश्यकता नहीं होती। नटराजन कहते हैं, 'हमने कुछ मामलों में देखा है कि प्रशिक्षण के डेटा को काफी कम किया जा सकता है।' यहां स्व-अध्ययन का भी विकल्प होता है और एलेक्सा ग्राहकों के व्यवहार से स्वयं ही सीखती है तथा इस बात की भी जांच करती है कि दी गई जानकारी सही है अथवा नहीं। उदाहरण के लिए, जब कोई बच्चा एलेक्सा से एबीसीडी गाना चलाने के लिए कहता है और उसे देख रहे माता-पिता आकर कहते हैं कि वह 'अल्फाबेट गाना' चलाने के लिए कह रहा है तो मशीन समझ जाती है कि दोनों एक ही बातें हैं। अगली बार जब बच्चा एबीसीडी गाना चलाने के लिए कहेगा तो वह इसे अल्फाबेट गाने की तरह देखेगी और सही गाना चलाएगी। नटराजन के अनुसार, हिंदी को लॉन्च करने से मिली सीख से शोध एवं विकास टीम को नवाचार के साथ आगे बढऩे में मदद मिलेगी। वह कहते हैं, 'हमने अंग्रेजी के लिए कभी भी फोनेटिक सर्च तकनीक विकसित नहीं की क्योंकि वहीं इतनी बड़ी कोई समस्या नहीं थी। लेकिन जब अब यह उपलब्ध है तो इससे दूसरे देशों के लिए गुणवत्ता सुधार में भी सहायता मिलेगी।'

Keyword: elexa, Hindi, AI, Big data, Machine Learning, Natural Language Processing, कृत्रिम मेधा, एआई, मशीन लर्निंग, डीप लर्निंग, नैचुरल लैंग्वेज प्रोसे,
Advertisements
  Cover from Earthquake & Floods. Buy Home Insurance
   Get seamless access to Business Standard & WSJ.com starting at just Rs. 49/- per month*
Display Name  Email-Id  
Post your comment

CAPTCHA Image Reload Image Enter Code*:
  आपका मत
 क्या दूरसंचार कंपनियों को मिलनी चाहिए भुगतान से राहत?
हां नहीं  
पढ़िये
ईमेल
About us Authors Partner with us Jobs@BS Advertise with us Terms & Conditions Contact us RSS Site Map  
Business Standard Private Ltd. Copyright & Disclaimer feedback@business-standard.com
This site is best viewed with Internet Explorer 6.0 or higher; Firefox 2.0 or higher at a minimum screen resolution of 1024x768
* Stock quotes delayed by 10 minutes or more. All information provided is on "as is" basis and for information purposes only. Kindly consult your financial advisor or stock broker to verify the accuracy and recency of all the information prior to taking any investment decision. While due diligence is done and care taken prior to uploading the stock price data, neither Business Standard Private Limited, www.business-standard.com nor any independent service provider is/are liable for any information errors, incompleteness, or delays, or for any actions taken in reliance on information contained herein.