बुधवार, 27 सितंबर 2017

Speech Recognition System kya hota hai?

speech-recognition-technology
दोस्तों आप लोग google assistance, microsoft Cortana, Apple Siri के बारे में जरुर सुना होगा, लेकिन क्या आप जानते है की यह सभी टेक्नोलॉजी speech recognition system और Voice recognition system पर काम करता है. अब आप यह सोचते होंगे की यह Voice/ speech recognition system होता क्या है और यह कैसे काम करता है.आज हम आप लोगो को इसी के बारे में बताने वाले है, कि यह टेक्नोलॉजी काम कैसे करती है और इसका इतिहास क्या है.

Voice / Speech Recognition System kya hai?


यह एक कंप्यूटर सॉफ्टवेर और हार्डवेयर का मिक्स रूप है जिसमे मानव के आवाज़ को समझाने और उसके हिसाब से उसका जवाब देने की काबिलियत होती है.
इस टेक्नोलॉजी का इस्तेमाल करने पर आपको अपने मोबाइल या कंप्यूटर को ऑपरेट करने के लिए किसी भी माउस या कीबोर्ड की जरुरत नहीं पड़ती है. आप केवल अपने आवाज़ के द्वारा की मोबाइल या कंप्यूटर को कमांड दे सकते है. यदि आपको कोई अप्प को ओपन करना हो तो आप उसे voice कमांड के जरिये ओपन भी कर सकते है जैसे यदि आप को फेसबुक को ओपन करना हो तो आप उसे open facebook कहेंगे तो वह फेसबुक अप्प को ओपन कर देगा.

History Of Voice Recognition Technology in Hindi

1952 में bell laboratory में audery नाम के एक वैज्ञानिक ने voice/ speech recognition सिस्टम को बनाया लेकिन यह सिर्फ अंको पर ही काम करता था.
1962 में shoebox नाम के कंपनी ने इसे redevelop किया, और अब यह इंग्लिश के कुछ शब्दों को भी समझाने लगा. कम्पनी ने पुन: इसे विकसित किया जिससे यह इंग्लिश के 9 consonant और Vowel को समझने की काबिलियत आ गई.
1971 में U. S Defense department ने जब यह देखा तो उसने Speech Recognition Technology पर अपना एक रिसर्च प्रोग्राम शुरू किया. Carnegie Mellon ने Harpy नाम के एक सॉफ्टवेर को डेवेलोप किया जो 1011 वर्ड को बहुत ही आसानी से समझ सकता था. उन्होंने एक ऐसा सिस्टम भी खोजा जो लॉजिकल sentence को बड़ी ही आसानी से समझ सकता था. लेकिन इनकी सबसे बडी खामी यह थी की यह सभी एक speech pattern पर करते थे.
1980 के दशक में markov model नाम का एक Speech Recognition System बने गया, जो साउंड को समझाने के लिए डिजिटल डाटा का उपयोग करता था. और 1987 में इसी टेक्नोलॉजी की मदद से Julie नामक doll बनाया गया, जो बच्चो से बात भी करती थी, लेकिन इसमे यह खामी थी की एक शब्द को बोलने के बाद कुछ ब्रेक लेना पडता था.
1990 के दशक में dragon नाम की एक कंपनी ने Dragon Dictate नाम का एक सॉफ्टवेयर बनाया, यह दुनिया का पहला Voice / Speech Recognition Software था जिसे आम आदमी भी इस्तेमाल कर सकता था. 1997 में कम्पनी ने इसमे और भी सुधार किये और इसका नाम Dragon Naturally Speaking रखा यह 100 शब्दों को समझ सकता था.
2000 के दशक में गूगल ने iPhone के लिए Google Voice Search Application बनाया जो मानव के द्वारा बोली गई बातो का जवाब डाटा सेन्टरमें स्टोर डाटा से मैच करके देता था. 2010 में google ने एंड्राइड के लिए Personalized Recognition application बनाया, और इसके जरिये voice queries को रिकॉर्ड करना शुरू कर दिया.और उसने लगभग 230 बिलियन वर्ड का एक डेटाबेस तैयार कर कर लिया है. और Google Assistant नाम से अपने सॉफ्टवेर को लांच भी कर चूका है.जिसे आप लोग अपने android mobile में इस्तेमाल भी करते होंगे.
google को देख कर Apple में भी बिना देरी किये पर्सनल assistant को डेवेलोप किया जिसका नाम siri है. इन दोनों कम्पनी की कामयाबी को देखते हुए microsoft ने भी एक सॉफ्टवेर डेवेलोप किया जिसका नाम cortana है.

Voice / Speech Recognition System kaam kaise karta hai?

आप सब लोग तो यह जानते ही होंगे की जब हम लोग कुछ बोलते है तो एक वेव उत्पन्न होता है. मोबाइल या कंप्यूटर उन वेव्स को ADC ट्रांसलेटर के द्वारा डिजिटल सिग्नल में कन्वर्ट कर देता है.
ADC ट्रांसलेटर कंप्यूटर या मोबाइल में आये हुए एनालॉग सिग्नल को छोटे छोटे सैंपल में विभाजित कर देता है. और उन्हें डिजिटल फॉर्मेट में कन्वर्ट कर देता है. उसके बाद उन साउंड से नॉइज़ को फ़िल्टर करके उस नॉइज़ को रिमूव करता है.इसके बाद उन साउंड को नार्मल करके कांस्टेंट लेवल तक ले जाता है. क्योकि हर ब्यक्ति के बोलने का तरीका अलग अलग होता है.
इसके बाद इन साउंड को छोटे छोटे हिस्से जैसे सेकंड के हजारवें हिस्से में बिभाजित किया जाता है. और अंत में इन छोटे छोटे हिस्सों को सिस्टम में स्टोर डिजिटल सिग्नल के साथ मैच किया जाता है. जैसे की यदि आप ने बोला GO, तो यह सिस्टम इसे सारे प्रोसेस करने के बाद मेमोरी में स्टोर डाटा से मैच कराएगी की तो G सिग्नल G के साथ मैच होगा, और O सिग्नल O के साथ मैच होगा. और हमारा कंप्यूटर तुरंत हमें इसका आउटपुट GO दिखा देता है.

Conclusion

अब अप यह जान गए होंगे की Voice/ Speech Recognition System kya hota hai? yah kaise kaam karta hai? aur iska itihas kya hai?  मुझे उम्मीद है की मेरा यह पोस्ट आप लोगोको जरुर पसंद आया होगा. यह पोस्ट कैसा लगा हमें कमेन्ट बॉक्स के जरिये जरुर बताये.

1 टिप्पणी: