वॉयस रिकॉग्निशन मॉड्यूल: कार्य प्रक्रिया और अनुप्रयोग

समस्याओं को खत्म करने के लिए हमारे साधन का प्रयास करें





प्रौद्योगिकी में उन्नति ने एक बुद्धिमान मानव-मशीन इंटरफ़ेस तकनीक विकसित की है जो कंप्यूटर या मशीनों या रोबोटों को किसी भी इनपुट सिस्टम, जैसे कि कीबोर्ड या माउस का उपयोग किए बिना मानव की आवाज आज्ञाओं को संचालित करने की सुविधा प्रदान करती है। यह मानव-मशीन इंटरफ़ेस (HMI) का उपयोग करके प्राप्त किया जा सकता है आवाज़ पहचान मॉड्यूल। इस लेख में, हम उनके काम करने की प्रक्रिया और अनुप्रयोगों के साथ आवाज पहचान मॉड्यूल पर चर्चा करेंगे।

आवाज मॉड्यूल

आवाज मॉड्यूल



आवाज की पहचान मॉड्यूल

वॉयस रिकग्निशन एक ऐसी तकनीक है जो एक प्राकृतिक और सुविधाजनक सुविधा प्रदान करती है मानव मशीन इंटरफेस आवाज पहचान मॉड्यूल का उपयोग करना। यह mic के माध्यम से मशीन या कंप्यूटर पर वितरित मानव की आवाज सुविधाओं को निकालता है और उनका विश्लेषण करता है। वॉइस रिकग्निशन तकनीक को विभिन्न प्रकारों के आधार पर कई प्रकारों में वर्गीकृत किया जाता है जैसे कि उपयोगकर्ताओं के कार्यक्षेत्र, मान्यता के लिए उपयोग किए जाने वाले कई शब्द, बोलने की स्वाभाविकता। यदि आवाज पहचान स्तर 95% से अधिक है, तो केवल आवाज मान्यता व्यावहारिक रूप से उपयोग की जाती है।


वॉयस रिकॉग्निशन मॉड्यूल के कार्य सिद्धांत

HM2007 एक सिंगल-चिप है सीएमओएस आवाज पहचान मॉड्यूल। यह वॉयस एनालिसिस, स्पीच रिकग्निशन और वॉयस रिकग्निशन सिस्टम कंट्रोल प्रोसेस के साथ ऑन-चिप एनालॉग फ्रंट एंड लार्ज-स्केल इंटीग्रेटेड सर्किट है। HM2007 को दो मोड में संचालित किया जा सकता है: मैनुअल मोड और सीपीयू कंट्रोल मोड।



HM2007

HM2007 पिन डायग्राम

ऑपरेशन के मैनुअल मोड में, वॉइस रिकग्निशन मॉड्यूल HM2007 का उपयोग कीपैड, 8Kbyte मेमोरी के SRAM और अन्य कंपोनेंट जैसे घटकों को जोड़कर एक साधारण मान्यता प्रणाली के निर्माण के लिए किया जाता है। यदि बिजली चालू है, तो HM2007 एक इनिशियलाइज़ेशन प्रक्रिया शुरू करता है और, अगर WAIT पिन L है, तो HM2007 बाह्य मेमोरी की जाँच करता है: 8Kbyte SRAM - यह सही है या नहीं। लेकिन, अगर WAIT H है, तो HM2007 द्वारा मेमोरी जांच प्रक्रिया को छोड़ दिया जाएगा। इस प्रारंभिक प्रक्रिया के बाद, HM2007 मान्यता मोड में चला जाता है। मान्यता मोड में, अगर WAIT पिन H है, तो HM2007 आवाज को स्वीकार करने के लिए तैयार है और मान्यता प्रक्रिया शुरू करता है। यदि WAIT पिन L है, तो HM2007 उस आवाज को स्वीकार नहीं करता है जिसे पहचाना जाना है। फिर प्रशिक्षण पैटर्न को साफ़ करके नए पैटर्न का प्रशिक्षण फ़ंक्शन कुंजियों का उपयोग करके किए गए दो ऑपरेशन हैं: TRN और CLR। HM2007 में सभी पैटर्न नंबर कुंजी 99 दर्ज करके और CLR दबाकर साफ किया जा सकता है।

सीपीयू नियंत्रण मोड में, कई कार्य जैसे कि RECOG, TRAIN, RESULT, UPLOAD, DOWNLOAD, आवाज पहचान मॉड्यूल HM2007 के कार्य इस मोड में प्रदान किए जाते हैं। ऑपरेशन के एक मैनुअल मोड के समान, इस मोड में भी पावर, मान्यता, प्रशिक्षण, जिसके परिणामस्वरूप, अपलोडिंग, डाउनलोडिंग और रीसेट ऑपरेशन विभिन्न मानदंडों के आधार पर किए जाते हैं।

वॉयस रिकॉग्निशन मॉड्यूल के अनुप्रयोग

आवाज नियंत्रित रोबोट वाहन

आवाज नियंत्रित रोबोट वाहन परियोजना किट

आवाज नियंत्रित रोबोट वाहन परियोजना किट

एक लंबी दूरी की वाक्-पहचान प्रणाली के साथ एक आवाज नियंत्रित रोबोट वाहन को रोबोट मशीन के रिमोट संचालन के लिए एक मानव-मशीन इंटरफेस और वॉयस कमांड का उपयोग करके नियंत्रित करने के लिए डिज़ाइन किया गया है। एक 8051 माइक्रोकंट्रोलर वांछित संचालन को प्राप्त करने के लिए एक आवाज पहचान मॉड्यूल या भाषण मान्यता मॉड्यूल के साथ प्रयोग किया जाता है। वॉयस कमांड या पुश बटन का उपयोग करके रोबोट वाहन के आंदोलन की दिशा को नियंत्रित किया जा सकता है। आवाज कमांड आरएफ द्वारा प्रेषित अंत से प्राप्त अंत तक भेजे जाते हैं। इस प्रकार, रोबोट वाहन रिसीवर द्वारा प्राप्त आदेशों के आधार पर आगे, पीछे, बाएं या दाएं दिशा में चलता है।


आवाज के ट्रांसमीटर ब्लॉक डायग्राम नियंत्रित रोबोट वाहन

आवाज के ट्रांसमीटर ब्लॉक डायग्राम नियंत्रित रोबोट वाहन

का यह आंदोलन रोबोट वाहन एक विशिष्ट दिशा में दो मोटर्स का उपयोग करके नियंत्रित किया जा सकता है जो 8051 श्रृंखला के माइक्रोकंट्रोलर के साथ हस्तक्षेप किए जाते हैं। आरएफ ट्रांसमीटर रोबोट वाहन से स्वीकार्य रेंज (200 मीटर तक) के लाभ के लिए एक स्विच प्रेस या वॉइस कमांड द्वारा कमांड को धर्मान्तरित डिजिटल डेटा में परिवर्तित किया जाता है। रिसीवर सर्किट में प्राप्त एन्कोडेड डेटा को वॉयस कमांड के डिकोड किए गए डेटा का उपयोग करके मोटरों की दिशा और गति को नियंत्रित करने के लिए मोटर चालक आईसी का उपयोग करके डीसी मोटर्स को चलाने के लिए दूसरे माइक्रोकंट्रोलर को भेजा जा रहा है।

वॉइस कंट्रोवर्शेड रोबोट वाहन के रिसीवर ब्लॉक डायग्राम

वॉइस कंट्रोवर्शेड रोबोट वाहन के रिसीवर ब्लॉक डायग्राम

यह आवाज नियंत्रित रोबोट वाहन लंबी दूरी की भाषण मान्यता परियोजनाओं के साथ एकीकृत किया जा सकता है DTMF तकनीक यह एक सेल फोन का उपयोग करके रोबोट वाहन के नियंत्रण की सुविधा प्रदान करता है। यह DTMF तकनीक RF तकनीक की तुलना में बहुत लंबी दूरी का संचार प्रदान करती है - इस प्रकार रोबोट वाहनों को बहुत दूर से नियंत्रित किया जा सकता है।

वॉयस रिकॉर्डिंग और प्लेबैक सर्किट

एपीआर 9301 आईसी

एपीआर 9301 आईसी

एपीआर 9301 आईसी

APR 9301 IC में 28 पिन और नॉनवॉलेटाइल फ्लैश मेमोरी होती है। यह लगभग 100 वर्षों के लिए 100K चक्र और मेमोरी भंडारण की रिकॉर्डिंग की सुविधा प्रदान करता है। एपीआर 9301 एकीकृत सर्किट के सामान्य कामकाजी संचालन के लिए केवल कम वोल्टेज 5V और 25mA वर्तमान की आवश्यकता होती है।

वॉयस रिकॉर्डिंग और प्लेबैक सर्किट का कार्य

APR 9301 IC प्रदर्शन करता है आवाज की रिकॉर्डिंग और प्लेबैक संचालन। रिकॉर्डिंग ऑपरेशन एक एकीकृत सर्किट के 17 और 18 पिन से जुड़े अच्छी गुणवत्ता (किसी भी प्रकार) कंडेनसर माइक का उपयोग करके ध्वनि संकेत प्राप्त करके किया जा सकता है। यदि हम स्विच एस 1 को बंद करते हैं, तो रिकॉर्डिंग मोड को आसानी से 20-30 सेकंड के लिए एक आवाज संदेश रिकॉर्ड करने के लिए शुरू किया जा सकता है। एपीआर 9301 आईसी के 25 पिन से जुड़े रिकॉर्डिंग एलईडी के संकेत के रूप में लंबे समय तक एल पिन 27 ग्राउंडेड है के रूप में झपकी लेंगे।

वॉयस रिकॉर्डिंग और प्लेबैक सर्किट

वॉयस रिकॉर्डिंग और प्लेबैक सर्किट

अंतिम मेमोरी के साथ 20 चक्र पूरा होने के बाद, रिकॉर्डिंग प्रक्रिया स्वचालित रूप से समाप्त हो जाती है एपीआर 9301 आईसी के पिन 6 और 7 से जुड़े एक रोकनेवाला आर 1 के मूल्य को बदलकर। 20 सेकंड, 24 सेकंड और 30 सेकंड की अधिकतम रिकॉर्डिंग समय क्रमशः रोकनेवाला R1 के मानों को 52K, 67K और 89K के रूप में बदलकर प्राप्त किया जा सकता है।

प्लेबैक मोड के दौरान इनपुट सेक्शन स्वचालित रूप से म्यूट हो जाता है। यदि स्विच S2 बंद है, तो रिकॉर्ड किए गए संदेशों की शुरुआत से स्पीकर से एक संदेश आएगा। यदि रिकॉर्डिंग या प्लेबैक फ़ंक्शन पूरा हो गया है, तो एपीआर 9301 आईसी एक स्टैंडबाय मोड में प्रवेश करेगा।

यह सर्किट एक आम पीसीबी पर जमा हो सकता है। APR 9301 IC बेस को सावधानी से ऐसे मिलाएं कि इंटीग्रेटेड सर्किट के पिन के बीच कोई शॉर्टिंग न हो। पीसीबी पर इसे इकट्ठा करने के बाद सर्किट की जांच करें, फिर आईसी को आईसी बेस में कनेक्ट करें। सर्किट को बिजली की आपूर्ति देने से पहले, पिन कनेक्शन की बारीकी से जांच करें। 5-वोल्ट रेगुलेटर IC- बेस्ड पॉवर सप्लाई का इस्तेमाल सर्किट को पॉवर सप्लाई देने के लिए किया जाता है। एक 2-इंच-8-ओम अच्छी गुणवत्ता वाले स्पीकर का उपयोग स्पष्ट ध्वनि प्राप्त करने के लिए किया जाता है। रिकॉर्डिंग स्विच एस 1 दबाकर किया जा सकता है। ध्वनि संकेतों (भाषण या संगीत) को माइक द्वारा उठाया जाता है और आईसी को पास किया जाता है, जिसमें मेमोरी सेल में ध्वनि संकेतों को संग्रहीत किया जाता है। यदि हम स्विच एस 2 को बंद करते हैं, तो प्लेबैक शुरू होता है और हम स्पीकर के माध्यम से रिकॉर्ड किए गए संदेश को सुन सकते हैं।

आवाज पहचान मॉड्यूल का उपयोग कई अनुप्रयोगों में किया जा सकता है जैसे कि पायलटों के वॉयस कमांड का उपयोग करके एयरक्राफ्ट सिस्टम को नियंत्रित करने के लिए, वॉयस-एक्टिवेटेड मल्टीप्रोसेसर का उपयोग करके मोटर चालित व्हील कार को नियंत्रित करने के लिए, और इसी तरह। यदि आप के बारे में जानने के लिए रुचि रखते हैं इलेक्ट्रिकल और इलेक्ट्रॉनिक्स प्रोजेक्ट आवाज पहचान मॉड्यूल के आधार पर, आप नीचे टिप्पणी अनुभाग में अपनी टिप्पणी पोस्ट करके हमसे संपर्क कर सकते हैं।

फ़ोटो क्रेडिट: