शुक्रवार, 28 जुलाई 2017

OCR Handwriting Recognition kya hai?

OCR-Handwriting-Recognition
दोस्तों क्या आप जानते है की OCR (optical character recognition) Handwriting Recognition kya hota hai? कैसे हमारा कंप्यूटर हाथ से लिखे हुए अक्षरों को पहचान लेता है, और उन्हें एडिट करने योग्य फोर्मेट में बदल देता है जिससे हमें वह डॉक्यूमेंट टाइप नहीं करना पड़ता है. आज हम इसी के बारे में आप लोगो को बतायेगे की यह किस प्रकार से अक्षरों की पहचान करता है.
जब हम लोग किसी भी डॉक्यूमेंट को देखते है तो उसे बहुत ही आसानी से एक एक अक्षर को पद लेते है और यह जान जाते है की इसमे क्या लिखा है. लेकिन क्या आप ने कभी सोचा है की एक कंप्यूटर कैसे हाथ से लिखे हुए अक्षरों को पढ़ कर उन्हें एडिट करने वाले अक्षरों में बदल देता है.

Handwriting Recognition kya hai? ya OCR kya hai?

इसका पूरा नाम optical character recognition इसके द्वारा हाथ से लिखे हुए या pdf फाइल या प्रिंट किये हुए डॉक्यूमेंट को OCR software के द्वारा एडिट करने योग्य टेक्स्ट फोर्मेट में बदला जा सकता है.
इसके द्वारा जब आप अपने मोबाइल के स्क्रीन पर कुछ भी लिखते है तो यह बहुत ही आराम से लिखे हुए टेक्स्ट को पहचान लेता है. यह काफी पहले से इस्तेमाल हो रहे है लेकिन शुरुवात में यह इतने ज्यादा विकसित नहीं थे, जिससे यदि आप अपने मोबाइल में लिखते कुछ और यह लिख देता कुछ और ही था. लेकिन OCR software को धीरे धीरे और ज्यादा विकसित किया गया जिससे यह अब आपके द्वारा लिखे गए टेड़े मेढ़े शब्दों को भी अच्छी तरह से पहचान लेता है.
आज के समय में यह Handwriting Recognition इतना ज्यादा इम्प्रूव होचूका है की यदि आप अपने मोबाइल के स्क्रीन पर कुछ टेड़े मेढे भी लिख दे तो यह बड़ी ही आसानी से इसे समझ जाता है और उसे पहचान कर उस अक्षर को लिख देता है.


OCR Handwriting Recognition kaam kaise karta hai?

OCR का जो concept पहले इस्तेमाल होता था, उसमे सभी अक्षरों के लिए एक एक particular डिजाईन था, और उन अक्षरों को उन्ही design में लिखने पर वह पहचानता था.
हम सभी जानते है की कंप्यूटर हम लोगो के लैंग्वेज को नहीं जनता है यह केवल 0 और 1 के लैंग्वेज को ही जनता है. और हम यदि किसी लिखे हुए टेक्स्ट को स्कैन करे या किसी इमेज को स्कैन करे वह कंप्यूटर यह बात नहीं जानता है की यह टेक्स्ट है या इमेज.
Handwriting-Recognition
लेकिन यदि अक्षर एक पैटर्न में लिखे गए है तो यह उन पैटर्न को  ही पहचानते थे, और इसके बाद OCR software को थोडा और विकसित किया गया. ताकि वह सामान्यतः इस्तेमाल होने वाले फॉण्ट को भी समझ पाए.
लेकिन यदि कोई ब्यक्ति कोई डॉक्यूमेंट को हाथ से लिखता है तो वह उसे किसी भी तरह से लिख सकता है. तब OCR software को इस तरह से बनाया गया की किसी भी अक्षरों को कई टुकडो में तोड़ कर उसे पहचाने.
इसके बाद इसमे आर्टिफीसियल इंटेलिजेंट के द्वारा या यह कहे की smart learning के द्वारा इसमे यह डाला गया की इंग्लिश word में किस अक्षर के बाद कौन सा अक्षर grammar के हिसाब से सबसे ज्यादा इस्तेमाल किया जाता है. ताकि OCR software, handwriting को recognition कर सके.
यदि थोड़ी  बहुत गलती भी है तो उसे ठीक करते गए और artificial intelligence के मदद से इसे और ज्यादा इम्प्रूव करते गए.

OCR Handwriting Recognition ke anuprayog

पहले OCR बहुत से छोटे लेवल पर शुरू हुआ लेकिन आज के समय में यह काफी विस्तार कर चूका है. यदि आपके पास बहुत सारे documents है जिन्हें आपको arrange करना है तो बस आप उन्हें उठाइए और स्कैन करना शुरू कर दीजिये.  कंप्यूटर उसे समझ कर टेक्स्ट फोर्मेट में बदल देगा. फिर चाहे तो उसे शोर्टिंग कीजिये या उन्हें एडिट कर लीजिये.
OCR का उपयोग एग्जाम में भी होते है, जिसमे एक आंसर शीत दिया जाता है और उसमे ब्लाक बने रहते है जिसमे आपको ब्लैक इंक का इस्तेमाल करके अपने आंसर को fill करना होता है.
लेकिन आज के समय में यह बहुत ही कमान हो चूका है, आप जिस भी डॉक्यूमेंट को चाहे स्कैन करे फिर उसे एडिट करे या प्रिंट करे या उसे किसी अन्य फाइल में copy पेस्ट करे. यह आपके ऊपर निर्भर करता है.
लेकिन यह OCR या Handwriting Recognition बिलकुल आपके examiner की तरह से है. जिस प्रकार आप यदि एग्जाम में बहुत ज्यादा टेड़े मेढे लिख देते थे तो नंबर नहीं मिलता था. ठीक उसी प्रकार यदि आप बहुत ज्यादा टेड़े मेढे अक्षर लिख देंगे तो यह उन्हें नहीं पहचान पायेगा.

OCR software 

यदि हम बात करे google translate की तो इसके द्वारा आप किसी भी इमेज कैमरे से कैप्चर करे तो यह रियल टाइम में ही इमेज को ओवरलैप कर इसे translate करके दिखा देता है.
Free OCR software - GOCR, SimpleOCR, TopOCR, FreeOCR आदि।
Free Devanagari OCR Software-  tesseract

Conclusion

यह एक software ही है. और इसकी एक लिमिट है, जिसके बाहर यह नहीं जा सकता है. यह कोई इंसान नहीं है की अंदाजा लगा पायेगा की टेड़े मेढे शब्द में आप क्या लिखने की कोशिश किये है.
सभी लोगो की हैण्ड राइटिंग अलग अलग होती है और कभी कभी तो हम लोग खुद अपना लिखा भी नहीं पहचान पाते है लेकिन यह कंप्यूटर OCR या Handwriting Recognition के द्वारा कैसे हम लोगो के राइटिंग को पहचान लेता है और उसे एडिट करने योग्य टेक्स्ट में बदल देता है. OCR Handwriting Recognition kya hai?  को आप सभी लोग अच्छी तरह से समझ गए होंगे. यदि आपको कोई शिकायत हो या हमारे लिए कोई सुझाव हो तो आप उसे कमेंट box के द्वारा जरुर अवगत कराये. यदि यह पोस्ट पसंद आया हो तो इसे आप अपने मित्रो के साथ सोशल मीडिया facebook और twitter पर इसे जरुर शेयर करें.

1 टिप्पणी:

  1. Great article, Thanks for your great information, the content is quiet interesting. I will be waiting for your next post.

    उत्तर देंहटाएं