संस्कृत / हिन्दी ओसीआर

SHARE:

काम लायक हिन्दी ओसीआर की तलाश बहुतों को बहुत समय से है. संस्कृत ओसीआर नाम का एक सॉफ़्टवेयर बहुत समय से इंटरनेट पर मुफ़्त प्रयोग के लिए लंबे...

clip_image002
काम लायक हिन्दी ओसीआर की तलाश बहुतों को बहुत समय से है. संस्कृत ओसीआर नाम का एक सॉफ़्टवेयर बहुत समय से इंटरनेट पर मुफ़्त प्रयोग के लिए लंबे समय से उपलब्ध था, मगर इसका इंटरफेस जर्मन भाषा में होने के कारण इसकी उपयोगिता सीमित किस्म की थी.

अभी हाल ही में इसे अंग्रेज़ी इंटरफेस के साथ जारी किया गया. इस प्रोग्राम की जांच परख की गई तो प्रतीत हुआ कि यह काम कर सकता है. इस ओसीआर से स्कैन कर तैयार किए गए हिन्दी डिजिटाइज्ड पाठ का पहला उदाहरण चन्द्रधर शर्मा गुलेरी का यह आलेख है.

ओसीआर में रोमन में पाठ एकत्र होता है, जिसे यूनिकोड में परिवर्तित करना होता है. इसके लिए तकनीकी हिन्दी समूह के सर्वश्री अनुनाद व नारायण प्रसाद ने त्वरित सहयोग कर (इन्हें विशेष धन्यवाद,) एक परिवर्तक औजार भी तैयार कर दिया.

clip_image004
(चित्र को बड़ा कर देखने के लिए उस पर क्लिक करें)
आइए, इस ओसीआर के प्रयोग की चरण-दर-चरण विधि देखें.

(1) संस्कृत ओसीआर यहाँ से डाउनलोड कर संस्थापित करें (विंडोज प्रोग्राम – एक्सपी व 7 पर कार्य करता है)

(2) संस्कृत ओसीआर प्रोग्राम चालू करें, फ़ाइल मेन्यू में नया दस्तावेज पर क्लिक करें तथा प्रकट विंडो में यहाँ सहेजें संवाद बक्से में फ़ाइल नाम के सामने कोई फ़ाइल नाम दें तथा सहेजें पर क्लिक करें.

(3) अपना स्कैनर चालू करें. उसमें स्कैन करने के लिए हिन्दी की कोई किताब इत्यादि रखें. किताब सीधा रखें. अब फ़ाइल मेन्यू में स्कैन एन इमेज पर क्लिक करें. इमेज स्कैनर प्रोग्राम चालू हो जाएगा. इसकी सेटिंग ग्रेस्केल पर 600 डीपीआई पर सेट करें तथा पाठ को सलेक्ट कर स्कैन करें. कार्य पूरा होने पर स्कैन किया पाठ ओसीआर के ऊपरी बाएँ कोने में दिखाई देगा.

(4) ओसीआर मेन्यू में ओसीआर फंक्शन्स पर क्लिक करें तथा क्लीन इमेज पर क्लिक करें. कुछ समय के बाद स्कैन किया पाठ लाल रंग के बक्सों सहित दिखेगा.

(5) अब अगले चरण में ओसीआर फंक्शन पर क्लिक करें तथा रिकग्नीशन पर क्लिक करें. कुछ समय में यह पाठ का रोमनीकृत रूप अनुप्रयोग विंडो के निचले खंड में प्रदर्शित होगा. पाठ कुछ इस तरह का होगा –

ya¸odånandana asvaurï å8ityådi kï åtmakahånï 8å¸abda samåja rme merå samgåna kucha kama nahï 6ai / merå itanå u?ådara iai_ ki vaktå aura lekhaka loga mu?e jabaradastï ghasa¶i le jåte rhai / dina bhara meº mereŸ påsa na jåne kitane bulåve uååte rhai / sabhå sosåi¶iyoº meº jåte uååte mu?e nïda bhara sone kï bhï chu¶¶ï nahï milatï / yadi rmai binå bu?åye bhï kahåiº jå pahu»catå dŸ» to bhï sammåna ke såtha sthåna påtå h÷» /


(6) अब प्रदर्शित पाठ की नकल बनाने के लिए मेन्यू में रिकग्नाइज्ड टैक्स्ट में क्लिक करें व क्लिपबोर्ड चुनें. पाठ आपके क्लिपबोर्ड में नकल हो चुका है.
(7) बाजू पट्टी में दिए फ़ॉन्ट परिवर्तक लिंक में जाकर संस्कृत ओसीआर-यूनिकोड परिवर्तक फाइल को ब्राउजर में खोलें, व नकल किए पाठ को यूनिकोड में बदलने के लिए ऊपरी इनपुट बक्से में भरें तथा कनवर्ट टू यूनिकोड बटन को क्लिक करें.

परिवर्तित पाठ कुछ ऐसा दिखेगा –
यशोदानन्दन अस्वौरी आ8इत्यादि की आत्मकहानी 8आशब्द समाज र्मे मेरा सम्गान कुछ कम नही है / मेरा इतना उ?आदर इऐ_ कि वक्ता और लेखक लोग मु?ए जबरदस्ती घसटि ले जाते र्है / दिन भर में मेरेŸ पास न जाने कितने बुलावे आते र्है / सभा सोसाइटियों में जाते आते मु?ए नीद भर सोने की भी छुट्टी नही मिलती / यदि र्मै बिना बु?आये भी कहाइं जा पहुँचता द्Ÿँ तो भी सम्मान के साथ स्थान पाता हूँ


(8) अब अंतिम चरण में, यूनिकोडित पाठ की त्रुटियाँ दूर करने हेतु इसे संपादित करें व काम में लें.
---.

संस्कृत ओसीआर की नई डाउनलोड कड़ी - http://www.learnsanskrit.org/tools/ocr 

COMMENTS

BLOGGER: 22
  1. बहुत दिनों से प्रतीक्षित था यह । मैं तो केवल सोच सकता था, प्रार्थना कर सकता था, कि यह औजार भी विकसित हो । पहले से ही संस्कृत ओसीआर उपलब्ध है, जानता भी नहीं था । आज आपकी दी गयी कड़ियों से इसे संस्थापित भी किया और बताये तरीके से इसे संचालित भी करके देखा । ठीक-ठीक कर पाया हूँ, और वह पाठ युनिकोड में परिवर्तित भी कर लिया है । आपका, अनुनाद जी और नारायण जी का धन्यवाद ।

    जवाब देंहटाएं
  2. बहुत उपयोगी जानकारी है। इसे प्रकाशित करने के लिए धन्यवाद। अब किसी हिंदी सोफ्टवेयर विशेषज्ञ को ऐसा कोई ओसीआर बनाने का प्रयास करना चाहिए जो सीधे नागरी लिपि में कन्वर्ट कर सके। सीडैक ने चित्रांकन नाम का ऐसा एक ओसीआर पैकेज बनाया है पर उसमें सुधार की काफी गुंजाइश है।

    जवाब देंहटाएं
  3. जोरदार. मगर कम झंझट वाले के लिए काम करना चाहिए. शायद एच.पी. का ओसीआर भी है. पूरा पता नहीं.

    जवाब देंहटाएं
  4. उपयोगी जानकारी देने के लिए धन्यवाद

    जवाब देंहटाएं
  5. बेनामी7:30 am

    hello... hapi blogging... have a nice day! just visiting here....

    जवाब देंहटाएं
  6. रवि जी, आपने बहुत उम्दा जानकारी दी है. निश्चय ही इस तरह के प्रयत्नों से कम्प्यूटर की दुनिया में हिन्दी का प्रयोग बढ़ेगा.

    जवाब देंहटाएं
  7. अरे वाह, इसकी तो मुददत से तलाश थी। शुक्रिया।
    -Zakir Ali ‘Rajnish’
    { Secretary-TSALIIM & SBAI }

    जवाब देंहटाएं
  8. पिछले चार-पांच दिन से इन्टरनेट के सम्पर्क में नहीं आ पाया; इसलिये तेर से टिप्प्णी कर रहा हूँ।

    आप द्वारा दी गयी जानकारी ने हिन्दी के लिये एक बहुत ही उपयोगी द्वार खोल दिया है। इसके पहले मैने एक-दो बार इसे काम में लेने की कोशिश की थी किन्तु कुछ समझ में नहीं आया था कि किस क्रम में क्या करना है और अन्त में निराश होकर छोड़ना पड़ा था।

    आपका दिया हुआ विवरण् अपने आप में पूर्ण है किन्तु मै जानना चाहता हूं कि यदि पहले से स्कैन की हुई फाइल कोई फाइल उपलब्ध हो तो उसका ओसीआर किया जा सकता है या नहीं? यदि हाँ तो कैसे?


    मुझे लगता है है कि इसके आगे हमें दो दिशाओं में कुछ और भी करना पड़ेगा। पहला, इसके निर्माताओं से निवेदन किया जाय कि यदि हो सके तो इसे मुक्त स्रोत करें। यदि नहीं तो कम से कम इसका इन्टरफेस हिन्दी में करें जिसके लिये आवश्यक सेवा हम लोग देंगें। यदि इसका स्रोत मिल जाय तो हममें से कुछ लोग इसे और आगे बढ़ा सकते हैं जिससे यह और शुद्ध पहचान करे।

    दूसरे इसका सीधे यूनिकोड देवनागरी में परिवर्तन करने का विकल्प भी निवेदित किया जाय। तीसरे हम लोग इसके द्वारा उत्पन्न की गयी रोमन को देवनागरी में बदलने वाला प्रोग्राम को और बुद्धिमान बनाने की कोशिश करें ताकि हाथ से कम से कम संशोधम करने की आवश्यकता पड़े।

    मुझे लगता है कि इसके निर्माता हमारे निवेदन पर सकारात्मक रहेंगे।

    एकबार आपको पुन: साधुवाद।

    जवाब देंहटाएं
  9. सीडैक, मुम्बई में इस ओसीआर के विकास से जुड़ी एक भारतीय वैज्ञानिक से एकदा मुलाकात हुई थी। अभी इसका और विकास जारी है।

    जवाब देंहटाएं
  10. can pages already scanned (images) be used as well for conversion?

    जवाब देंहटाएं
  11. this download link is not working... can you please upload the file on some sharing site and send me the link on ajparag@gmail.com... it will be very helpful of you... thank you!

    जवाब देंहटाएं
  12. इस लेख के लिए धन्यवाद। लेख में दी गई कड़ी बदल गई है। नई कड़ी
    विकीपीडिया पर दी गई है और इस प्रकार है।
    http://theindianguru.com/shareonly/SanskritOcrSetup_e.exe
    मैंने इसे डाउनलोड कर अपने कंप्यूटर पर इन्सटाल तो कर लिया है, पर अभी चल नहीं रहा है। स्कैन करने का कमांड, इमेज खोलने का कमांड, सब निष्क्रिय हैं। ऊपर दिए चित्र में जो हो रहा है, वह मैं कर नहीं पा रहा हूँ। कुछ मदद मिलेगी तो अच्छा होगा।

    जवाब देंहटाएं
  13. @रमण,
    विस्तृत विवरण यहाँ देखें -
    http://www.learnsanskrit.org/tools/ocr

    जवाब देंहटाएं
  14. बहुत अच्छी खबर है, आभार|

    जवाब देंहटाएं
  15. दी हुई कड़ी काम नहीं कर रही है। क्या यह सॉफ़्टवेयर कहीं और से भी डाउनलोड किया जा सकता है?

    जवाब देंहटाएं
  16. प्रतीक जी,
    इस कड़ी पर डाउनलोड उपलब्ध है -

    http://theindianguru.com/shareonly/SanskritOcrSetup_e.exe

    तथा विवरण यहाँ है
    http://www.learnsanskrit.org/tools/ocr

    जवाब देंहटाएं
  17. प्रतीक जी,
    द इंडियन गुरू का लिंक काम नहीं कर रहा है. वैकल्पिक लिंक यह है

    http://www.learnsanskrit.org/file/SanskritOcrSetup.zip

    जवाब देंहटाएं
  18. नया व्यावसायिक संस्करण - रुपए 10 हजार में यहाँ से डाउनलोड करें -

    http://www.indsenz.com/int/index.php?content=software_ind_ocr_hindi

    जवाब देंहटाएं
  19. चित्रांकन और संस्कृतओसीआर दोनों देख लिया। संतुष्टि नहीं है। कुछ सहायता कीजिए। चित्रों से मैं पाठ लेना चाहता हूँ। स्कैनर से नहीं। डीपीआई आदि का झंझट होतो उसके लिए भी कुछ बताने कष्ट करें।

    जवाब देंहटाएं
  20. बेनामी9:07 am

    step -7
    I don't get it
    (7) बाजू पट्टी में दिए फ़ॉन्ट परिवर्तक लिंक में जाकर संस्कृत ओसीआर-यूनिकोड परिवर्तक फाइल को ब्राउजर में खोलें, व नकल किए पाठ को यूनिकोड में बदलने के लिए ऊपरी इनपुट बक्से में भरें तथा कनवर्ट टू यूनिकोड बटन को क्लिक करें.

    जवाब देंहटाएं
आपकी अमूल्य टिप्पणियों के लिए आपका हार्दिक धन्यवाद.
कृपया ध्यान दें - स्पैम (वायरस, ट्रोजन व रद्दी साइटों इत्यादि की कड़ियों युक्त)टिप्पणियों की समस्या के कारण टिप्पणियों का मॉडरेशन लागू है. अतः आपकी टिप्पणियों को यहां पर प्रकट होने में कुछ समय लग सकता है.

नाम

तकनीकी ,1,अनूप शुक्ल,1,आलेख,6,आसपास की कहानियाँ,127,एलो,1,ऐलो,1,कहानी,1,गूगल,1,गूगल एल्लो,1,चोरी,4,छींटे और बौछारें,148,छींटें और बौछारें,341,जियो सिम,1,जुगलबंदी,49,तकनीक,56,तकनीकी,709,फ़िशिंग,1,मंजीत ठाकुर,1,मोबाइल,1,रिलायंस जियो,3,रेंसमवेयर,1,विंडोज रेस्क्यू,1,विविध,384,व्यंग्य,515,संस्मरण,1,साइबर अपराध,1,साइबर क्राइम,1,स्पैम,10,स्प्लॉग,2,हास्य,2,हिंदी,5,हिन्दी,509,hindi,1,
ltr
item
छींटे और बौछारें: संस्कृत / हिन्दी ओसीआर
संस्कृत / हिन्दी ओसीआर
http://lh4.ggpht.com/_t-eJZb6SGWU/ShK-ZyKCliI/AAAAAAAAGK0/2TVynaA_t_E/clip_image002%5B3%5D.jpg?imgmax=800
http://lh4.ggpht.com/_t-eJZb6SGWU/ShK-ZyKCliI/AAAAAAAAGK0/2TVynaA_t_E/s72-c/clip_image002%5B3%5D.jpg?imgmax=800
छींटे और बौछारें
https://raviratlami.blogspot.com/2009/05/blog-post_19.html
https://raviratlami.blogspot.com/
https://raviratlami.blogspot.com/
https://raviratlami.blogspot.com/2009/05/blog-post_19.html
true
7370482
UTF-8
Loaded All Posts Not found any posts VIEW ALL Readmore Reply Cancel reply Delete By Home PAGES POSTS View All RECOMMENDED FOR YOU LABEL ARCHIVE SEARCH ALL POSTS Not found any post match with your request Back Home Sunday Monday Tuesday Wednesday Thursday Friday Saturday Sun Mon Tue Wed Thu Fri Sat January February March April May June July August September October November December Jan Feb Mar Apr May Jun Jul Aug Sep Oct Nov Dec just now 1 minute ago $$1$$ minutes ago 1 hour ago $$1$$ hours ago Yesterday $$1$$ days ago $$1$$ weeks ago more than 5 weeks ago Followers Follow THIS PREMIUM CONTENT IS LOCKED STEP 1: Share to a social network STEP 2: Click the link on your social network Copy All Code Select All Code All codes were copied to your clipboard Can not copy the codes / texts, please press [CTRL]+[C] (or CMD+C with Mac) to copy Table of Content