हिंदी कंप्यूटिंग को एक और नववर्ष उपहार : निःशुल्क, मुक्त स्रोत हिंदी वर्तनी परीक्षक 'माला' का नया, उन्नत संस्करण जारी

SHARE:

पहले पहली बात. इस वर्तनी परीक्षक पर सुप्रसिद्ध कार्टूनकार काजल कुमार का फ़ीडबैक प्रस्तुत है - "मैं आपको व आपके दूसरे मि‍त्रों को धन्...

पहले पहली बात.

इस वर्तनी परीक्षक पर सुप्रसिद्ध कार्टूनकार काजल कुमार का फ़ीडबैक प्रस्तुत है -

"मैं आपको व आपके दूसरे मि‍त्रों को धन्‍यवाद देना चाहता हूं कि‍ आप लोगों के अथक प्रयासों की सराहना के लि‍ए मेरे पास शब्‍द नहीं हैं.
मैंने अभी हिंदी वर्तनी परीक्षक डाउनलोड कि‍या है. वास्‍तव में ही बहुत अच्‍छा है. इसके वि‍षय में मेरी कुछ जि‍ज्ञासाएं हैं आशा आप एक पोस्‍ट लि‍ख कर इनका समाधान अवश्‍य करेंगे,
1   यह stand alone तो बढ़ि‍या चल रहा है पर स्‍पैल चैक की डि‍क्‍शनरी में शब्‍द जोड़ना मुझे नहीं आया. जैसे:- 'देश' शब्‍द लि‍खने पर देशा तो इसके ऑप्शन में है पर देश को एक शब्‍द न लेकर यह दे + श लेता है.
2   इसे फ़ायरफ़ाक्‍स एवं एमएस ऑफ़ि‍स में जोड़ने की क्रमवार जानकारी  (संभव हो तो स्‍नैपशॉट सहि‍त) दे पाएं तो नि‍श्‍चय ही मुझे जैसे बहुत से लोगों पर आपका बहुत आभार होगा.
सादर सस्‍नेह
काजल कुमार"

--

जाहिर है, यह वर्तनी परीक्षक बहुत बढ़िया और काम का है, इसीलिए काजल कुमार जी जैसे नवीन टेक्नोलॉजी के उन्नत प्रयोगकर्ता और परीक्षक (रीव्यूअर) ने भी इसे पसंद किया है. और, सबसे बड़ी बात, इसे निःशुल्क, मुक्त स्रोत सॉफ़्टवेयर के रूप में जारी किया गया है - यानी इसके सोर्स कोड और शब्दकोश को कोई भी अपने हिसाब से परिवर्तित कर निःशुल्क पुनः वितरित कर सकता है.

इस वर्तनी परीक्षक का नया, ताज़ा संस्करण आप नीचे दिए गए लिंक से डाउनलोड कर सकते हैं -

http://mcu.ac.in/Conf_New/Mala.zip 

इसे डाउनलोड करने के पश्चात आपको इसे किसी जिप टूल जैसे कि विनजिप या विनराल से अनजिप करना होगा.

अनजिप करने के बाद आपको कई फ़ाइलें मिलेंगीं, जिनके शीर्षक से ही आपको पता चल जाएगा कि कौन सी फ़ाइल का क्या कार्य है.

प्रोग्राम सेटअप की फ़ाइल चलाने पर प्रोग्राम विंडोज कंप्यूटर पर इंस्टाल हो जाता है. पर इसके लिए डॉट.नेट 3.5 संस्करण आपके कंप्यूटर पर होना आवश्यक है. यदि आपके कंप्यूटर पर विंडोज7 या उसके बाद का संस्करण है तो आपको चिंता करने की जरूरत नहीं - यह पहले से इंस्टाल होता है. विंडोज एक्सपी के लिए आपको इसे अलग से डाउनलोड कर इंस्टाल करना होगा.

फ़ायरफ़ॉक्स और थंडरबर्ड में इंस्टाल करने के लिए फ़ायरफ़ॉक्स एक्सटेंशन की फ़ाइल भी इसमें है और कैसे इंस्टाल करना है इसकी विधि भी एक अलग से टैक्स्ट फ़ाइल में दी गई है.

एक ब्लैंक.एचटीएमएल नामक फ़ाइल भी इसमें मिलेगा, जिसे खोलने पर खाली टैक्स्ट एरिया वाला ब्राउज़र विंडो खुलता है जिसमें आप हिंदी टाइप कर सकते हैं और वहीं पर वर्तनी परीक्षण कर सकते हैं.

कोई समस्या हो तो टिप्पणी में पूछें.

--

इस वर्तनी परीक्षक की पृष्ठभूमि के बारे में जानने के लिए इस प्रोग्राम के मुख्य विकासकर्ता और संयोजक - डॉ. अनुराग सीठा द्वारा प्रस्तुत सामग्री से आपको मदद मिलेगी जो निम्न है:

एक मुक्त सोर्स हिन्दी वर्तनी शोधक (जाँचक)

परिचय

¢ प्रभावी संप्रेषण की प्रक्रिया में पाठ्य दस्तावेजों की व्याकरण तथा वर्तनी शुद्धता का अत्यंत महत्व है

¢ वर्तमान में कम्प्यूटर का प्रयोग हर क्षेत्र में बढ़ रहा है। कम्प्यूटर पर हिन्दी में इलेक्ट्रॉनिक पाठ्य अत्यधिक मात्रा में तैयार किए जा रहे है। हिन्दी इलेक्ट्रॉनिक पाठ्य की शुद्धता की पुष्टि की आवश्यकता महसूस की जा रही है।

¢ एक वर्तनी जाँचक वह सॉप्टवेयर है जो किसी दस्तावेज में पाठ्य की वर्तनी शुद्धता की जाँच करता है तथा अशुद्ध शब्दों को स्वचालित रुप से रेखांकित करता है।

¢ एक वर्तनी जाँचक को एक स्वतंत्र प्रोग्राम का तरह या किसी बड़े सॉफ्टवेयर प्रोग्राम जैसे एक शब्द-संसाधक(वर्ड-प्रोसेसर), ई-मेल प्रोग्राम या किसी सर्च-इंजन प्रोग्राम के एक हिस्से के रुप में प्रयुक्त किया जा सकता है।

कम्प्यूटर से वर्तनी जाँच

¢ पाठ्य दस्तावेजों में मानवीय हस्तक्षेप से वर्तनी शुद्धता की जाँच करना अत्यंत उबाऊ तथा श्रमसाध्य कार्य है।

¢ स्वचालित वर्तनी जाँच का प्रयोग कर हम अत्यधिक श्रम तथा समय की बचत कर सकते हैं।

¢ सामान्यतः एक वर्तनी जाँचक एक शब्द संसाधक प्रोग्राम या एक पाठ्य संशोधक प्रोग्राम में संयुक्त होकर दस्तावेजों के पाठ्य की वर्तनी शुद्धता की जाँच करता है।

— दस्तावेज में प्रयुक्त प्रत्येक शब्द की जाँच शब्दकोश में उपलब्ध शब्दों की सही वर्तनी से करता है

— यदि दस्तावेज में प्रयुक्त कोई शब्द कम्प्यूटर शब्दकोश का हिस्सा नहीं है तो वह दस्तावेज में उपलब्ध शब्द से मिलते-जुलते उन शब्दों को आपको सुझाव के रुप में उपलब्ध कराता है जो उस कम्प्यूटर शब्दकोश में उपलब्ध हैं.

— इन प्रदर्शित सुझाए गए शब्दों में से आप एक उपर्युक्त शब्द का चयन कर सकते हैं या उस शब्द को उपेक्षित कर सकते हैं.

अंग्रेजी भाषा में वर्तनी शोधक

¢ अंग्रेजी भाषा में शब्दकोश कई पाठ्य संसाधकों, शब्द संसाधकों तथा पेज ले-आउटिंग सॉफ्टवेयर में लम्बे समय से उपलब्ध है.

¢ अंग्रेजी भाषा में स्वचालित वर्तनी परीक्षक प्रोग्राम विगत 3-4 दशकों से सामान्य रुप से उपलब्ध हैं

¢ अंग्रेजी भाषा के लिए विश्व का सर्वप्रथम वर्तनी परीक्षक प्रोग्राम 1960-65 के मध्य राल्फ गोरिन द्वारा विकसित किया गया था.

¢ अंग्रेजी भाषा का प्रथम वर्तनी परीक्षक प्रोग्राम मेनफ्रेम कम्प्यूटरों पर 1970 के दशक के अंत में बड़े पैमाने पर उपलब्ध कराया गया था.

¢ पर्सनल कम्प्यूटरों पर CP/M तथा TRS-80 पर 1980 में तथा फिर आई.बी.एम. पी. सी. पर अंग्रेजी भाषा वर्तनी शोधक/परीक्षक 1981 में उपलब्ध कराया गया.

¢ हाल ही के वर्षों में वर्तनी परीक्षक अधिकांश शब्द संसाधकों, पाठ्य संशोधकों, प्रेजेन्टेशन सॉफ्टवेयर तथा पेज ले-आउटिंग सॉफ्टवेयर में अंग्रेजी तथा अन्य कई भाषाओं में उपलब्ध हैं इनमें से कुछ प्रोग्राम तो सामान्य व्याकरण का परीक्षण भी कर सकते हैं.

हिन्दी तथा भारतीय भाषाओं में वर्तनी जाँच सुविधा

¢ कम्प्यूटरों पर भारतीय भाषाओं को प्रयोग करने के प्रयास 1970 के दशक से ही किए जा रहे थे

¢ 1980 के दशक में कम्प्यूटरों पर हिन्दी का मुख्यतया प्रयोग टाइपसेटिंग, प्रिंटिंग तथा प्रकाशन में किया गया. इस दशक में कम्प्यूटरों पर हिन्दी का प्रयोग कर दस्तावेजों का निर्माण किया गया. यह दस्तावेज मुख्यत लिगेसी फोन्ट्स का प्रयोग कर हिन्दी तथा अन्य भारतीय भाषाओं में तैयार किए जाते थे.

¢ हिन्दी तथा अन्य भारतीय भाषाओं में वर्तनी जाँच सुविधा एक सामान्य कम्प्यूटर उपयोगकर्ता के लिए एक स्वप्न ही थी.

¢ 1990 तथा 2000 के दशक हिन्दी में वर्तनी जाँच सुविधा निर्माण के कुछ प्रयास किए गए थे किन्तु वे अधिक सफल नहीं हो सके।

¢ वर्तमान में भी कोई भी मानक पाठ्य संसाधक तथा शब्द संसाधक सॉफ्टवेयर में में हिन्दी वर्तनी जाँच सुविधा अंत:निर्मित नहीं है.

¢ हिन्दी में वर्तनी जाँच सुविधा के क्षेत्र में कुछ शोध तथा प्रयास अवश्य किए गए है जिनके परिणाम स्वरूप कुछ सॉफ्टवेयर जैसे सीडेक के आईलीप, ओपनऑफिस, वेबदुनिया के विन्डिक इत्यादि सॉफ्टवेयर में प्रारंभिक स्तर पर वर्तनी जाँच सुविधा उपलब्ध करायी गई है. किन्तु इन सॉफ्टवेयर में शब्द संख्या अत्यंत सीमित होने के कारण तथा प्रोपराइटर फोन्ट पर निर्भरता के कारण इनका प्रयोग वांछित स्तर पर नहीं हो पाया है।

कम्प्यूटर, यूनिकोड तथा हिन्दी वर्तनी शोधक

¢ मूल रुप से कम्प्यूटर सिर्फ अंक आधारित होते है। किसी भी भाषा के अक्षरों तथा अन्य कैरेक्टर्स को प्रदर्शित तथा संग्रहित करने के लिए उनको एक आंकिक कोड प्रदान किया गया है.

¢ यूनिकोड के पर्योग से पहले अक्षरों तथा अन्य कैरेक्टर्स को प्रदर्शित तथा संग्रहित करने के लिए उनकी कई आंकिक कोड प्रणालियॉ अस्तित्व में थी

¢ यूनिकोड से पूर्व भारतीय भाषाओं को कम्प्यूटर में प्रयोग में लाने के लिए एक मानक आंकिक कोड प्रणाली ISCII (Indian Script Code for Information Interchange) को भारत सरकार ने विकसित तथा मान्य किया था परन्तु दुर्भाग्यवश यह अधिक प्रयोग में नहीं लाई गई

¢ भारतीय फोन्ट निर्माताओं ने अपने फोन्ट निर्माण तथा संग्रहण के लिए अपनी ही आंकिक कोड प्रणालियों को प्रयोग में लाया जिससे एक मानक वर्तनी शोधक का निर्माण करना भी असंभव हो गया

कम्प्यूटर, यूनिकोड तथा हिन्दी वर्तनी शोधक

¢ यूनिकोड के मानकीकरण एवं ऑपरेटिंग सिस्टम तथा सॉफ्टवेयर में सपोर्ट के पश्चात यह विचार स्तर पर संभव हो पाया कि एक मानक हिन्दी वर्तनी शोधक का विकास किया जा सके.

¢ पूर्व में विकसित हिन्दी वर्तनी जाँचक सॉफ्टवेयर जैसे सीडेक के आईलीप, ओपनऑफिस, वेबदुनिया के विन्डिक, अक्षरा-एक्सपी, सुलिपि 2.0 इत्यादि सॉफ्टवेयर प्रोपराइटर फोन्ट पर निर्भर थे। अतः इनका प्रयोग मानक यूनिकोड आधरित दस्तावेजों की वर्तनी जाँच में नहीं किया जा सकता था

¢ इन वर्तनी शोधक सॉफ्टवेयर में प्रयुक्त एल्गोरिथ्म भी अधिक परिष्कृत नहीं थे तथा इनमें प्रयुक्त शब्दकोश में शब्दों की अधिकतम संख्या 20-30 हजार के लगभग ही थी।

¢ अभी हाल ही में कम्प्यूटर क्षेत्र की दिग्गज कंपनियों याहू, गूगल, ब्लॉगर तथा रैडिफ ने अपने ऑनलाइन दस्तावेजों में तथा ई-मेल में प्रारंभिक स्तर पर हिन्दी में वर्तनी जाँच सुविधा प्रारंभ की है किन्तु यह सुविधा सिर्फ ऑनलाइन ही उपलब्ध है ऑफलाइन उपयोगकर्ताओं के लिए यह उपलब्ध नहीं है।

हिन्दी में वर्तनी शोधक विकास की चुनौतियॉ

¢ विभिन्न शोंधों से यह जानकारी मिली है कि हिन्दी में वर्तनी अशुद्धियॉ निम्न कारणों से होती है -

— मात्रा की त्रुटियॉ

— मात्रा तथा व्यंजक का स्थान परिवर्तन

— अक्षर दोहराव की त्रुटियॉ

— स्वर तथा व्यंजक परिवर्तन

— अक्षर का विलोपित होना

— शब्द विभाजन

— शब्द संयोजन

¢ हिन्दी जैसी भाषा में एक ही शब्द से बनने वाले वेरिएंट शब्द जैसे लड़का, लड़के, लड़की, लड़कियों, लड़कों की संख्या काफी अधिक है तथा सभी का शब्दकोश में रखा जाना असंभव है।

¢ हिन्दी भाषा में प्रयुक्त मूलशब्दों(Rootwords) की संख्या ही लगभग 3.5 लाख बतायी गयी है तथा इनसे बनने वाले वेरिएंट शब्दों की संख्या 40 लाख से ऊपर हो सकती है।

प्रस्तुत हिन्दी वर्तनी शोधक

¢ प्रस्तुत हिन्दी वर्तनी शोधक मानक यूनिकोड पर आधारित है जिससे इसका प्रयोग व्यापक स्तर पर विभिन्न सॉफ्टवेयर में किया जा सके.

¢ प्रस्तुत हिन्दी वर्तनी शोधक पहले से प्रयोग किए जा रहे मानक सॉप्टवेयर की वर्तनी शोधक सुविधा के समान ही कार्य करता है जिससे इसका सीखना अत्यंत सरल है.

¢ यह वर्तनी शोधक इस क्षेत्र में प्रयुक्त अत्यंत प्रभावशाली एवं प्रयोगशील एल्गोरिथ्म पर आधारित है जिसका प्रयोग गूगल, याहू, मोजिला, मैकिन्टोश, ओपनऑफिस, सोलोरिस तथा अन्य कई बड़ी कंपनियॉ अपने सॉप्टवेयर में कर रहीं है.

¢ प्रस्तुत प्रोग्राम हनस्पैल संस्करण 1.3.2 (16-02-2011 को जारी) तथा उसके .NET संस्करण Nhunspell के नवीनतम संस्करण 1.1.1 (12-05-2013 को जारी) पर आधारित है। (http://hunspell.sourceforge.net/ http://nhunspell.sourceforge.net/ )

प्रस्तुत हिन्दी वर्तनी शोधक

¢ प्रस्तुत हिन्दी वर्तनी शोधक कई सॉफ्टवेयर प्रोग्रामों जैसे फॉयरफॉक्स, थंडरवर्ड, ओपनऑफिस तथा लिब्रेऑफिस इत्यादि में सीधे ही संयुग्मित होकर कार्य कर सकता है.

¢ आवश्यकता होने पर इस हिन्दी वर्तनी शोधक की डिक्शनरी को हिन्दी समर्थन युक्त माइक्रोसॉफ्ट ऑफिस 2003, 2007, 2010 या 2013 में भी प्रयुक्त किया जा करता है.

¢ छोटे दस्तावेजों के निर्माण तथा इसमें वर्तनी शोधक के प्रयोग के लिए इसमें एक नोटपैड जैसा एक पाठ्य-संसाधक भी विकसित किया गया है।

¢ बड़े दस्तावेजों की वर्तनी शुद्धता की जाँच के लिए विकसित फॉयरफॉक्स एक्सटेंशन का प्रयोग किया जा सकता है या विकसित डिक्शनरी को माइक्रोसॉफ्ट ऑफिस, ओपनऑफिस तथा लिब्रेऑफिस के साथ किया जा सकता है.

प्रस्तुत हिन्दी वर्तनी शोधक

¢ इसका प्रयोग कर उपयोगकर्ता कम समय में हिन्दी में त्रुटिरहित दस्तावेजों का निर्माण कर सकता है।

¢ इस वर्तनी शोधक प्रोग्राम के सोर्स कोड तथा बायनरी फाइल को विकसित किए गए हिन्दी शब्दसंग्रह (डिक्शनरी) को विश्वविद्यालय द्वारा पब्लिक डोमेन में मुक्त सोर्स सॉप्टवेयर की तरह (GNU GPL लाइसेंस के अंतर्गत) उपलब्ध कराया जा रहा है जिससे इसका उपयोग हिन्दी के अन्य शोधों में बिना किसी मूल्य के किया जा सकेगा क्योंकि वर्तमान में इतनी यूनिक शब्द संख्या का कोई भी हिन्दी डाटाबेस उपलब्ध नहीं है।

¢ जीएनयू जीपीएल लाइसेंस के तहत जारी होने के कारण इस प्रोग्राम के सोर्स कोड को अन्य व्यक्ति, संस्था या शोध-समूह लेकर इसमें और अधिक सुधार कर सकते है तथा इसे परिष्कृत कर सकते है।

¢ इस वर्तनी शोधक तथा इसकी डिक्शनरी को विश्वविद्यालय की वेबसाइट पर मुक्त वितरण के लिए रखा जा सकता है.

हिन्दी वर्तनी शोधक - विकास तथा निर्माण टीम

¢ इस हिन्दी वर्तनी शोधक की विकास तथा निर्माण टीम में निम्न सदस्य है

डॉ. अनुराग सीठा – मुख्य शोधकर्ता तथा प्रोजेक्ट लीडर

डॉ. सुजोय दास – सहायक शोधकर्ता तथा शब्द सूची निर्माण सहायक

रविशंकर श्रीवास्तव (रवि रतलामी) – सॉप्टवेयर तथा शब्द सूची निर्माण सहायक तथा टेस्टिंग

डॉ. महेश परिमल – भाषाविद तथा शब्द सूची संशोधक

विनय उपाध्याय – हिन्दी भाषा विशेषज्ञ तथा शब्द सूची संशोधक

— सॉफ्टवेयर विकास - डॉ. अनुराग सीठा, आनंद, जावेद खान, दीपेन्द्र तथा अन्य 6 व्यक्ति

— विशेष सहयोग – श्री अरविंद कुमार (जिन्होंने विश्व का प्रथम हिन्दी समांतर कोष तैयार किया है) तथा डॉ. विनीत चैतन्य (IIIT, हैदराबाद में प्रोफेसर) जिन्होंने इसमें प्रयुक्त शब्दकोश के लिए लगभग 40 हजार शब्द दिए।

भविष्य की योजनाएं

¢ इस वर्तनी शोधक तथा इसकी डिक्शनरी को विश्वविद्यालय की वेबसाइट पर मुक्त वितरण के लिए रखा जा सकता है. जिसका प्रयोग हिन्दी की अन्य शोध टीमें कर सकती है. विशेषकर प्राकृतिक भाषा प्रौद्योगिकी(NLP) के क्षेत्र में कार्यरत शोध टीमें।

¢ शब्द सूची का और अधिक विस्तार तथा संशोधन।

¢ भविष्य में इस डिक्शनरी पर आधारित माइक्रोसॉफ्ट ऑफिस का प्लगइन विकास किया जा सकता है।

¢ प्राप्त सुझावों के आधार पर बेहतर शब्द सुझाव के लिए एल्गोरिथ्म में सुधार।

¢ अन्य भारतीय भाषाओं में इसका उपयोग किया जा सकता है।

प्रोजेक्ट परिणाम

— इस सॉफ्टवेयर में उपलब्ध है – विन्डोज नोटपैड के समान एक सरल पाठ्य निर्माण सॉफ्टवेयर हिन्दी वर्तनी शोधक की सुविधा के साथ।

— एक फॉयरफॉक्स ब्राउजर तथा थंडरबर्ड ई-मेल क्लाइंट के लिए प्लगइन/एक्सटेंशन जिसका प्रयोग कर हिन्दी पाठ्य तैयार कर उसमें वर्तनी शोधक प्रयोग किया जा सकता है.

— दो लाख से अधिक हिन्दी शब्दों का कोश (कुल शब्द संख्या 202021)

— यह पाठ्य निर्माण तथा हिन्दी वर्तनी शोधक प्रोग्राम विन्डोज डॉट नेट फ्रेमवर्क संस्करण 3.5 पर आधारित है जिसे C# भाषा में विकसित किया गया है.

— इसे चलाने के लिए आपके कम्प्यूटर पर निम्न सॉफ्टवेयर होना आवश्यक है-

¢ विन्डोज एक्स पी (सर्विस पैक 2 के साथ)/ विन्डोज विस्टा/ विन्डोज 7/ विन्डोज 8 हिन्दी भाषा इनपुट सुविधा के साथ (अर्थात यूनिकोड इनेबल तथा हिन्दी इनपुट के लिए आवश्यक कीबोर्ड लेआऊट की हिन्दी आईएमई के साथ)

¢ डॉट नेट फ्रेमवर्क संस्करण 3.5 (सर्विस पैक 1 के साथ)

¢ फॉयरफॉक्स ब्राउजर या थंडरबर्ड ई-मेल क्लाइंट (संस्करण 8 या अधिक)

¢ फॉयरफॉक्स ब्राउजर के एड्रेस बार में data:text/html, <html contenteditable> टाइप करने पर ब्राउजर एक पाठ्य एडीटर में बदल जाता है तथा आप यहॉ हिन्दी में टाइप कर सकते है.

प्रयुक्त हिन्दी वर्तनी की शुद्धता - मानक

— हिन्दी शब्दों की वर्तनी शुद्धता जाँच के लिए निम्न साधन या स्त्रोत का प्रयोग किया गया-

¢ वृहत हिन्दी कोश – कालिका प्रसाद, राजवल्लभ सहाय तथा मुकुन्दी लाल श्रीवास्तव – ज्ञानमंडल लिमिटेड, वाराणसी

¢ आदर्श हिन्दी शब्दकोश – संपादक – आर.सी.पाठक, भार्गव बुक डिपो, वाराणसी

¢ हिंदी शब्दसागर - प्रधान सम्पादक श्यामसुन्दर दास, नागरी प्रचारिणी सभा, काशी (http://dsal.uchicago.edu/dictionaries/dasa-hindi/index.html)

¢ शिक्षार्थी शब्दकोश डॉ. हरदेव बाहरी, राजपाल, नई दिल्ली

¢ अरविंद कुमार, समांतर कोश, नेशनल बुक ट्रस्ट, नई दिल्ली

¢ हिन्दी शब्दतंत्र (हिन्दी वर्डनेट) - http://www.cfilt.iitb.ac.in/wordnet/hindiwn_test/wn.php

----------.

इस वर्तनी परीक्षक का लोकार्पण पिछले दिनों किया गया. जिसका समाचार निम्न है -

हिन्दी का प्रथम बहुआयामी वर्तनी परीक्षक माला शब्द संशोधक व सुधारक मुक्त स्रोत सॉफ़्टवेयर जारी

image

(हिंदी वर्तनी परीक्षक सॉफ़्टवेयर - माला जारी करते हुए सुप्रसिद्ध पत्रकार राहुल देव)

भोपाल, 25 दिसंबर। आज किसी भी भाषा के विकास में तकनीकी संसाधन महत्वपूर्ण भूमिका निभा रहे हैं। कंप्यूटर आधारित तकनीक भाषा के विकास में अहम होती जा रही है। इसलिए ही हिंदी और अन्य भारतीय भाषाओं के शब्द संशोधक भाषा के विकास की अहम कड़ी होगें। यह विचार वरिष्ठ पत्रकार राहुल देव ने माखनलाल चतुर्वेदी राष्ट्रीय पत्रकारिता एवं संचार विश्वविद्यालय में आयोजित हिंदी के प्रथम ओपन सोर्स स्पेल चेक साफ्टवेयर के लोकार्पण समारोह में व्यक्त किए। इस साफ्टवेयर का नामकरण 'माला शब्द संशोधक' (माखनलाल चतुर्वेदी हिंदी शब्द संशोधक) किया गया है। कार्यक्रम का आयोजन पं.मदनमोहन मालवीय की जयंती एवं पूर्व प्रधानमंत्री श्री अटलबिहारी वाजपेयी की जन्मतिथि के अवसर पर किया गया था। पत्रकारिता विश्वविद्यालय की एक महत्वाकांक्षी परियोजना के तहत कंप्यूटर पर हिंदी में काम करते समय हिंदी के शब्दों को लिखते समय होने वाली वर्तनी की त्रुटियों को दूर करने के लिए स्पेल चेक साफ्टवेयर परियोजना के अंतर्गत तैयार किया गए 'माला शब्द संशोधक साफ्टवेयर' का लोकार्पण करते हुए श्री राहुल देव ने कहा कि भारत भाषायी विविधता वाला देश है। भारतीय भाषाओं को विकास के लिए तकनीक आधारित विकास पर जोर देते हुए वर्तनी शोधक तैयार करना चाहिए। हिंदी में तैयार किया गया यह शब्दशोधक केवल पत्रकारिता के लिए ही नहीं बल्कि हिंदी के विकास में भी महत्वपूर्ण भूमिका का निर्वाह करेगा। इस अवसर पर साफ्टवेयर निर्माण दल के सदस्यों सर्वश्री अनुराग सीठा, रवि रतलामी, महेश परिमल एवं मनीष माहेश्वरी ने साफ्टवेयर सीडी का लोकार्पण करते हुए उसके अनुप्रयोग के बारे में प्रस्तुति दी। कार्यक्रम के विशिष्ट अतिथि सूचना एवं प्रसारण मंत्रालय के पूर्व सचिव उदय वर्मा ने कहा कि हिंदी कठिन किंतु वैज्ञानिक भाषा है। ऐसा माना जाता है कि विकसित एवं अविकसित भाषाओं में मुख्य अंतर यह होता है कि विकसित भाषा में कम अक्षर होते हैं हिंदी में अधिक अक्षर होने के बावजूद भी इसका वर्तनी शोधक तैयार कर लेना एक बड़ी उपलब्धि है। साथ ही इसे ओपन सोर्स के तहत जारी करना हिंदी के विकास में एक बड़ा कदम है। अपने अध्यक्षीय संबोधन में कुलपति प्रो. बृज किशोर कुठियाला ने कहा कि हिंदी के विकास एवं विस्तार में अब तकनीकी संसाधन अब महत्वपूर्ण कड़ी बन रहे हैं इसलिए विश्वविद्यालय ने यह साफ्टवेयर तैयार किया है।विश्वविद्यालय की वेबसाइट www.mcu.ac.in पर यह साफ्टवेयर ओपनसोर्स के अंतर्गत उपलब्ध है। हिंदी प्रेमी इसमें आवश्यक सुधार-परिवर्तन करते हुए इसके नए संस्करण तैयार कर हिंदी के विकास में अपना योगदान दे सकते हैं। कार्यक्रम के दौरान डा. अनुराग सीठा ने इस संपूर्ण परियोजना की रूपरेखा रखी एवं इसके अनुप्रयोग के संबंध में बताया। कार्यक्रम का संचालन संजय द्विवेदी एवं आभार प्रदर्शन डा. चैतन्य पुरुषोत्तम अग्रवाल ने किया। इस अवसर हिंदी विश्वविद्यालय के कुलपति प्रो. मोहनलाल छीपा, वरिष्ठ पत्रकार सर्वश्री राजेंद्र शर्मा, गिरीश उपाध्याय, शिवअनुराग पटैरया, रामभुवन सिंह, कुशवाह, हरिमोहन शर्मा, बृजेश राजपूत, दीपक तिवारी, विजय दास, साहित्यकार श्री सुबोध श्रीवास्तव सहित विवि के शिक्षक, अधिकारी, कर्मचारी, छात्र-छात्राएं उपस्थित थे।

(डॉ. पवित्र श्रीवास्तव)
निदेशक, जनसंपर्क प्रकोष्ठ
मा.स.रा.प.सं.वि.वि., भोपाल

माखनलाल चतुर्वेदी विश्वविद्यालय की एक शोध परियोजना के तहत एक नया, बहुआयामी, बहुविकल्पीय व वस्तुतः प्रायोगिक हिंदी वर्तनी परीक्षक सह लेखक सॉफ़्टवेयर जारी किया गया है जिससे कंप्यूटरों में काम करते समय हिंदी के शब्दों को लिखते समय होने वाली वर्तनी त्रुटियों को दूर किया जा सकेगा.

अब आप कंप्यूटरों में काम करते समय अपनी हिंदी की चिंता छोड़ सकते हैं. यानी अब आप अपने कंप्यूटरों में परिशुद्ध हिंदी लिख सकते हैं. सही और शुद्ध वर्तनी वाली हिंदी लिखने में आपकी सहायता के लिए वर्तनी परीक्षक सह लेखक प्रोग्राम का लोकार्पण 25 दिसम्बर 2013 को किया गया. यह सॉफ़्टवेयर प्रोग्राम सभी के डाउनलोड व उपयोग के लिए निःशुल्क जारी किया गया है.

हिंदी कंप्यूटरी के क्षेत्र में अब तक जो भी वर्तनी परीक्षक सॉफ़्टवेयर उपलब्ध थे, उनमें कुछ न कुछ कमियाँ थीं – जैसे कि कुछ में प्रोप्राइटरी फ़ॉन्ट का प्रयोग किया गया है, कुछ अत्यंत महंगे हैं, कुछ केवल ऑनलाइन उपलब्ध हैं, तथा प्रायः सभी में शब्द संख्या कम होने से उनकी प्रायोगिकता अत्यंत सीमित है इत्यादि, जिन्हें इस सॉफ़्टवेयर में दूर करने का प्रयास किया गया है. इस सॉफ़्टवेयर की सबसे बड़ी ख़ूबी यह है कि इसे मुक्तस्रोत सॉफ़्टवेयर लाइसेंस के तहत जारी किया गया है जिसका अर्थ है कि इसका न केवल उपयोग निःशुल्क किया जा सकेगा, बल्कि इसमें आवश्यक सुधार / परिवर्तन आदि किया जा कर इसके अन्य संस्करण तैयार किए जा सकेंगे और उनका भी वितरण मुक्त स्रोत सॉफ़्टवेयर के रूप में किया जा सकेगा.

इस नए हिंदी वर्तनी परीक्षक सह लेखक सॉफ़्टवेयर की कुछ प्रमुख विशेषताएँ हैं –

· यह सॉफ़्टवेयर निःशुल्क, मुक्त स्रोत लाइसेंस (GNU GPL लाइसेंस के अंतर्गत) के तहत जारी किया गया है, जिसे हर कोई निःशुल्क उपयोग व वितरण व आवश्यक बदलाव व सुधार कर वितरण कर सकता है. इसका सोर्स कोड भी निःशुल्क उपयोग व वितरण के लिए उपलब्ध है. इसके स्रोत कोड का उपयोग हिन्दी के अन्य शोधों में बिना किसी मूल्य के किया जा सकेगा क्योंकि वर्तमान में इतनी अधिक विशिष्ट शब्द संख्या का कोई भी हिन्दी डाटाबेस उपलब्ध नहीं है। इस सॉफ़्टवेयर को इंस्टाल करना व उपयोग करना अत्यंत आसान है.

· इसका शब्द भंडार अतिविशाल है, जिससे अब हिंदी वर्तनी परीक्षण प्रायोगिक रूप से सफल हो गया है. अब तक जितने भी वर्तनी परीक्षक उपलब्ध हैं, उनका शब्द भंडार बेहद कम है जिससे कंप्यूटर आधारित वर्तनी परीक्षण का अर्थ आमतौर पर विफल रहता है और प्रायः उनसे कोई प्रतिफल हासिल नहीं होता. इसके शब्द भंडार में आम प्रचलित दो लाख शब्द हैं. और आप इसमें अपने विषयानुरूप विशिष्ट शब्दों को शामिल भी कर सकते हैं. यह आधुनिक, सर्वमान्य यूनिकोड हिंदी फ़ॉन्ट में कार्य करता है.

· इस सॉफ़्टवेयर में लिखते-लिखते वर्तनी जाँचने की सुविधा है जिससे आपको तत्काल ही पता चल जाता है कि वर्तनी गलत लिखी जा रही है, और गलत वर्तनी के शब्द पर क्लिक करने पर सही वर्तनी वाले शब्दों के विकल्प वहीं पर उपलब्ध हो जाते हैं. साथ ही इसमें पहले से तैयार मैटर की वर्तनी जांच भी की जा सकती है.

· इस सॉफ़्टवेयर में लिखते-लिखते वर्तनी जाँच की सुविधा युक्त एक मूलभूत सुविधा वाला हिंदी शब्दसंसाधक (वर्डपैड जैसा वर्ड प्रोसेसर) भी है जिससे आप हिंदी में लिख सकते हैं. साथ ही इसे आप अपने फ़ायरफ़ाक्स ब्राउज़र, थंडरबर्ड ईमेल क्लाएंट अथवा लिब्रे/ओपन ऑफ़िस में भी प्लगइन के रूप में इंस्टाल कर सकते हैं और हिंदी वर्तनी जाँच की सुविधा उनमें भी हासिल कर सकते हैं. इस तरह से यह सॉफ़्टवेयर अतिप्रायोगिक, बहुआयामी और बहुविकल्पीय भी है.

· आवश्यकता होने पर इस हिन्दी वर्तनी शोधक की समृद्ध डिक्शनरी को हिन्दी समर्थन युक्त माइक्रोसॉफ्ट ऑफिस 2003, 2007, 2010 या 2013 में भी प्रयुक्त किया जा करता है.

· इसमें उपयोग में लिए गए प्रोग्रामिंग अल्गोरिद्म पर विशेष ध्यान दिया गया है जिससे हिंदी वर्तनी जाँच कम समय में और त्वरित गति से संभव होता है, साथ ही गलत शब्दों के लिए सही विकल्प भी, विशाल डेटाबेस होने के बाद भी त्वरित उपलब्ध होते हैं, और प्रोग्राम तेज चलता है.

  • प्रस्तुत हिन्दी वर्तनी शोधक पहले से प्रयोग किए जा रहे मानक सॉप्टवेयर की वर्तनी शोधक सुविधा के समान ही कार्य करता है जिससे इसका सीखना अत्यंत सरल है.
  • यह वर्तनी शोधक इस क्षेत्र में प्रयुक्त अत्यंत प्रभावशाली एवं प्रयोगशील एल्गोरिथ्म पर आधारित है जिसका प्रयोग गूगल, याहू, मोजिला, मैकिन्टोश, ओपनऑफिस, सोलोरिस तथा अन्य कई बड़ी कंपनियॉ अपने सॉप्टवेयर में कर रहीं है.

इसे चलाने के लिए आपके कम्प्यूटर पर निम्न सॉफ्टवेयर होना आवश्यक है-

— विन्डोज एक्स पी (सर्विस पैक 2 के साथ)/ विन्डोज विस्टा/ विन्डोज 7/ विन्डोज 8 हिन्दी भाषा इनपुट सुविधा के साथ (अर्थात यूनिकोड इनेबल तथा हिन्दी इनपुट के लिए आवश्यक कीबोर्ड लेआऊट की हिन्दी आईएमई के साथ)

— डॉट नेट फ्रेमवर्क संस्करण 3.5 (सर्विस पैक 1 के साथ)

— फॉयरफॉक्स ब्राउजर या थंडरबर्ड ई-मेल क्लाइंट (संस्करण 8 या अधिक)

— फॉयरफॉक्स ब्राउजर के एड्रेस बार में data:text/html, <html contenteditable> टाइप करने पर ब्राउजर एक पाठ्य एडीटर में बदल जाता है तथा आप यहॉ हिन्दी में टाइप कर सकते है.

इस सॉफ़्टवेयर को माखनलाल चतुर्वेदी विश्वविद्यालय की वेबसाइट http://mcu.ac.in/Conf_New/Mala.zip  से निःशुल्क डाउनलोड कर अपने कंप्यूटर पर इंस्टाल कर सकते हैं.

कृप्या अपने सुझाव निम्न ईमेल पर देवे : malashabad@mcu.ac.in, malashabad@gmail.com.

COMMENTS

BLOGGER: 8
  1. धन्यवाद!
    अभी अभी डाउनलोड किया।
    अवश्य आजमाएंगे।
    एक बात मैंने नोट की
    Desk top icon में "Hindi Vartani Parishak" लिखा हुआ है।
    "Hindi Vartani Parikshak" होना चाहिए था।
    नव वर्ष की शुभकामनाएं
    जी विश्वनाथ

    जवाब देंहटाएं
  2. बेहद जानकारी वाला आलेख है सर.
    डाउनलोड कर इंस्टाल कर लिया है. पर समझ में नहीं आ रहा है अभी की प्रयोग कैसे करना है.
    देखता हूँ.

    जवाब देंहटाएं
  3. इस शुरूआत के साथ, आने वाले समय में इसमें और सुधार होंगे जो निश्चय ही हिंदी के लिए बहुत अच्छी ख़बर है

    जवाब देंहटाएं
  4. शब्द-संकलन बड़ा तो है परंतु इसमें कई वर्तनी-अशुद्धी है। लगता है आपने किसी कॉर्पस से शब्दों को सीधा निकाल कर बिना संपादन किए डाल दिया है। जैसे निम्न शब्द गलत हैं फिर भी परीक्षक उसे दिखाता नहीं है:
    "अँकवारभरना" में दो शब्द हैं "अँकवार भरना"
    "अँकसदीया" में दो शब्द हैं "अँकस दिया"
    "अँगड़ाईतोड़ना" में दो शब्द हैं "अँगड़ाई तोड़ना"
    "अँधेराउजाला" में दो शब्द हैं "अँधेरा उजाला"
    "गड्डामीजूता" में दो शब्द हैं "गड्डामी जूता"
    "गड्डामीबोली" में दो शब्द हैं "गड्डामी बोली"
    "गिटपिटकरना" में दो शब्द हैं "गिटपिट करना"
    "गिटपिटबोली" में दो शब्द हैं "गिटपिट बोली"
    "गिटपिटभाषा" में दो शब्द हैं "गिटपिट भाषा"
    "हौसलानिकालना" में दो शब्द हैं "हौसला निकालना"
    "हौसलापश्त" में दो शब्द हैं "हौसला पश्त"
    अर्थात यदि इन शब्दों को हम लिखें तो परीक्षक इसे गलत चिह्नित नहीं करता है। यदि इन दो लाख शब्दों की वर्तनी अशुद्धियों को सही कर दिया जाय तो अवश्य ही यह हिन्दी के ओपेन सोर्स क्षेत्र में महती कार्य होगा।

    जवाब देंहटाएं
  5. लिंक नहीं खुल रहा... इस वर्तनी जांचक के लिए कोई और लिंक हो तो कृपया सूचित करें ।

    जवाब देंहटाएं
आपकी अमूल्य टिप्पणियों के लिए आपका हार्दिक धन्यवाद.
कृपया ध्यान दें - स्पैम (वायरस, ट्रोजन व रद्दी साइटों इत्यादि की कड़ियों युक्त)टिप्पणियों की समस्या के कारण टिप्पणियों का मॉडरेशन लागू है. अतः आपकी टिप्पणियों को यहां पर प्रकट होने में कुछ समय लग सकता है.

नाम

तकनीकी ,1,अनूप शुक्ल,1,आलेख,6,आसपास की कहानियाँ,127,एलो,1,ऐलो,1,कहानी,1,गूगल,1,गूगल एल्लो,1,चोरी,4,छींटे और बौछारें,148,छींटें और बौछारें,341,जियो सिम,1,जुगलबंदी,49,तकनीक,56,तकनीकी,709,फ़िशिंग,1,मंजीत ठाकुर,1,मोबाइल,1,रिलायंस जियो,3,रेंसमवेयर,1,विंडोज रेस्क्यू,1,विविध,384,व्यंग्य,515,संस्मरण,1,साइबर अपराध,1,साइबर क्राइम,1,स्पैम,10,स्प्लॉग,2,हास्य,2,हिंदी,5,हिन्दी,509,hindi,1,
ltr
item
छींटे और बौछारें: हिंदी कंप्यूटिंग को एक और नववर्ष उपहार : निःशुल्क, मुक्त स्रोत हिंदी वर्तनी परीक्षक 'माला' का नया, उन्नत संस्करण जारी
हिंदी कंप्यूटिंग को एक और नववर्ष उपहार : निःशुल्क, मुक्त स्रोत हिंदी वर्तनी परीक्षक 'माला' का नया, उन्नत संस्करण जारी
http://lh5.ggpht.com/-uXRBIXOl99k/UsUPTFVvZ2I/AAAAAAAAXKg/dJz1_xE30B4/image%25255B5%25255D.png?imgmax=800
http://lh5.ggpht.com/-uXRBIXOl99k/UsUPTFVvZ2I/AAAAAAAAXKg/dJz1_xE30B4/s72-c/image%25255B5%25255D.png?imgmax=800
छींटे और बौछारें
https://raviratlami.blogspot.com/2014/01/blog-post.html
https://raviratlami.blogspot.com/
https://raviratlami.blogspot.com/
https://raviratlami.blogspot.com/2014/01/blog-post.html
true
7370482
UTF-8
Loaded All Posts Not found any posts VIEW ALL Readmore Reply Cancel reply Delete By Home PAGES POSTS View All RECOMMENDED FOR YOU LABEL ARCHIVE SEARCH ALL POSTS Not found any post match with your request Back Home Sunday Monday Tuesday Wednesday Thursday Friday Saturday Sun Mon Tue Wed Thu Fri Sat January February March April May June July August September October November December Jan Feb Mar Apr May Jun Jul Aug Sep Oct Nov Dec just now 1 minute ago $$1$$ minutes ago 1 hour ago $$1$$ hours ago Yesterday $$1$$ days ago $$1$$ weeks ago more than 5 weeks ago Followers Follow THIS PREMIUM CONTENT IS LOCKED STEP 1: Share to a social network STEP 2: Click the link on your social network Copy All Code Select All Code All codes were copied to your clipboard Can not copy the codes / texts, please press [CTRL]+[C] (or CMD+C with Mac) to copy Table of Content