पहले पहली बात. इस वर्तनी परीक्षक पर सुप्रसिद्ध कार्टूनकार काजल कुमार का फ़ीडबैक प्रस्तुत है - "मैं आपको व आपके दूसरे मित्रों को धन्...
पहले पहली बात.
इस वर्तनी परीक्षक पर सुप्रसिद्ध कार्टूनकार काजल कुमार का फ़ीडबैक प्रस्तुत है -
"मैं आपको व आपके दूसरे मित्रों को धन्यवाद देना चाहता हूं कि आप लोगों के अथक प्रयासों की सराहना के लिए मेरे पास शब्द नहीं हैं.
मैंने अभी हिंदी वर्तनी परीक्षक डाउनलोड किया है. वास्तव में ही बहुत अच्छा है. इसके विषय में मेरी कुछ जिज्ञासाएं हैं आशा आप एक पोस्ट लिख कर इनका समाधान अवश्य करेंगे,
1 यह stand alone तो बढ़िया चल रहा है पर स्पैल चैक की डिक्शनरी में शब्द जोड़ना मुझे नहीं आया. जैसे:- 'देश' शब्द लिखने पर देशा तो इसके ऑप्शन में है पर देश को एक शब्द न लेकर यह दे + श लेता है.
2 इसे फ़ायरफ़ाक्स एवं एमएस ऑफ़िस में जोड़ने की क्रमवार जानकारी (संभव हो तो स्नैपशॉट सहित) दे पाएं तो निश्चय ही मुझे जैसे बहुत से लोगों पर आपका बहुत आभार होगा.
सादर सस्नेह
काजल कुमार"
--
जाहिर है, यह वर्तनी परीक्षक बहुत बढ़िया और काम का है, इसीलिए काजल कुमार जी जैसे नवीन टेक्नोलॉजी के उन्नत प्रयोगकर्ता और परीक्षक (रीव्यूअर) ने भी इसे पसंद किया है. और, सबसे बड़ी बात, इसे निःशुल्क, मुक्त स्रोत सॉफ़्टवेयर के रूप में जारी किया गया है - यानी इसके सोर्स कोड और शब्दकोश को कोई भी अपने हिसाब से परिवर्तित कर निःशुल्क पुनः वितरित कर सकता है.
इस वर्तनी परीक्षक का नया, ताज़ा संस्करण आप नीचे दिए गए लिंक से डाउनलोड कर सकते हैं -
http://mcu.ac.in/Conf_New/Mala.zip
इसे डाउनलोड करने के पश्चात आपको इसे किसी जिप टूल जैसे कि विनजिप या विनराल से अनजिप करना होगा.
अनजिप करने के बाद आपको कई फ़ाइलें मिलेंगीं, जिनके शीर्षक से ही आपको पता चल जाएगा कि कौन सी फ़ाइल का क्या कार्य है.
प्रोग्राम सेटअप की फ़ाइल चलाने पर प्रोग्राम विंडोज कंप्यूटर पर इंस्टाल हो जाता है. पर इसके लिए डॉट.नेट 3.5 संस्करण आपके कंप्यूटर पर होना आवश्यक है. यदि आपके कंप्यूटर पर विंडोज7 या उसके बाद का संस्करण है तो आपको चिंता करने की जरूरत नहीं - यह पहले से इंस्टाल होता है. विंडोज एक्सपी के लिए आपको इसे अलग से डाउनलोड कर इंस्टाल करना होगा.
फ़ायरफ़ॉक्स और थंडरबर्ड में इंस्टाल करने के लिए फ़ायरफ़ॉक्स एक्सटेंशन की फ़ाइल भी इसमें है और कैसे इंस्टाल करना है इसकी विधि भी एक अलग से टैक्स्ट फ़ाइल में दी गई है.
एक ब्लैंक.एचटीएमएल नामक फ़ाइल भी इसमें मिलेगा, जिसे खोलने पर खाली टैक्स्ट एरिया वाला ब्राउज़र विंडो खुलता है जिसमें आप हिंदी टाइप कर सकते हैं और वहीं पर वर्तनी परीक्षण कर सकते हैं.
कोई समस्या हो तो टिप्पणी में पूछें.
--
इस वर्तनी परीक्षक की पृष्ठभूमि के बारे में जानने के लिए इस प्रोग्राम के मुख्य विकासकर्ता और संयोजक - डॉ. अनुराग सीठा द्वारा प्रस्तुत सामग्री से आपको मदद मिलेगी जो निम्न है:
एक मुक्त सोर्स हिन्दी वर्तनी शोधक (जाँचक)
परिचय
¢ प्रभावी संप्रेषण की प्रक्रिया में पाठ्य दस्तावेजों की व्याकरण तथा वर्तनी शुद्धता का अत्यंत महत्व है
¢ वर्तमान में कम्प्यूटर का प्रयोग हर क्षेत्र में बढ़ रहा है। कम्प्यूटर पर हिन्दी में इलेक्ट्रॉनिक पाठ्य अत्यधिक मात्रा में तैयार किए जा रहे है। हिन्दी इलेक्ट्रॉनिक पाठ्य की शुद्धता की पुष्टि की आवश्यकता महसूस की जा रही है।
¢ एक वर्तनी जाँचक वह सॉप्टवेयर है जो किसी दस्तावेज में पाठ्य की वर्तनी शुद्धता की जाँच करता है तथा अशुद्ध शब्दों को स्वचालित रुप से रेखांकित करता है।
¢ एक वर्तनी जाँचक को एक स्वतंत्र प्रोग्राम का तरह या किसी बड़े सॉफ्टवेयर प्रोग्राम जैसे एक शब्द-संसाधक(वर्ड-प्रोसेसर), ई-मेल प्रोग्राम या किसी सर्च-इंजन प्रोग्राम के एक हिस्से के रुप में प्रयुक्त किया जा सकता है।
कम्प्यूटर से वर्तनी जाँच
¢ पाठ्य दस्तावेजों में मानवीय हस्तक्षेप से वर्तनी शुद्धता की जाँच करना अत्यंत उबाऊ तथा श्रमसाध्य कार्य है।
¢ स्वचालित वर्तनी जाँच का प्रयोग कर हम अत्यधिक श्रम तथा समय की बचत कर सकते हैं।
¢ सामान्यतः एक वर्तनी जाँचक एक शब्द संसाधक प्रोग्राम या एक पाठ्य संशोधक प्रोग्राम में संयुक्त होकर दस्तावेजों के पाठ्य की वर्तनी शुद्धता की जाँच करता है।
— दस्तावेज में प्रयुक्त प्रत्येक शब्द की जाँच शब्दकोश में उपलब्ध शब्दों की सही वर्तनी से करता है
— यदि दस्तावेज में प्रयुक्त कोई शब्द कम्प्यूटर शब्दकोश का हिस्सा नहीं है तो वह दस्तावेज में उपलब्ध शब्द से मिलते-जुलते उन शब्दों को आपको सुझाव के रुप में उपलब्ध कराता है जो उस कम्प्यूटर शब्दकोश में उपलब्ध हैं.
— इन प्रदर्शित सुझाए गए शब्दों में से आप एक उपर्युक्त शब्द का चयन कर सकते हैं या उस शब्द को उपेक्षित कर सकते हैं.
अंग्रेजी भाषा में वर्तनी शोधक
¢ अंग्रेजी भाषा में शब्दकोश कई पाठ्य संसाधकों, शब्द संसाधकों तथा पेज ले-आउटिंग सॉफ्टवेयर में लम्बे समय से उपलब्ध है.
¢ अंग्रेजी भाषा में स्वचालित वर्तनी परीक्षक प्रोग्राम विगत 3-4 दशकों से सामान्य रुप से उपलब्ध हैं
¢ अंग्रेजी भाषा के लिए विश्व का सर्वप्रथम वर्तनी परीक्षक प्रोग्राम 1960-65 के मध्य राल्फ गोरिन द्वारा विकसित किया गया था.
¢ अंग्रेजी भाषा का प्रथम वर्तनी परीक्षक प्रोग्राम मेनफ्रेम कम्प्यूटरों पर 1970 के दशक के अंत में बड़े पैमाने पर उपलब्ध कराया गया था.
¢ पर्सनल कम्प्यूटरों पर CP/M तथा TRS-80 पर 1980 में तथा फिर आई.बी.एम. पी. सी. पर अंग्रेजी भाषा वर्तनी शोधक/परीक्षक 1981 में उपलब्ध कराया गया.
¢ हाल ही के वर्षों में वर्तनी परीक्षक अधिकांश शब्द संसाधकों, पाठ्य संशोधकों, प्रेजेन्टेशन सॉफ्टवेयर तथा पेज ले-आउटिंग सॉफ्टवेयर में अंग्रेजी तथा अन्य कई भाषाओं में उपलब्ध हैं इनमें से कुछ प्रोग्राम तो सामान्य व्याकरण का परीक्षण भी कर सकते हैं.
हिन्दी तथा भारतीय भाषाओं में वर्तनी जाँच सुविधा
¢ कम्प्यूटरों पर भारतीय भाषाओं को प्रयोग करने के प्रयास 1970 के दशक से ही किए जा रहे थे
¢ 1980 के दशक में कम्प्यूटरों पर हिन्दी का मुख्यतया प्रयोग टाइपसेटिंग, प्रिंटिंग तथा प्रकाशन में किया गया. इस दशक में कम्प्यूटरों पर हिन्दी का प्रयोग कर दस्तावेजों का निर्माण किया गया. यह दस्तावेज मुख्यत लिगेसी फोन्ट्स का प्रयोग कर हिन्दी तथा अन्य भारतीय भाषाओं में तैयार किए जाते थे.
¢ हिन्दी तथा अन्य भारतीय भाषाओं में वर्तनी जाँच सुविधा एक सामान्य कम्प्यूटर उपयोगकर्ता के लिए एक स्वप्न ही थी.
¢ 1990 तथा 2000 के दशक हिन्दी में वर्तनी जाँच सुविधा निर्माण के कुछ प्रयास किए गए थे किन्तु वे अधिक सफल नहीं हो सके।
¢ वर्तमान में भी कोई भी मानक पाठ्य संसाधक तथा शब्द संसाधक सॉफ्टवेयर में में हिन्दी वर्तनी जाँच सुविधा अंत:निर्मित नहीं है.
¢ हिन्दी में वर्तनी जाँच सुविधा के क्षेत्र में कुछ शोध तथा प्रयास अवश्य किए गए है जिनके परिणाम स्वरूप कुछ सॉफ्टवेयर जैसे सीडेक के आईलीप, ओपनऑफिस, वेबदुनिया के विन्डिक इत्यादि सॉफ्टवेयर में प्रारंभिक स्तर पर वर्तनी जाँच सुविधा उपलब्ध करायी गई है. किन्तु इन सॉफ्टवेयर में शब्द संख्या अत्यंत सीमित होने के कारण तथा प्रोपराइटर फोन्ट पर निर्भरता के कारण इनका प्रयोग वांछित स्तर पर नहीं हो पाया है।
कम्प्यूटर, यूनिकोड तथा हिन्दी वर्तनी शोधक
¢ मूल रुप से कम्प्यूटर सिर्फ अंक आधारित होते है। किसी भी भाषा के अक्षरों तथा अन्य कैरेक्टर्स को प्रदर्शित तथा संग्रहित करने के लिए उनको एक आंकिक कोड प्रदान किया गया है.
¢ यूनिकोड के पर्योग से पहले अक्षरों तथा अन्य कैरेक्टर्स को प्रदर्शित तथा संग्रहित करने के लिए उनकी कई आंकिक कोड प्रणालियॉ अस्तित्व में थी
¢ यूनिकोड से पूर्व भारतीय भाषाओं को कम्प्यूटर में प्रयोग में लाने के लिए एक मानक आंकिक कोड प्रणाली ISCII (Indian Script Code for Information Interchange) को भारत सरकार ने विकसित तथा मान्य किया था परन्तु दुर्भाग्यवश यह अधिक प्रयोग में नहीं लाई गई
¢ भारतीय फोन्ट निर्माताओं ने अपने फोन्ट निर्माण तथा संग्रहण के लिए अपनी ही आंकिक कोड प्रणालियों को प्रयोग में लाया जिससे एक मानक वर्तनी शोधक का निर्माण करना भी असंभव हो गया
कम्प्यूटर, यूनिकोड तथा हिन्दी वर्तनी शोधक
¢ यूनिकोड के मानकीकरण एवं ऑपरेटिंग सिस्टम तथा सॉफ्टवेयर में सपोर्ट के पश्चात यह विचार स्तर पर संभव हो पाया कि एक मानक हिन्दी वर्तनी शोधक का विकास किया जा सके.
¢ पूर्व में विकसित हिन्दी वर्तनी जाँचक सॉफ्टवेयर जैसे सीडेक के आईलीप, ओपनऑफिस, वेबदुनिया के विन्डिक, अक्षरा-एक्सपी, सुलिपि 2.0 इत्यादि सॉफ्टवेयर प्रोपराइटर फोन्ट पर निर्भर थे। अतः इनका प्रयोग मानक यूनिकोड आधरित दस्तावेजों की वर्तनी जाँच में नहीं किया जा सकता था
¢ इन वर्तनी शोधक सॉफ्टवेयर में प्रयुक्त एल्गोरिथ्म भी अधिक परिष्कृत नहीं थे तथा इनमें प्रयुक्त शब्दकोश में शब्दों की अधिकतम संख्या 20-30 हजार के लगभग ही थी।
¢ अभी हाल ही में कम्प्यूटर क्षेत्र की दिग्गज कंपनियों याहू, गूगल, ब्लॉगर तथा रैडिफ ने अपने ऑनलाइन दस्तावेजों में तथा ई-मेल में प्रारंभिक स्तर पर हिन्दी में वर्तनी जाँच सुविधा प्रारंभ की है किन्तु यह सुविधा सिर्फ ऑनलाइन ही उपलब्ध है ऑफलाइन उपयोगकर्ताओं के लिए यह उपलब्ध नहीं है।
हिन्दी में वर्तनी शोधक विकास की चुनौतियॉ
¢ विभिन्न शोंधों से यह जानकारी मिली है कि हिन्दी में वर्तनी अशुद्धियॉ निम्न कारणों से होती है -
— मात्रा की त्रुटियॉ
— मात्रा तथा व्यंजक का स्थान परिवर्तन
— अक्षर दोहराव की त्रुटियॉ
— स्वर तथा व्यंजक परिवर्तन
— अक्षर का विलोपित होना
— शब्द विभाजन
— शब्द संयोजन
¢ हिन्दी जैसी भाषा में एक ही शब्द से बनने वाले वेरिएंट शब्द जैसे लड़का, लड़के, लड़की, लड़कियों, लड़कों की संख्या काफी अधिक है तथा सभी का शब्दकोश में रखा जाना असंभव है।
¢ हिन्दी भाषा में प्रयुक्त मूलशब्दों(Rootwords) की संख्या ही लगभग 3.5 लाख बतायी गयी है तथा इनसे बनने वाले वेरिएंट शब्दों की संख्या 40 लाख से ऊपर हो सकती है।
प्रस्तुत हिन्दी वर्तनी शोधक
¢ प्रस्तुत हिन्दी वर्तनी शोधक मानक यूनिकोड पर आधारित है जिससे इसका प्रयोग व्यापक स्तर पर विभिन्न सॉफ्टवेयर में किया जा सके.
¢ प्रस्तुत हिन्दी वर्तनी शोधक पहले से प्रयोग किए जा रहे मानक सॉप्टवेयर की वर्तनी शोधक सुविधा के समान ही कार्य करता है जिससे इसका सीखना अत्यंत सरल है.
¢ यह वर्तनी शोधक इस क्षेत्र में प्रयुक्त अत्यंत प्रभावशाली एवं प्रयोगशील एल्गोरिथ्म पर आधारित है जिसका प्रयोग गूगल, याहू, मोजिला, मैकिन्टोश, ओपनऑफिस, सोलोरिस तथा अन्य कई बड़ी कंपनियॉ अपने सॉप्टवेयर में कर रहीं है.
¢ प्रस्तुत प्रोग्राम हनस्पैल संस्करण 1.3.2 (16-02-2011 को जारी) तथा उसके .NET संस्करण Nhunspell के नवीनतम संस्करण 1.1.1 (12-05-2013 को जारी) पर आधारित है। (http://hunspell.sourceforge.net/ http://nhunspell.sourceforge.net/ )
प्रस्तुत हिन्दी वर्तनी शोधक
¢ प्रस्तुत हिन्दी वर्तनी शोधक कई सॉफ्टवेयर प्रोग्रामों जैसे फॉयरफॉक्स, थंडरवर्ड, ओपनऑफिस तथा लिब्रेऑफिस इत्यादि में सीधे ही संयुग्मित होकर कार्य कर सकता है.
¢ आवश्यकता होने पर इस हिन्दी वर्तनी शोधक की डिक्शनरी को हिन्दी समर्थन युक्त माइक्रोसॉफ्ट ऑफिस 2003, 2007, 2010 या 2013 में भी प्रयुक्त किया जा करता है.
¢ छोटे दस्तावेजों के निर्माण तथा इसमें वर्तनी शोधक के प्रयोग के लिए इसमें एक नोटपैड जैसा एक पाठ्य-संसाधक भी विकसित किया गया है।
¢ बड़े दस्तावेजों की वर्तनी शुद्धता की जाँच के लिए विकसित फॉयरफॉक्स एक्सटेंशन का प्रयोग किया जा सकता है या विकसित डिक्शनरी को माइक्रोसॉफ्ट ऑफिस, ओपनऑफिस तथा लिब्रेऑफिस के साथ किया जा सकता है.
प्रस्तुत हिन्दी वर्तनी शोधक
¢ इसका प्रयोग कर उपयोगकर्ता कम समय में हिन्दी में त्रुटिरहित दस्तावेजों का निर्माण कर सकता है।
¢ इस वर्तनी शोधक प्रोग्राम के सोर्स कोड तथा बायनरी फाइल को विकसित किए गए हिन्दी शब्दसंग्रह (डिक्शनरी) को विश्वविद्यालय द्वारा पब्लिक डोमेन में मुक्त सोर्स सॉप्टवेयर की तरह (GNU GPL लाइसेंस के अंतर्गत) उपलब्ध कराया जा रहा है जिससे इसका उपयोग हिन्दी के अन्य शोधों में बिना किसी मूल्य के किया जा सकेगा क्योंकि वर्तमान में इतनी यूनिक शब्द संख्या का कोई भी हिन्दी डाटाबेस उपलब्ध नहीं है।
¢ जीएनयू जीपीएल लाइसेंस के तहत जारी होने के कारण इस प्रोग्राम के सोर्स कोड को अन्य व्यक्ति, संस्था या शोध-समूह लेकर इसमें और अधिक सुधार कर सकते है तथा इसे परिष्कृत कर सकते है।
¢ इस वर्तनी शोधक तथा इसकी डिक्शनरी को विश्वविद्यालय की वेबसाइट पर मुक्त वितरण के लिए रखा जा सकता है.
हिन्दी वर्तनी शोधक - विकास तथा निर्माण टीम
¢ इस हिन्दी वर्तनी शोधक की विकास तथा निर्माण टीम में निम्न सदस्य है
— डॉ. अनुराग सीठा – मुख्य शोधकर्ता तथा प्रोजेक्ट लीडर
— डॉ. सुजोय दास – सहायक शोधकर्ता तथा शब्द सूची निर्माण सहायक
— रविशंकर श्रीवास्तव (रवि रतलामी) – सॉप्टवेयर तथा शब्द सूची निर्माण सहायक तथा टेस्टिंग
— डॉ. महेश परिमल – भाषाविद तथा शब्द सूची संशोधक
— विनय उपाध्याय – हिन्दी भाषा विशेषज्ञ तथा शब्द सूची संशोधक
— सॉफ्टवेयर विकास - डॉ. अनुराग सीठा, आनंद, जावेद खान, दीपेन्द्र तथा अन्य 6 व्यक्ति
— विशेष सहयोग – श्री अरविंद कुमार (जिन्होंने विश्व का प्रथम हिन्दी समांतर कोष तैयार किया है) तथा डॉ. विनीत चैतन्य (IIIT, हैदराबाद में प्रोफेसर) जिन्होंने इसमें प्रयुक्त शब्दकोश के लिए लगभग 40 हजार शब्द दिए।
भविष्य की योजनाएं
¢ इस वर्तनी शोधक तथा इसकी डिक्शनरी को विश्वविद्यालय की वेबसाइट पर मुक्त वितरण के लिए रखा जा सकता है. जिसका प्रयोग हिन्दी की अन्य शोध टीमें कर सकती है. विशेषकर प्राकृतिक भाषा प्रौद्योगिकी(NLP) के क्षेत्र में कार्यरत शोध टीमें।
¢ शब्द सूची का और अधिक विस्तार तथा संशोधन।
¢ भविष्य में इस डिक्शनरी पर आधारित माइक्रोसॉफ्ट ऑफिस का प्लगइन विकास किया जा सकता है।
¢ प्राप्त सुझावों के आधार पर बेहतर शब्द सुझाव के लिए एल्गोरिथ्म में सुधार।
¢ अन्य भारतीय भाषाओं में इसका उपयोग किया जा सकता है।
प्रोजेक्ट परिणाम
— इस सॉफ्टवेयर में उपलब्ध है – विन्डोज नोटपैड के समान एक सरल पाठ्य निर्माण सॉफ्टवेयर हिन्दी वर्तनी शोधक की सुविधा के साथ।
— एक फॉयरफॉक्स ब्राउजर तथा थंडरबर्ड ई-मेल क्लाइंट के लिए प्लगइन/एक्सटेंशन जिसका प्रयोग कर हिन्दी पाठ्य तैयार कर उसमें वर्तनी शोधक प्रयोग किया जा सकता है.
— दो लाख से अधिक हिन्दी शब्दों का कोश (कुल शब्द संख्या 202021)
— यह पाठ्य निर्माण तथा हिन्दी वर्तनी शोधक प्रोग्राम विन्डोज डॉट नेट फ्रेमवर्क संस्करण 3.5 पर आधारित है जिसे C# भाषा में विकसित किया गया है.
— इसे चलाने के लिए आपके कम्प्यूटर पर निम्न सॉफ्टवेयर होना आवश्यक है-
¢ विन्डोज एक्स पी (सर्विस पैक 2 के साथ)/ विन्डोज विस्टा/ विन्डोज 7/ विन्डोज 8 हिन्दी भाषा इनपुट सुविधा के साथ (अर्थात यूनिकोड इनेबल तथा हिन्दी इनपुट के लिए आवश्यक कीबोर्ड लेआऊट की हिन्दी आईएमई के साथ)
¢ डॉट नेट फ्रेमवर्क संस्करण 3.5 (सर्विस पैक 1 के साथ)
¢ फॉयरफॉक्स ब्राउजर या थंडरबर्ड ई-मेल क्लाइंट (संस्करण 8 या अधिक)
¢ फॉयरफॉक्स ब्राउजर के एड्रेस बार में data:text/html, <html contenteditable> टाइप करने पर ब्राउजर एक पाठ्य एडीटर में बदल जाता है तथा आप यहॉ हिन्दी में टाइप कर सकते है.
प्रयुक्त हिन्दी वर्तनी की शुद्धता - मानक
— हिन्दी शब्दों की वर्तनी शुद्धता जाँच के लिए निम्न साधन या स्त्रोत का प्रयोग किया गया-
¢ वृहत हिन्दी कोश – कालिका प्रसाद, राजवल्लभ सहाय तथा मुकुन्दी लाल श्रीवास्तव – ज्ञानमंडल लिमिटेड, वाराणसी
¢ आदर्श हिन्दी शब्दकोश – संपादक – आर.सी.पाठक, भार्गव बुक डिपो, वाराणसी
¢ हिंदी शब्दसागर - प्रधान सम्पादक श्यामसुन्दर दास, नागरी प्रचारिणी सभा, काशी (http://dsal.uchicago.edu/dictionaries/dasa-hindi/index.html)
¢ शिक्षार्थी शब्दकोश डॉ. हरदेव बाहरी, राजपाल, नई दिल्ली
¢ अरविंद कुमार, समांतर कोश, नेशनल बुक ट्रस्ट, नई दिल्ली
¢ हिन्दी शब्दतंत्र (हिन्दी वर्डनेट) - http://www.cfilt.iitb.ac.in/wordnet/hindiwn_test/wn.php
----------.
इस वर्तनी परीक्षक का लोकार्पण पिछले दिनों किया गया. जिसका समाचार निम्न है -
हिन्दी का प्रथम बहुआयामी वर्तनी परीक्षक माला शब्द संशोधक व सुधारक मुक्त स्रोत सॉफ़्टवेयर जारी
(हिंदी वर्तनी परीक्षक सॉफ़्टवेयर - माला जारी करते हुए सुप्रसिद्ध पत्रकार राहुल देव)
भोपाल, 25 दिसंबर। आज किसी भी भाषा के विकास में तकनीकी संसाधन महत्वपूर्ण भूमिका निभा रहे हैं। कंप्यूटर आधारित तकनीक भाषा के विकास में अहम होती जा रही है। इसलिए ही हिंदी और अन्य भारतीय भाषाओं के शब्द संशोधक भाषा के विकास की अहम कड़ी होगें। यह विचार वरिष्ठ पत्रकार राहुल देव ने माखनलाल चतुर्वेदी राष्ट्रीय पत्रकारिता एवं संचार विश्वविद्यालय में आयोजित हिंदी के प्रथम ओपन सोर्स स्पेल चेक साफ्टवेयर के लोकार्पण समारोह में व्यक्त किए। इस साफ्टवेयर का नामकरण 'माला शब्द संशोधक' (माखनलाल चतुर्वेदी हिंदी शब्द संशोधक) किया गया है। कार्यक्रम का आयोजन पं.मदनमोहन मालवीय की जयंती एवं पूर्व प्रधानमंत्री श्री अटलबिहारी वाजपेयी की जन्मतिथि के अवसर पर किया गया था। पत्रकारिता विश्वविद्यालय की एक महत्वाकांक्षी परियोजना के तहत कंप्यूटर पर हिंदी में काम करते समय हिंदी के शब्दों को लिखते समय होने वाली वर्तनी की त्रुटियों को दूर करने के लिए स्पेल चेक साफ्टवेयर परियोजना के अंतर्गत तैयार किया गए 'माला शब्द संशोधक साफ्टवेयर' का लोकार्पण करते हुए श्री राहुल देव ने कहा कि भारत भाषायी विविधता वाला देश है। भारतीय भाषाओं को विकास के लिए तकनीक आधारित विकास पर जोर देते हुए वर्तनी शोधक तैयार करना चाहिए। हिंदी में तैयार किया गया यह शब्दशोधक केवल पत्रकारिता के लिए ही नहीं बल्कि हिंदी के विकास में भी महत्वपूर्ण भूमिका का निर्वाह करेगा। इस अवसर पर साफ्टवेयर निर्माण दल के सदस्यों सर्वश्री अनुराग सीठा, रवि रतलामी, महेश परिमल एवं मनीष माहेश्वरी ने साफ्टवेयर सीडी का लोकार्पण करते हुए उसके अनुप्रयोग के बारे में प्रस्तुति दी। कार्यक्रम के विशिष्ट अतिथि सूचना एवं प्रसारण मंत्रालय के पूर्व सचिव उदय वर्मा ने कहा कि हिंदी कठिन किंतु वैज्ञानिक भाषा है। ऐसा माना जाता है कि विकसित एवं अविकसित भाषाओं में मुख्य अंतर यह होता है कि विकसित भाषा में कम अक्षर होते हैं हिंदी में अधिक अक्षर होने के बावजूद भी इसका वर्तनी शोधक तैयार कर लेना एक बड़ी उपलब्धि है। साथ ही इसे ओपन सोर्स के तहत जारी करना हिंदी के विकास में एक बड़ा कदम है। अपने अध्यक्षीय संबोधन में कुलपति प्रो. बृज किशोर कुठियाला ने कहा कि हिंदी के विकास एवं विस्तार में अब तकनीकी संसाधन अब महत्वपूर्ण कड़ी बन रहे हैं इसलिए विश्वविद्यालय ने यह साफ्टवेयर तैयार किया है।विश्वविद्यालय की वेबसाइट www.mcu.ac.in पर यह साफ्टवेयर ओपनसोर्स के अंतर्गत उपलब्ध है। हिंदी प्रेमी इसमें आवश्यक सुधार-परिवर्तन करते हुए इसके नए संस्करण तैयार कर हिंदी के विकास में अपना योगदान दे सकते हैं। कार्यक्रम के दौरान डा. अनुराग सीठा ने इस संपूर्ण परियोजना की रूपरेखा रखी एवं इसके अनुप्रयोग के संबंध में बताया। कार्यक्रम का संचालन संजय द्विवेदी एवं आभार प्रदर्शन डा. चैतन्य पुरुषोत्तम अग्रवाल ने किया। इस अवसर हिंदी विश्वविद्यालय के कुलपति प्रो. मोहनलाल छीपा, वरिष्ठ पत्रकार सर्वश्री राजेंद्र शर्मा, गिरीश उपाध्याय, शिवअनुराग पटैरया, रामभुवन सिंह, कुशवाह, हरिमोहन शर्मा, बृजेश राजपूत, दीपक तिवारी, विजय दास, साहित्यकार श्री सुबोध श्रीवास्तव सहित विवि के शिक्षक, अधिकारी, कर्मचारी, छात्र-छात्राएं उपस्थित थे।
(डॉ. पवित्र श्रीवास्तव)
निदेशक, जनसंपर्क प्रकोष्ठ
मा.स.रा.प.सं.वि.वि., भोपाल
माखनलाल चतुर्वेदी विश्वविद्यालय की एक शोध परियोजना के तहत एक नया, बहुआयामी, बहुविकल्पीय व वस्तुतः प्रायोगिक हिंदी वर्तनी परीक्षक सह लेखक सॉफ़्टवेयर जारी किया गया है जिससे कंप्यूटरों में काम करते समय हिंदी के शब्दों को लिखते समय होने वाली वर्तनी त्रुटियों को दूर किया जा सकेगा.
अब आप कंप्यूटरों में काम करते समय अपनी हिंदी की चिंता छोड़ सकते हैं. यानी अब आप अपने कंप्यूटरों में परिशुद्ध हिंदी लिख सकते हैं. सही और शुद्ध वर्तनी वाली हिंदी लिखने में आपकी सहायता के लिए वर्तनी परीक्षक सह लेखक प्रोग्राम का लोकार्पण 25 दिसम्बर 2013 को किया गया. यह सॉफ़्टवेयर प्रोग्राम सभी के डाउनलोड व उपयोग के लिए निःशुल्क जारी किया गया है.
हिंदी कंप्यूटरी के क्षेत्र में अब तक जो भी वर्तनी परीक्षक सॉफ़्टवेयर उपलब्ध थे, उनमें कुछ न कुछ कमियाँ थीं – जैसे कि कुछ में प्रोप्राइटरी फ़ॉन्ट का प्रयोग किया गया है, कुछ अत्यंत महंगे हैं, कुछ केवल ऑनलाइन उपलब्ध हैं, तथा प्रायः सभी में शब्द संख्या कम होने से उनकी प्रायोगिकता अत्यंत सीमित है इत्यादि, जिन्हें इस सॉफ़्टवेयर में दूर करने का प्रयास किया गया है. इस सॉफ़्टवेयर की सबसे बड़ी ख़ूबी यह है कि इसे मुक्तस्रोत सॉफ़्टवेयर लाइसेंस के तहत जारी किया गया है जिसका अर्थ है कि इसका न केवल उपयोग निःशुल्क किया जा सकेगा, बल्कि इसमें आवश्यक सुधार / परिवर्तन आदि किया जा कर इसके अन्य संस्करण तैयार किए जा सकेंगे और उनका भी वितरण मुक्त स्रोत सॉफ़्टवेयर के रूप में किया जा सकेगा.
इस नए हिंदी वर्तनी परीक्षक सह लेखक सॉफ़्टवेयर की कुछ प्रमुख विशेषताएँ हैं –
· यह सॉफ़्टवेयर निःशुल्क, मुक्त स्रोत लाइसेंस (GNU GPL लाइसेंस के अंतर्गत) के तहत जारी किया गया है, जिसे हर कोई निःशुल्क उपयोग व वितरण व आवश्यक बदलाव व सुधार कर वितरण कर सकता है. इसका सोर्स कोड भी निःशुल्क उपयोग व वितरण के लिए उपलब्ध है. इसके स्रोत कोड का उपयोग हिन्दी के अन्य शोधों में बिना किसी मूल्य के किया जा सकेगा क्योंकि वर्तमान में इतनी अधिक विशिष्ट शब्द संख्या का कोई भी हिन्दी डाटाबेस उपलब्ध नहीं है। इस सॉफ़्टवेयर को इंस्टाल करना व उपयोग करना अत्यंत आसान है.
· इसका शब्द भंडार अतिविशाल है, जिससे अब हिंदी वर्तनी परीक्षण प्रायोगिक रूप से सफल हो गया है. अब तक जितने भी वर्तनी परीक्षक उपलब्ध हैं, उनका शब्द भंडार बेहद कम है जिससे कंप्यूटर आधारित वर्तनी परीक्षण का अर्थ आमतौर पर विफल रहता है और प्रायः उनसे कोई प्रतिफल हासिल नहीं होता. इसके शब्द भंडार में आम प्रचलित दो लाख शब्द हैं. और आप इसमें अपने विषयानुरूप विशिष्ट शब्दों को शामिल भी कर सकते हैं. यह आधुनिक, सर्वमान्य यूनिकोड हिंदी फ़ॉन्ट में कार्य करता है.
· इस सॉफ़्टवेयर में लिखते-लिखते वर्तनी जाँचने की सुविधा है जिससे आपको तत्काल ही पता चल जाता है कि वर्तनी गलत लिखी जा रही है, और गलत वर्तनी के शब्द पर क्लिक करने पर सही वर्तनी वाले शब्दों के विकल्प वहीं पर उपलब्ध हो जाते हैं. साथ ही इसमें पहले से तैयार मैटर की वर्तनी जांच भी की जा सकती है.
· इस सॉफ़्टवेयर में लिखते-लिखते वर्तनी जाँच की सुविधा युक्त एक मूलभूत सुविधा वाला हिंदी शब्दसंसाधक (वर्डपैड जैसा वर्ड प्रोसेसर) भी है जिससे आप हिंदी में लिख सकते हैं. साथ ही इसे आप अपने फ़ायरफ़ाक्स ब्राउज़र, थंडरबर्ड ईमेल क्लाएंट अथवा लिब्रे/ओपन ऑफ़िस में भी प्लगइन के रूप में इंस्टाल कर सकते हैं और हिंदी वर्तनी जाँच की सुविधा उनमें भी हासिल कर सकते हैं. इस तरह से यह सॉफ़्टवेयर अतिप्रायोगिक, बहुआयामी और बहुविकल्पीय भी है.
· आवश्यकता होने पर इस हिन्दी वर्तनी शोधक की समृद्ध डिक्शनरी को हिन्दी समर्थन युक्त माइक्रोसॉफ्ट ऑफिस 2003, 2007, 2010 या 2013 में भी प्रयुक्त किया जा करता है.
· इसमें उपयोग में लिए गए प्रोग्रामिंग अल्गोरिद्म पर विशेष ध्यान दिया गया है जिससे हिंदी वर्तनी जाँच कम समय में और त्वरित गति से संभव होता है, साथ ही गलत शब्दों के लिए सही विकल्प भी, विशाल डेटाबेस होने के बाद भी त्वरित उपलब्ध होते हैं, और प्रोग्राम तेज चलता है.
- प्रस्तुत हिन्दी वर्तनी शोधक पहले से प्रयोग किए जा रहे मानक सॉप्टवेयर की वर्तनी शोधक सुविधा के समान ही कार्य करता है जिससे इसका सीखना अत्यंत सरल है.
- यह वर्तनी शोधक इस क्षेत्र में प्रयुक्त अत्यंत प्रभावशाली एवं प्रयोगशील एल्गोरिथ्म पर आधारित है जिसका प्रयोग गूगल, याहू, मोजिला, मैकिन्टोश, ओपनऑफिस, सोलोरिस तथा अन्य कई बड़ी कंपनियॉ अपने सॉप्टवेयर में कर रहीं है.
इसे चलाने के लिए आपके कम्प्यूटर पर निम्न सॉफ्टवेयर होना आवश्यक है-
— विन्डोज एक्स पी (सर्विस पैक 2 के साथ)/ विन्डोज विस्टा/ विन्डोज 7/ विन्डोज 8 हिन्दी भाषा इनपुट सुविधा के साथ (अर्थात यूनिकोड इनेबल तथा हिन्दी इनपुट के लिए आवश्यक कीबोर्ड लेआऊट की हिन्दी आईएमई के साथ)
— डॉट नेट फ्रेमवर्क संस्करण 3.5 (सर्विस पैक 1 के साथ)
— फॉयरफॉक्स ब्राउजर या थंडरबर्ड ई-मेल क्लाइंट (संस्करण 8 या अधिक)
— फॉयरफॉक्स ब्राउजर के एड्रेस बार में data:text/html, <html contenteditable> टाइप करने पर ब्राउजर एक पाठ्य एडीटर में बदल जाता है तथा आप यहॉ हिन्दी में टाइप कर सकते है.
इस सॉफ़्टवेयर को माखनलाल चतुर्वेदी विश्वविद्यालय की वेबसाइट http://mcu.ac.in/Conf_New/Mala.zip से निःशुल्क डाउनलोड कर अपने कंप्यूटर पर इंस्टाल कर सकते हैं.
कृप्या अपने सुझाव निम्न ईमेल पर देवे : malashabad@mcu.ac.in, malashabad@gmail.com.
बहुत खूब !
हटाएंधन्यवाद!
हटाएंअभी अभी डाउनलोड किया।
अवश्य आजमाएंगे।
एक बात मैंने नोट की
Desk top icon में "Hindi Vartani Parishak" लिखा हुआ है।
"Hindi Vartani Parikshak" होना चाहिए था।
नव वर्ष की शुभकामनाएं
जी विश्वनाथ
बेहद जानकारी वाला आलेख है सर.
हटाएंडाउनलोड कर इंस्टाल कर लिया है. पर समझ में नहीं आ रहा है अभी की प्रयोग कैसे करना है.
देखता हूँ.
प्रणाम
हटाएंजानकारीपूर्ण
हटाएंइस शुरूआत के साथ, आने वाले समय में इसमें और सुधार होंगे जो निश्चय ही हिंदी के लिए बहुत अच्छी ख़बर है
हटाएंशब्द-संकलन बड़ा तो है परंतु इसमें कई वर्तनी-अशुद्धी है। लगता है आपने किसी कॉर्पस से शब्दों को सीधा निकाल कर बिना संपादन किए डाल दिया है। जैसे निम्न शब्द गलत हैं फिर भी परीक्षक उसे दिखाता नहीं है:
हटाएं"अँकवारभरना" में दो शब्द हैं "अँकवार भरना"
"अँकसदीया" में दो शब्द हैं "अँकस दिया"
"अँगड़ाईतोड़ना" में दो शब्द हैं "अँगड़ाई तोड़ना"
"अँधेराउजाला" में दो शब्द हैं "अँधेरा उजाला"
"गड्डामीजूता" में दो शब्द हैं "गड्डामी जूता"
"गड्डामीबोली" में दो शब्द हैं "गड्डामी बोली"
"गिटपिटकरना" में दो शब्द हैं "गिटपिट करना"
"गिटपिटबोली" में दो शब्द हैं "गिटपिट बोली"
"गिटपिटभाषा" में दो शब्द हैं "गिटपिट भाषा"
"हौसलानिकालना" में दो शब्द हैं "हौसला निकालना"
"हौसलापश्त" में दो शब्द हैं "हौसला पश्त"
अर्थात यदि इन शब्दों को हम लिखें तो परीक्षक इसे गलत चिह्नित नहीं करता है। यदि इन दो लाख शब्दों की वर्तनी अशुद्धियों को सही कर दिया जाय तो अवश्य ही यह हिन्दी के ओपेन सोर्स क्षेत्र में महती कार्य होगा।
लिंक नहीं खुल रहा... इस वर्तनी जांचक के लिए कोई और लिंक हो तो कृपया सूचित करें ।
हटाएं