. एक और सरकारी मंत्र? **-** सरकारी उपक्रम सीडॅक द्वारा अंग्रेज़ी से हिन्दी में स्वचालित अनुवाद करने वाले सॉफ़्टवेयर ‘मंत्र' (या मंत्रा?)...
.
एक और सरकारी मंत्र?
**-**

सरकारी उपक्रम सीडॅक द्वारा अंग्रेज़ी से हिन्दी में स्वचालित अनुवाद करने वाले सॉफ़्टवेयर ‘मंत्र' (या मंत्रा?) का लोकार्पण - आम जनता के मुफ़्त इस्तेमाल हेतु - बहुत ही धूमधाम से पिछले दिनों किया गया. धूमधाम से इसलिए कि उसका लोकार्पण भारत के (वर्तमान) सत्ताधारी नेताओं द्वारा किया गया. कम्प्यूटरों की दुनिया में सॉफ़्टवेयरों का लोकार्पण नेताओं के द्वारा किया जाना, मेरे खयाल में सिर्फ भारत जैसे अनूठे देशों में ही संभव हो पाता होगा.
अभी माइक्रोसॉफ़्ट ने दिल्ली में एक्सबॉक्स 360 को जारी किया. एक रंगारंग समारोह में अक्षय कुमार ने उसे जारी किया. जनता को पता चला कि एक्सबॉक्स 360 भी क्या चीज है. जब भारत सरकार के मंत्री ने मंत्र को जारी किया तो शायद जनता ने समझा होगा कि यह भी शायद गरीबी हटाओ जैसी कोई योजना का मंत्र है जिसे आम जनता के लिए जारी किया गया है. परंतु यह आम जन तक नहीं पहुँच पाया - जनता ने समझ लिया होगा कि शायद यह ‘प्रीमियम' पर कालाबाजारियों को उपलब्ध हो जाता होगा - राशन के केरोसीन और अनाज की तरह...
चलिए, अपने को लोकार्पण के तौर तरीकों से क्या? ‘मंत्र' लोकों में बढ़िया चले अपुन को इससे मतलब है. वैसे भी, आम खाने से मतलब होना चाहिए, न कि उनकी गुठलियाँ गिनने और छिलके के रंग की मीमांसा करने से.
इस परियोजना से सृजनशिल्पी जी भी जुड़े रहे हैं - जिन्होंने इस सॉफ़्टवेयर में अनुवादों में हिन्दी वर्तनी जाँच के महत्वपूर्ण कार्य किए हैं, और अभी भी कोई दो लाख शब्दों की वर्तनी जाँच के महत्वपूर्ण कार्य में लगे हुए हैं. मंत्र सॉफ़्टवेयर की जाँच के दौरान यह पाया गया कि हिन्दी में मात्रा व वर्तनी की ग़लतियाँ नगण्य ही हैं. इसके लिए सृजनशिल्पी व उनकी टोली बधाई के पात्र हैं.
‘मंत्र' को जाँच-परख कर चलाकर देखने की और काम में लेने की मेरी ख्वाहिश, जिस दिन से यह समाचार सुना था, तब से थी. मैंने तुरंत ही उस सॉफ़्टवेयर को डाउनलोड करने की कोशिश की, जिसकी कड़ी सृजनशिल्पी जी ने उपलब्ध करवाई थी. जिस स्थल से डाउनलोड करना था, वहाँ कड़ी ठीक से दिखाई नहीं दे पा रही थी और दरअसल पंजीकरण के उपरांत वास्तविक डाउनलोड कड़ी आपके ईमेल में प्राप्त होती थी. किसी वजह से आपका डाउनलोड टूट जाता है तो आपको नए सिरे से पंजीकरण करवाना पड़ता है क्योंकि वह कड़ी सिर्फ एक बार डाउनलोड हेतु उपलब्ध होती है. जैसे तैसे दो-तीन बार के प्रयासों से अंततः मैंने मंत्र को डाउनलोड करने में सफलता प्राप्त कर ही ली.

अब बारी आई संस्थापना की. विंडोज़ एक्स पी पर संस्थापित करने के दौरान यह बीच में ही अटक गया. संस्थापना संवाद में यह बताया गया कि आपके कंप्यूटर पर ‘एमएसएसक्यूएल संस्करण 7' संस्थापित नहीं है अतः मंत्र आपके तंत्र पर संस्थापित नहीं हो सकता. यानी कि एक मुफ़्त सॉफ़्टवेयर मंत्र को चलाने के लिए आपको मुफ़्त डाटाबेस सर्वर ‘माईएसक्यूएल' की जगह बिल्लू भाई के स्वामित्व वाली एमएसएसक्यूएल सर्वर चाहिए होगा जो कि हजारों रुपए में मिलता है. एमएसएसक्यूएल मेरे पास तो था नहीं, लिहाजा मंत्र की जाँच अटकी पड़ी रही. 45 मेगाबाइट डाउनलोड, जिसके लिए मेरे एडसेंस से अर्जित किए गए खरी कमाई के, प्रति मेगाबाइट रुपए 1.20 के हिसाब से पैसे लग चुके थे, बेकार ही पड़े हुए मेरा मुँह चिढ़ा रहे थे.
.
.
मैंने आसपास तलाश करने की कोशिश की. पता चला कि कंप्यूटर सिखाने वाली संस्था के पास एमएसएसक्यूएल संस्करण 7 संस्थापित है जिससे वह विद्यार्थियों को पढ़ाता है. मैंने यह जानने की कोशिश नहीं कि उसका संस्करण असली है या नकली. प्रारंभ में वह भी आशंकित सा हो रहा था, परंतु जब मैं उनके पास गया और मंत्र के कसीदे पढ़े कि यह सॉफ़्टवेयर आपके अंग्रेज़ी पाठों को हिन्दी में बदलने की क्षमता रखता है और आप भी इसका मुफ़्त इस्तेमाल कर सकते हैं चूँकि यह सबके लिए मुफ़्त जारी किया गया है, तब आरंभिक संकोच व उहापोह के बाद अंततः उनके कंप्यूटर पर मंत्र के जाँच की सहमति बन ही गई.
मंत्र को संस्थापित करने के लिए कंप्यूटर पर पहले से ही संस्थापित होना आवश्यक है यह तो पता ही था. इस कंप्यूटर पर जिसमें एमएसएसक्यूएल संस्करण 7 पहले से संस्थापित था, मंत्र का पहला चरण तो सही संस्थापित हो गया. दूसरे चरण में डाटाबेस कॉन्फ़िगुरेशन करते समय मंत्र ने एमएसएसक्यूएल के उपयोक्ता sa का पासवर्ड पूछा. यह क्या? यह तो एमएसएसक्यूएल संरक्षित उपयोक्ता होता है. परंतु चलिए, ढूंढ ढांढकर इसका भी पासवर्ड नया बनाकर दिया गया. और, इस तरह अंततः मंत्र संस्थापित हो ही गया.
मंत्र को चालू कर एक छोटे से अंग्रेज़ी पाठ को अंग्रेज़ी से हिन्दी में अनुवाद करने के निर्देश दिए गए. परंतु यह क्या? जो हिन्दी इसने दिखानी चाही वह विंडोज98 पर दिखाई देने वाले खंडित यूनिकोड हिन्दी जैसा दिख रहा था. मामले की तह पर पहुँचे तो पता चला कि इनकी हिन्दी ‘इस्की' हिन्दी है - लीप ऑफ़िस में प्रयुक्त होने वाली हिन्दी. यानी कि हिन्दी यूनिकोड में नहीं. यूनिकोड हिन्दी का इस्तेमाल करने के लिए आपको इसके द्वारा अनुवादित पाठ को अन्य किसी बाहरी औजार के जरिए यूनिकोड में बदलना पड़ेगा. आज के इंटरनेट युग में हिन्दी के समुचित उपयोग के लिए यूनिकोड हिन्दी तो प्रथम आवश्यकता है - सीडॅक - कब सीखोगे? जब दुनिया बहुत आगे निकल चुकी होगी?.
ठीक है, हम बाहरी औजार की सेवा से अनुवादित हिन्दी का भी बखूबी इस्तेमाल कर सकते हैं - बशर्तें अनुवादित हिन्दी बढ़िया हो. बढ़िया ? और वह भी मशीनी, कम्प्यूटरी - स्वचालित अनुवाद से? ठीक है, ठीक है, कामचलाऊ अनुवाद भी चलेगा, और आवश्यकतानुसार हम उसे संपादित कर बढ़िया बना लेंगे.
तो उस कचरा दिखाई दे रही हिन्दी को लीप फ़ॉन्ट संस्थापित कर देखा गया. हिन्दी तो बढ़िया दिखाई दे रही थी, परंतु अनुवाद?

अनुवाद कैसा है यह तो आप, पाठक - तय करें. कुछ अनुवादों के स्क्रीनशॉट इस लेख में हैं. चित्रों को पूरे, बड़े आकार में देखने के लिए चित्र पर क्लिक करें.
मुझे तो लगता है कि ‘मंत्र' को आम उपयोग में आने में अभी बहुत समय लगेगा - अच्छा खासा समय लगेगा. हाँ, इसकी एक बात अच्छी है - आप इसे अपने अनुसार प्रशिक्षित कर सकते हैं, और अगर इसके डाटाबेस में यदि कोई अंग्रेज़ी पाठ इसके हिन्दी अनुवाद सहित उपलब्ध होता है तो यह पूर्णतः शुद्ध अनुवाद करता है. अन्यथा आपने स्वचालित अनुवाद का हास्यास्पद रूप देखा ही है - My name is Ravi को ‘अपनी नाम रावी है' तथा I am six years old को ‘मैं पूर्वाह्न छः पुराने वर्षों' अनुवादित करता है!
**-**
कमाल का सोफ्टवेर बनाया हैं, जनता के रूपैये फूँक कर. एक सरल-सहज स्थापना के बाद अद्भुत अनुवाद.
जवाब देंहटाएंहास्य रचनाओं की कमी हो जाने पर इससे अनुवाद करो, पढ़ो और हँसो. यही हैं मंत्रा का मंत्र.
सुखी हुआ. दुखी हुआ .
जवाब देंहटाएंरवि दद्दा
जवाब देंहटाएंआपने सृजन शिल्पी की चिकाही की है या बढ़ाई?
भगवान सरकारी तंत्र से हिन्दी को बचाये। आपकी समीक्शा से बहुत से लोगों को फायदा होगा, शायद सी-डैक के भी कान में यह बात पहुँचे..
जवाब देंहटाएंरवि भाई, आपका यह लेख मैं पहले नहीं पढ़ पाया था। मंत्र-राजभाषा के जिस संस्करण का आपने ट्रायल किया है, उसका परीक्षण तो मैंने भी स्वयं नहीं किया है अभी तक। हाँ, इसका प्रदर्शन मैंने देखा जरूर है सी-डैक की टीम द्वारा। मैं इसके उन्नत संस्करण (मंत्र-राज्य सभा) का प्रयोग करता रहा हूँ, जिसमें दिन ब दिन सुधार आता जा रहा है और हमलोग अब इसके अनुवाद को संसद के कामकाज में इस्तेमाल भी करने लगे हैं। फिर भी, कुछ बातें ध्यान में रखा जाना जरूरी है। जैसे कि मंत्र डोमेन-सापेक्ष अनुवाद करता है। मसलन वह जिस डोमेन के लिए बनाया गया है उसी की शब्दावली को बेहतर ढंग से अनुवाद कर पाता है। दूसरा, मंत्र जिस सिस्टम पर स्थापित किया गया हो, उसका कंफिगरेशन अच्छा होना चाहिए, खासकर रैम, क्योंकि प्रोसेसिंग बहुत करनी पड़ती है सिस्टम को। तीसरा, मंत्र के सही प्रयोग के लिए प्रयोक्ता को कुछ अवधि तक प्रशिक्षण लेना भी जरूरी है।
जवाब देंहटाएंआपके इस लेख ने मुझे अपने पुराने वायदे को पूरा करने के लिए विवश कर दिया है जिसमें मैंने मंत्र की कार्यप्रणाली के बारे में निरंतर के अगले अंक में लेख भेजने की बात की थी।
मंत्र का राज्य सभा वाला संस्करण अब हास्यास्पद अनुवाद के स्तर से अब कई वर्ष आगे आ चुका है। मैं इसके कुछ नमूने अपने लेख में शामिल करने का प्रयास करूँगा।
जहाँ तक इस मुफ्त उपलब्ध संस्करण की बात है इस पर आप जैसे लगभग 1500 लोगों ने अनुवाद के ट्रायल किए हैं, सी-डैक का स्टाफ ऑनलाइन अनुवाद के आउटपुट का विश्लेषण करता रहता है। इस तरह के ट्रायल से सी-डैक वालों को सुविधा होगी आगे सुधार करने में।
मैं तो एक उत्साही प्रयोगकर्ता के रूप में ही इस परियोजना से जुड़ा रहा हूँ और मेरी कोशिश रही है इस सिस्टम को सही अनुवाद करने में समर्थ बनाने की। चूँकि यह सिस्टम कृत्रिम बुद्धि पर आधारित है, मंत्र को पहले अपनी बुद्धि देकर तैयार करना पड़ता है, फिर यह आपकी सहायता करता है।
इसका ऑनलाइन संस्करण तो यूनिकोडित हिन्दी में ही आउटपुट देता है। इसमें इंकोडिंग बदलकर यूनिकोड फोण्ट में आउटपुट लेने का विकल्प भी मौजूद है।
सृजन शिल्पी जी,
जवाब देंहटाएंनिसंदेह यह अनुप्रयोग बहुत मेहनत से बना है, और मैंने इसमें लगे मेहनत की तारीफ़ भी की है. खासकर हिन्दी के वर्तनी इत्यादि कि.
मैंने आलोचना इस सॉफ़्टवेयर के आर्कीटेक्ट की की है, जो कि आधुनिक तो बिलकुल नहीं है. हो सकता है मेरे द्वारा डाउनलोड किए सॉफ़्टवेयर डाटाबेस पूरा नहीं हो, जिसके कारण यह अनुवादों को सही नहीं बताता है.