अरविंद कुमार का आलेख - सूचना प्रौद्योगिकी और कोशकारिता

clip_image002

अरविंद कुमार

चौरासी-वर्षीय अरविंद कुमार (जन्म - 17 जनवरी 1930) ने 1996 में समांतर कोश के प्रकाशन से हिंदी ही नहीं पूरे भारत को आधुनिक थिसारसों से परिचित कराया. उन के कुछ अन्य कोश हैं : देवीदेवताओं के नामों का थिसारस शब्देश्वरी, अकारादि क्रम से आयोजित पहला भारतीय थिसारस अरविंद सहज समांतर कोश, तीन खंडों वाला और संसार का विशालतम द्विभाषी द पेंगुइन इंग्लिश-हिंदी/हिंदी-इंग्लिश थिसारस ऐंड डिक्शनरी, और अब समांतर कोश का परिवर्धित परिष्कृत संस्करण बृहत् समांतर कोश. इंटरनैट पर उपलब्ध द्विभाषी शब्दकोश और थिसारस अरविंद लैक्सिकन. ये सभी कोश उन के ग्यारह लाख अभिव्यक्तियों के द्विभाषी डाटा बेस में से संकलित हैं. इस डाटा में संसार की सभी भाषाओं को समाने की क्षमता है.

 

सूचना प्रौद्योगिकी और कोशकारिता

मनुष्य की सब से बड़ी उपलब्धि – भाषा

अरविंद कुमार, अरविंद लिंग्विस्टिक्स प्रा लि, ई-28 प्रथम तल, कालिंदी कालोनी, नई दिल्ली 110025 (भारत)

 

ईमेल – arvind@arvindlexicon.comsamantarkosh@gmail.com

वैबसाइट – www.arvindlexicon.com

भाषा के आविष्कार को हम संप्रेषण के क्षेत्र में और सूचना प्रौद्योगिकी की ओर मानव का पहला और क्रांतिकारी चरण कह सकते हैं. भाषा न होती तो मनुष्य आज भी प्रस्तर युग में रह रहा होता. निस्संदेह शब्दों से बनी भाषा मनुष्य की सब से बड़ी उपलब्धि है, प्रगति का साधन और ज्ञान विज्ञान का भंडार है. भाषा एक निरंतर विकासशील और परिवर्तनशील प्रक्रिया है. भाषा ने ही मनुष्य को गूढ़ दार्शनिक विचारों की क्षमता प्रदान की.

सूचना प्रौद्योगिकी की पहली जैव मशीन और स्मृति चिप

भारत को और संस्कृत भाषा को संसार के सब से पहले दार्शनिक ग्रंथ वेदों का रचयिता होने का गौरव प्राप्त हुआ. आरंभ में वेद मौखिक थे. वेदों के एक एक शब्द का सही उच्चारण और हर शब्द का सही अर्थ पीढ़ी दर पीढ़ी सुरक्षित रखने के लिए एक नितांत अनोखी प्रणाली विकसित की गई - समाज का एक पूरा वर्ग इस महा उद्यम के लिए मनोनीत कर दिया गया! इस वर्ग को सूचना प्रौद्योगिकी की पहली जैव मशीन और स्मृति चिप कहना अनुचित न होगा.

तभी से शब्दों के संकलन और कोश निर्माण की आवश्यकता का महत्व सर्वमान्य हो गया था. संसार के पहले कोश निघंटु की रचना वैदिक काल में ही हुई. इस थिसारस में अठारह सौ वैदिक शब्दों को विषय क्रम से संकलित किया गया था. इस की रचना का श्रेय प्रजापति कश्यप को दिया जाता है. महर्षि यास्क ने निरुक्त में निघंटु के तथा अन्य वैदिक शब्दों की विशद व्याख्या की. यह संसार का पहला शब्दार्थ कोश और तत्कालीन समाज का विश्वकोश यानी ऐनसाइक्लोपीडिया है

लिपि का अन्वेषण

लिपि का अन्वेषण भाषाओं के विकास का अगला युगांतरकारी चरण था. मिस्र की जन और धर्म लिपियां, तथा चीन और जापान की चित्र लिपियां प्रतीकों पर आधारित थीं. उन से आगे बढ़ कर यूरोप और मध्य एशिया की ग्रीक, सिरिलिक, रोमन और हिब्रू लिपियां अक्षरों पर आधारित थीं. उन्हीं की तरह की लेकिन दाहिने से बाएँ लिखी जाने वाली अक्षर लिपि खरोष्ठी का प्रादुर्भाव गांधार में हुआ. अरबी, फ़ारसी और उर्दू जैसी लिपियां इसी से निकली मानी जाती हैं. इन सभी अक्षर लिपियों में प्रत्येक वर्ण किसी ध्वनि का प्रतीक तो होता है, लेकिन कई स्वरों और व्यंजनों का उच्चारण परिवर्तनशील होता है, जैसे रोमन के ‘सी’ या ‘जी’ अक्षर. यही नहीं इन की वर्णमालाओं में वर्णों का कोई पारस्परिक सुनिश्चित वैज्ञानिक क्रम भी नहीं है.

ब्राह्मी लिपि का प्रादुर्भाव भारत की एक और महान देन था. इस में हर वर्ण का उच्चारण सुनिश्चित था. पाणिनी ने ब्राह्मी लिपि के सभी स्वरों ‘अआइईउऊऋॠलृलॣएऐओअंअः’ और व्यंजनों को ‘कवर्ग, चवर्ग आदि कचटप’ वर्गों में और उन के बाद के ‘यरलव’ और ‘शषसह’ क्रम से संकलित कर के वर्णमाला को वाचा तंत्र में उच्चारणानुसार सुनिश्चित आधार प्रदान किया. इस से निकली देवनागरी आदि भारतीय लिपि परिवार की तिब्बती से थाई तक सर्वाधिक वैज्ञानिक लिपियों में गिनी जाती हैं.

अमरकोश की रचना

लिपि काल में बने कोशों में शिरोमणि ग्रंथ के तौर पर आया - अमरसिंह कृत नामलिंगानुशासन या त्रिकांड. अपनी विलक्षणता के कारण आरंभ से ही यह थिसारस अपने रचेता के नाम परअमरकोश ही कहा जाता है, ठीक वैसे ही जैसे आजकल अँगरेजी का थिसारस अपने तमाम संस्‍करणोँ और प्रकारांतरों के बावजूद रोजेट्स थिसारस ही कहा जाता है. उस काल में हस्तलिखित प्रतिलिपियां आसानी से नहीं मिलती थीं. इसलिए सभी छात्रों को ग्रंथ कंठस्थ करने होते थे. स्मरण में सुविधा के लिए ऐसे सभी कोश छंदबद्ध होते थे. किसी श्लोक का एक पद या शब्द याद आते ही तत्संबंधी पूरा प्रकरण ज़बान पर आ जाता था. इस तरह याददाश्त ही अनुक्रम खंड का काम करती थी.

अमरकोश में 8000 (आठ हज़ार) शब्दों को 1502 (एक हज़ार पांच सौ दो) श्‍लोकोँ में पद्यबद्ध किया गया है. ये श्‍लोक तीन कांडोँ में विभाजित हैँ, जिन में कुल मिला कर 25 वर्ग हैँ. इन में से चार वर्ग मानव समाज से संबंधित हैं और उन का क्रम ब्राह्मण, क्षत्रिय, वैश्य और शूद्र वर्णों के क्रम से रखा गया है. हर विषय अपने से संबद्ध या विपरीत विषय की ओर ले जाता है.

अमरकोश की शैली से प्रभावित हो कर ही अमीर खुसरो ने फ़ारसी में द्विभाषी कोश (फ़ारसी-हिंदी) ख़ालिक़बारी की रचना की. यह संसार का पहला द्विभाषी थिसारस है. इस में हिंदी के साथ साथ अरबी फ़ारसी के शब्द समूह विषय क्रम से आते थे.

हाथ से बनी प्रतिलिपियों में अशुद्धियां रह जाती थीं. हस्तलिखित होने के कारण वे बड़ी संख्या में उपलब्ध नहीं हो सकती थीं, और बहुत महँगी भी होती थीं.

मुद्रण तकनीक का आविर्भाव

लिपि के अन्वेषण के बाद सब से बड़ी क्रांति हुई जर्मनी में जोहानिस गुटेनबर्ग द्वारा 1450 में मुद्रण तकनीक का आरंभ. तब और आजकल भी कई छापेख़ानों में छपने वाली सामग्री नीचे एक सपाट धरातल पर रखी जाती थी, उस पर स्याही लगा कर ऊपर काग़ज़ रखा जाता था. एक सपाट फलक को ऊपर से नीचे ला कर काग़ज़ पर छाप डाली जाती थी. यह काम दाब या प्रैस से होता था, इसलिए इस का नाम प्रिंटिग ‘प्रैस’ पड़ा. हिंदी में भी छाप डालने के कारण यह छापाख़ाना कहलाता है.

अब किताबें आसानी से मिलने लगीं और जानकारी का संप्रेषण एक साथ कई क़दम आगे बढ़ गया. तब से अब छापेख़ाने में होने वाले सुधारों के साथ विविध विषयों पर तरह तरह की किताबें आम आदमी तक पहुँचना और भी आसान होता गया. पहली पहली किताबें धार्मिक थीं, जैसे बाइबिल. बाद में कुछ दंतकथाएँ और रहस्य कथाएँ छपनी शुरू हुईं. साहित्य का नंबर बाद में आया. धीरे धीरे कोश छपने लगे. इंग्लैंड में सन 1755 में सैमुअल जानसन का पहला इंग्लिश कोश ए डिक्शनरी आफ़ द इंग्लिश लैंग्वेज छपा. सन 1828 में इस से कहीं आगे बढ़ कर और बड़ा नोहा वैब्स्टर का ऐन अमेरीकन डिक्शनरी आफ़ द इंग्लिश लैंग्वेज छपा.

clip_image004

अमेरिकी नेता बेंजमिन फ़्रैंकलिन के प्रैस में एक मशीन

शब्द कल्पद्रुम तथा अन्य कोश

भारत में भी आरंभ में छपी पुस्तकें बाइबिल के अनुवाद थे. बात न तो यहाँ रुक सकती थी, न रुक पाई. भारतीय अस्मिता ने शीघ्र ही अपनी संस्कृति को छापेख़ाने तक लाना शुरू कर दिया. भारतीय साहित्य लोगों तक पहुँचाया जाने लगा. मैं बात कोशों तक ही सीमित रखूँगा. कुछ बहुत महत्वपूर्ण मुद्रित भारतीय (संस्कृत तथा हिंदी और इंग्लिश) कोश इस प्रकार हैं:

­ शब्द कल्पद्रुम (संस्कृत कोश - आठ खंड). राजा राधाकांत देव. पहला भाग 1822 - आठवाँ अंतिम 1856.

­ संस्कृत-इंग्लिश डिक्शनरी. सर मोनिअर मोनिअर-विलियम्स. 1872.

­ अ प्रैक्टिकल संस्कृत-इंग्लिश डिक्शनरी. वामन शिवराम आप्टे. 1889.

­ संस्कृत-हिन्दी कोश. वामन शिवराम आप्टे.

­ हिंदी शब्द सागर (ग्यारह खंड). श्याम सुंदर दास. काशी नागरी प्रचारिणी सभा.

­ बृहत् हिंदी कोश. ज्ञानमंडल वाराणसी. पहला संस्करण 1954-55. तब से इस के कई संस्करण होते रहे हैं. अनेक प्रधान संपादक. मेरी राय में हिंदी वर्तनी के लिए यह मानक कोश है. अरबी फ़ारसी शब्दों के नुक़्ते इस के मुखशब्द में बोल्ड टाइप के कारण नहीं छपे हैं, लेकिन लाइट टाइप में हैं. नुक़्ते वाले शब्दों के लिए प्रामाणिक कोश है -

­ उर्दू-हिन्दी शब्द कोश. मुहम्मद मुस्तफ़ा ख़ाँ 'मद्दाह'. हिंदी समिति, सूचना विभाग, उत्तर प्रदेश, लखनऊ.

­ हिन्दी विश्वकोश. कमलापति त्रिपाठी तथा सुधाकर पांडेय. काशी नागरी प्रचारिणी सभा.

­ Comprehensive English-Hindi Dictionary. डाक्टर रघुवीर.

­ केंद्रीय हिंदी निदेशालय के बीसियोँ तकनीकी शब्दकोश.

­ अँग्रेज़ी-हिन्दी कोश. फ़ादर कामिल बुल्के.

­ इंग्लिश-हिंदी कोश. डाक्टर हरदेव बाहरी.

­ मीनाक्षी हिंदी-अँगरेजी कोश. डा. ब्रजमोहन - डा. बदरीनाथ कपूर.

­ Oxford Hindi-English Dictionary. आर.ऐस. मैकग्रेगर.

अब मैं अपने कोशों की बात करता हूँ – ये आधुनिक भारत के पहले थिसारस हैं.

कोश और थिसारस के क्षेत्र अलग अलग हैं. कोश शब्द को अर्थ देता है, थिसारस अर्थ को, विचार को, एक नहीँ अनेक शब्द देता है. कोश में हर शब्द अकारादि क्रम से छपा होता, जैसे:कक्ष, कक्षा, कगार.

थिसारस में शब्दों का संकलन अकारादि क्रम से न हो कर कोटि क्रम से होता है, जैसे इंद्रिय के बाद ज्ञानेंद्रिय, कर्मेंद्रिय या फिर कड़वा स्वाद के बाद कसैला स्वाद, खट्टा स्वाद, चरपरा स्वाद, नमकीन स्वाद और मीठा स्वाद. यह शब्दों के अर्थ तो नहीं देता, लेकिन किसी एक शब्द के अनेक पर्यायवाचियों से शब्द का अर्थ समझ में आ जाता है,

समांतर कोश बनाने की प्रेरणा मुझे रोजेट के थिसारस से मिली थी. तो 1973 में प्राथमिक अभ्यास या रिहर्सल के तौर पर मैं ने उसी के क्रम को अपनाने का फ़ैसला किया. सौभाग्य से अच्छी बात यह हुई कि मैं ने शब्दों के पर्याय याददाश्त के आधार पर न लिख कर, ज्ञानमंडल के बृहत् हिंदी कोश के पहले से अंतिम पन्ने तक एक एक शब्द पढ़ कर रोजेट की आर्थी कोटियों में फ़िट करने की नीति बनाई. इस दो कारण थे – 1) मैं भी अपनी याददाश्त मात्र के भरोसे नहीं रहना चाहता था. 2) मैं अपने थिसारस को पूरी तरह प्रामाणिक बनाना चाहता था. मैं ने इस कोश के अतिरिक्त कई विषयों के कोशों और पुस्तकों को भी अपने शब्दों के स्रोत के तौर पर इस्तेमाल किया.

जल्दी ही पता चल गया कि रोजेट का माडल मेरे काम का नहीं है. हिंदी की बहुत सारी कोटियोँ के लिए उस में जगह ही नहीँ थी. अब हमें अपना कोटि क्रम या संदर्भ क्रम बनाना था. करते करते सीखने के अलावा हमारे पास कोई उपाय नहीँ था. कम से कम पाँच बार हमें नए रास्ते अपनाने पड़े. 1973 से 1992 तक पूरे बीस साल बीतते बीतते, हमें लगा हम किसी कामचलाऊ क्रम तक पहुँच रहे हैँ. तब तक साठ हज़ार कार्डों पर हम लगभग दो लाख साठ हज़ार शब्द या अभिव्यक्तियां या रिकार्ड दर्ज़ कर चुके थे. एक शब्द या अभिव्यक्तियां या रिकार्ड का मतलब एक शब्द नहीँ एक पूरा वाक्यांश या मुहाविरा भी है.

इस तरह से काम करते करते कई समस्याएं खड़ी हो जाती थीं. पहली थी कि कई बार हम पहले किया काम फिर से दोहराने लगते थे – क्योंकि सारा काम याद रख पाना आसान नहीं था. पहले भी यह काम कर चुके हैं, यह जाँचने का कोई तरीक़ा नहीं था.

इस से भी बड़ी समस्या छपाई की थी जो मेरे सामने हर दिन सुरसा की तरह मुँह बाए खड़ी रहती. मैं छापेख़ाने में काम कर चुका था. छापेख़ाने में जो समस्याएँ आती हैं, उन का ध्यान आते ही मेरे रोंगटे खड़े हो जाते.

पहले हमारे कार्ड टाइपिस्टोँ को दिए जाएंगे. उन से कई कार्ड खो भी सकते हैं, और उन का क्रम भी बिगड़ सकता है. टाइपिस्ट बीच बीच में से कई शब्द ग़लत टाइप कर जाते हैं, कई शब्द और पंक्तियाँ टाइप करना भूल जाते हैं और कई पंक्तियां दोबारा टाइप कर जाते हैं. मैं टाइप किए दो लाख साठ हज़ार शब्दों को पढ़ूँगा, उन की ग़लतियां ठीक कराऊंगा. कई पेज कई बार टाइप कराने पड़ सकते हैं. हर बार नई ग़लतियां होने की संभावना रहेगी. फिर टाइप शीट छापेख़ाने में कंपोज़िंग के लिए जाएंगी. वहाँ बार बार उन की प्रूफ़ रीडिंग करानी होगी. सैकड़ों पेजों का कंपोज़्ड मैटर प्रैस वाला रखेगा कहाँ. उन दिनों छपाई के लिए मशीन पर जाने से पहले कई बार पेज टूट जाते थे. तब क्या होगा. वे पेज फिर से कंपोज़ करवाने और प्रूफ़ पढ़ने होँगे. हर शीर्षक और उपशीर्षक की एकोत्तर संख्या मैनुअली लिखते समय सही क्रम का अनुपालन हो पाएगा या नहीँ - यह समस्या भी रहेगी.

अनुक्रम बनाने की समस्या तो और भी जटिल थी. पूरा संदर्भ खंड छप जाने के बाद उस के एक एक शब्द को अकारादि क्रम से लिखने और उन की शीर्षक तथा उपशीर्षक संख्या लिखना - तौबा! यह मेरे बस का काम नहीं था. दूसरों से बनवाएं, तो उन्हें देने का पैसा कहाँ से आएगा, और वे सब संख्याएं सही लिखेंगे भी या नहीं, फिर प्रैस में कंपोज़िंग में कितनी ज़्यादा ग़लतियां होंगी – यह कौन जाँचेगा. यही सब सोच सोच कर मुझे दिन रात बुख़ार सा चढ़ा रहता था.

1992 में मेरे बेटे डाक्टर सुमीत कुमार ने कहा -

इन सभी समस्याओं का एकमात्र हल है कंप्यूटर – यानी सूचना प्रौद्योगिकी.”

सूचना प्रौद्योगिकी और कोशकारिता

कंप्यूटर को हिंदी में संगणक कहा जाता है. गणना करने की यह मशीन कोई भाषा नहीं, केवल दो संख्याएँ जानती है – 1 और 0. हर डाटा, चाहे वह बैंक का ख़ाता हो, सरकारी रिकार्ड हो, किताब हो या चित्र हो या फ़िल्म या फिर ध्वनि हो - कंप्यूटर के लिए बस इन दो संख्याओं से बनी शृंखला मात्र हैं. उन दिनों (1992) कंप्यूटिंग कुल छह-सात बिट तक सीमित थी. कुछ ही महीनों में आठ बिट तक जाने वाली थी. आजकल की सोलह, बत्तीस, चौसठ और एक सौ अट्ठाईस बिट वाली कंप्यूटिंग का कहीं अतापता नहीं था.

सूचना प्रौद्योगिकी से तात्पर्य है कंप्यूटर हार्डवेयर एवं साफ़्टवेअर के अनुप्रयोग से आँकड़ों का संकलन, प्रबंधन, संपादन, सुरक्षण, परिवर्तन, पुनर्प्राप्ति और मैनिपुलेशन द्वारा वांछित रूप में आउटपुट अथवा उस के द्वारा प्रदत्त आदेशों के द्वारा काररवाई या फिर दूर संचार माध्यमों (जैसे ईमेल, इंटरनैट आदि) से विश्व स्तर पर सूचना का आदानप्रदान.

डाटा का मैनिपुलेशन क्या होता है, किसी एक डाटा से किस तरह के आउटपुट लिए जा सकते हैं, यह दरशाने के लिए ग्राफ़िक दिखाए बिना बात समझाई नहीं जा सकती. मैं ने सभी ग्राफ़िक अपने कोश के ऐमऐस ऐक्सैस वाले डाटा से लिए हैं. हर चित्र के लिए एक शब्दकोटि – सफलता – को चुना है, ताकि बात आसानी से समझ में आ जाए.

सुमीत ने तय किया कि थिसारस बनाने के लिए डाटाबेस बनाना होगा. तब हिंदी में डाटाबेस बनाने की परिकल्पना तक किसी ने नहीं की थी. उन दिनों कंप्यूटर के लिए आरंभिक क़िस्म के हिंदी फ़ोंटों से टाइपसैटिंग तो होती थी, लेकिन डाटाबेस नहीँ बन सकते थे. पता चला कि कुछ महीने पहले पुणेँ स्थित सी-डैक की ओर से जिस्ट कार्ड (GIST card) नाम का उपकरण बनाया है. इस की सहायता से ब्राह्मी आधारित सभी लिपियोँ में डाटाबेस बन सकता है. इसे कहते हैं तकनीक और विचार का संगम और सुसंयोग! सही समय पर सही कर्मियोँ के हाथ सही तकनीक लग जाना!

काफ़ी बड़े लिखित डाटा के साथ हम तैयार थे. तकनीक भी बन गई थी. देरी किए बग़ैर हम ने जिस्ट कार्ड ख़रीद लिया और फ़ाक्स-प्रो (Fox-Pro) में हमारी आवश्यकताओं के अनुरूप प्रविधि सुमीत ने स्वयं लिखनी शुरू कर दी. अब तलाश थी दक्ष कंप्यूटर टाइपिस्ट की जो हमारे विशाल शब्द भंडार को डाटाबेस में डाल सके. वह भी मिल गया - दलीप. वह दिन भर शब्द डालता, रात में कुसुम प्रिंट आउटों पर प्रूफ़ रीडिंग कर के अगली सुबह करक्शन कराती रहतीं, मैं अगले दिन के काम के कार्ड छांट कर दलीप के लिए तैयार रखता. ग्यारह महीनों में यह पड़ाव पूरा हो गया.

अब मेरी बारी थी और शब्द डालने की. सन 73 से 93 तक जितने शब्द हम ने संकलित किए और डाटा में डलवाए थे लगभग उतने ही मैं ने सन 94 से 96 तक डाल लिए. यह था तकनीक का कमाल. अब हमारे पास 5,50,000 शब्दों वाला डाटाबेस था.

चौबीस साल का काम चौपट – अब क्या होगा!

मेरे काम में कई बाधाएँ पहले भी आ चुकी थीं – जैसे, घर में बाढ़, मेरा दिल का दौरा, पीलिए का आक्रमण आदि. पर काम पूरा होते होते तकनीकी संकट हमारे लिए सब से भारी था.

कंप्यूटर पर जो कई ख़तरे होते हैं, उन में से सब से बड़ा है डाटा वाली हार्ड डिस्क भ्रष्ट हो जाना. इस से बचने के लिए बैकअप करते रहना चाहिए. मेरा डाटा इतना बड़ा था कि सवा पाँच इंची 19 फ़्लौपियों पर बैकअप हो पाता था. इस लिए मैं हर रोज़ बैकअप करने से कतराता रहता था. हुआ यह कि काम पूरा होने से तीन चार दिन पहले हमारी हार्डडिस्क फ़ेल हो गई! कई कंप्यूटर विशेषज्ञों की शरण में गए. डाटा के पुनरुद्धार की कोई संभावना नहीं निकली. मेरी जान ही निकल गई. ऊपर का दम ऊपर, नीचे का दम नीचे. चौबीस साल का काम चौपट! फिर से यह सब करने की हिम्मत नहीं थी. लगा कि अब मेरा सारा काम गया.

अब तलाश हुई पुराने बैकअपों की. पाँच छह दिन पहले का एक बैकअप मिल गया. नई हार्डडिस्क पर वह डाला गया. पिछले कुछ दिन जो किया था – वह सब मैं भूल गया था. वह क्या था, अब पता नहीं. जो बचा था वही काफ़ी था. मेरी जान में जान आई.

आदेश देने पर कंप्यूटर ने डाटा में से चयनित 1,68,000 शब्दों का आउटपुट कर के समांतर कोश के संदर्भ खंड और अनुक्रम खंड तैयार कर दिए. कुल मिला कर अठारह सौ पेज. प्रकाशक के सामने न कंपोज़िंग की इल्लत, न प्रूफ़ रीडिंग का झंझट! कैमरा वर्क कराओ... और छाप दो. 24-25 सितंबर 1996 को दोनों खंडों के प्रिंटआउट नेशनल बुक ट्रस्ट के हवाले किए थे. 13 दिसंबर 1996 की पूर्वाह्न हम ने तत्कालीन राष्ट्रपति डाक्टर शंकरदयाल शर्मा के करकमलों में दोनों खंड प्रस्तुत कर दिए!

सितारों से आगे जहां और भी हैं

बात यहाँ समाप्त नहीं हो गई. अब हम अपने डाटा को द्विभाषी बनाने में जुट गए. अकेली हिंदी के लिए लिखी गई फ़ाक्स-प्रो ऐप्लीकेशन में इंग्लिश शब्द जोड़ने के लिए मूल प्रविधि में 1997 में परिवर्तन किया गया. आधार बना हमारा हिंदी वाला डाटाबेस. जिस तरह हिंदी थिसारस बनाने के लिए रोजेट में अनेक शब्दकोटियां नहीं थीं, उसी तरह हमारे डाटा में अनेक इंग्लिश शब्दकोटियां नहीं थीं. वे किस प्रकार कहां जोड़ी जाएं, इस के लिए भी काफ़ी सोचविचार किया गया. इंग्लिश शब्दों के स्रोत के लिए आक्सफ़र्ड यूनिवर्सिटी और वैब्सटर के कोश चुने गए. उन का एक एक शब्द परख कर हमारे पुराने डाटा में उपयुक्त जगह शामिल करने के लिए प्रावधान किया गया. 2007 में यह काम पूरा हुआ. उसी साल पेंगुइन इंडिया की ओर से द पेंगुइन इंग्लिश-हिंदी/हिंदी-इंग्लिश थिसारस ऐंड डिक्शनरी नाम से तीन विशाल खंडोँ में प्रकाशित हुई.

इस बीच हमारे दो और हिंदी कोश आ चुके थे—1) अरविंद सहज समांतर कोश – अकारादि क्रम से संयोजित थिसारस, और 2) शब्देश्वरी – भारतीय पौराणिक नामों का थिसारस.

और अभी सितंबर 2013 में आया है समांतर कोश का परिवर्धित और परिष्कृत संस्करण बृहत् समांतर कोश (प्रकाशक वही नेशनल बुक ट्रस्ट इंडिया. यह कोश हमारी कंपनी से भी मंगाया जा सकता है).

सफ़र की पांचवीं मंज़िल की ओर हमारा प्रयाण था - इंटरनेट पर अरविंद लैक्सिकन पहुँचाने की तैयारी. 2008 में सुमीत ने तय कि डाटा को फ़ाक्स-प्रो से निकाल कर विज़ुअल बेसिक की सहायता से माइक्रोसाफ़्ट नैट प्लैटफ़ार्म में लाना चाहिए. अतः डाटाबेस को ऐमऐस ऐक्सैस (MS Access) में इस तरह परिवर्तित किया गया कि वह ऐसक्यू लाइट (SQLite) में ढाला जा सके. यह डाटा ऐमऐस विंडोज़ और लाइनक्स (Linux) ही नहीँ हर प्लेटफ़ार्म पर चलता है.

जून 2011 में राष्ट्रीय राजधानी क्षेत्र की हिंदी अकादेमी ने मुझे शलाका सम्मान प्रदान किया. उसी दिन सुमीत ने अरविंद लैक्सिकन www.arvindlexicon.com लिंक पर लांच कर दिया.

तो बहुत थोड़े शब्दों में यह थी भाषा के उद्भव से सूचना प्रौद्योगिकी की सहायता से हिंदी कोश निर्माण की दास्तान.

clip_image006

áउच्चारण पर आधारित हिंदी का फ़ोनेटिक कीबोर्ड - इस में आ इ ई उ ऊ ए ऐ ओ औ आदि और उन की मात्राओं के लिए स्वतंत्र कुंजी है. मतलब कि ये मात्र ग्राफ़िक नहीं हैं, बल्कि स्वतंत्र उच्चारण है. टाइप राइटर में आ, ओ और औ तथा अन्य सभी मात्राएं व्यंजनों के बाएँ, दाएँ या ऊपर और नीचे टंकित की जाती थीं. कंप्यूटर में इन में से हर एक को अलग से टंकित करना होता है.

clip_image008

á प्रसंस्कृत डाटा - डाटा मैनिपुलेशन - डाटा प्रस्तुति – डाटा प्रदर्शन

clip_image010

áऐमऐस ऐक्सैस में डाटा – आप देख रहे हैं सफलता विषयक डाटा. इस में भिन्न रंग चयनक विधि दिखाते हैं

clip_image011

áसफलता का अकारादि क्रम से हिंदी-इंग्लिश कोश के लिए आउटपुट

clip_image013

áसफलता का संदर्भ क्रम से आउटपुट – यह बृहत् समांतर कोश का एक पेज है

clip_image015

इंटरनैट पर सफलता का आउटपुट

clip_image017

áऔर एक कमांड दे कर कंप्यूटर दिखा रहा है हमारे डाटा के आधार पर सफलता के भाषाई संपर्क

टिप्पणियाँ

  1. परम श्रद्धेय अरविन्‍द कुमार जी कोशकारिता के पर्याय हैं। एक आम आदमी अपने सीमित साधनों व सुविधाओं के बूते इतना कुछ कर सकता है, यह सोचकर आश्‍चर्य होता है। अपनी धर्मपत्‍नी और सुपुत्र के सहयोग से उन्‍होंने कोशकारिता के क्षेत्र में जो काम किया है, वह तमाम सुविधाओं व साधनों से युक्‍त कोई संस्‍था भी शायद नहीं कर पाती।

    इस लेख को पढ़वाने के लिए आभार।

    उत्तर देंहटाएं
  2. नींव की ईंट इमारत को संभालती है पर कभी दि‍खाई नहीं देती...

    उत्तर देंहटाएं
  3. लगन की प्रतिमूर्ति, स्तुत्य व्यक्तित्व हिन्दी के लिये।

    उत्तर देंहटाएं
  4. आदरणीय अरविंद कुमार जी ने प्रशंसनीय काम किया है, उन्होंने पुराने और नई पीढ़ी को को जोड़ दिया है। हार्दिक धन्यवाद।

    उत्तर देंहटाएं

एक टिप्पणी भेजें

आपकी अमूल्य टिप्पणियों के लिए आपका हार्दिक धन्यवाद.
कृपया ध्यान दें - स्पैम (वायरस, ट्रोजन व रद्दी साइटों इत्यादि की कड़ियों युक्त)टिप्पणियों की समस्या के कारण टिप्पणियों का मॉडरेशन लागू है. अतः आपकी टिप्पणियों को यहां पर प्रकट होने में कुछ समय लग सकता है.

विशाल लाइब्रेरी में से पढ़ें >

अधिक दिखाएं

---------------

छींटे और बौछारें का आनंद अपने स्मार्टफ़ोन पर बेहतर तरीके से लें. गूगल प्ले स्टोर से छींटे और बौछारें एंड्रायड ऐप्प image इंस्टाल करें.

इंटरनेट पर हिंदी साहित्य का खजाना:

इंटरनेट की पहली यूनिकोडित हिंदी की सर्वाधिक प्रसारित व लोकप्रिय ईपत्रिका में पढ़ें 10,000 से भी अधिक साहित्यिक रचनाएँ

हिन्दी कम्प्यूटिंग के लिए काम की ढेरों कड़ियाँ - यहाँ क्लिक करें!

.  Subscribe in a reader

इस ब्लॉग की नई पोस्टें अपने ईमेल में प्राप्त करने हेतु अपना ईमेल पता नीचे भरें:

FeedBurner द्वारा प्रेषित

ऑनलाइन हिन्दी वर्ग पहेली खेलें

***

Google+ Followers

फ़ेसबुक में पसंद करें