अरविंद कुमार का आलेख - सूचना प्रौद्योगिकी और कोशकारिता

SHARE:

अरविंद कुमार चौरासी-वर्षीय अरविंद कुमार (जन्म - 17 जनवरी 1930) ने 1996 में समांतर कोश के प्रकाशन से हिंदी ही नहीं पूरे भारत को आधुनिक ...

clip_image002

अरविंद कुमार

चौरासी-वर्षीय अरविंद कुमार (जन्म - 17 जनवरी 1930) ने 1996 में समांतर कोश के प्रकाशन से हिंदी ही नहीं पूरे भारत को आधुनिक थिसारसों से परिचित कराया. उन के कुछ अन्य कोश हैं : देवीदेवताओं के नामों का थिसारस शब्देश्वरी, अकारादि क्रम से आयोजित पहला भारतीय थिसारस अरविंद सहज समांतर कोश, तीन खंडों वाला और संसार का विशालतम द्विभाषी द पेंगुइन इंग्लिश-हिंदी/हिंदी-इंग्लिश थिसारस ऐंड डिक्शनरी, और अब समांतर कोश का परिवर्धित परिष्कृत संस्करण बृहत् समांतर कोश. इंटरनैट पर उपलब्ध द्विभाषी शब्दकोश और थिसारस अरविंद लैक्सिकन. ये सभी कोश उन के ग्यारह लाख अभिव्यक्तियों के द्विभाषी डाटा बेस में से संकलित हैं. इस डाटा में संसार की सभी भाषाओं को समाने की क्षमता है.

 

सूचना प्रौद्योगिकी और कोशकारिता

मनुष्य की सब से बड़ी उपलब्धि – भाषा

अरविंद कुमार, अरविंद लिंग्विस्टिक्स प्रा लि, ई-28 प्रथम तल, कालिंदी कालोनी, नई दिल्ली 110025 (भारत)

 

ईमेल – arvind@arvindlexicon.comsamantarkosh@gmail.com

वैबसाइट – www.arvindlexicon.com

भाषा के आविष्कार को हम संप्रेषण के क्षेत्र में और सूचना प्रौद्योगिकी की ओर मानव का पहला और क्रांतिकारी चरण कह सकते हैं. भाषा न होती तो मनुष्य आज भी प्रस्तर युग में रह रहा होता. निस्संदेह शब्दों से बनी भाषा मनुष्य की सब से बड़ी उपलब्धि है, प्रगति का साधन और ज्ञान विज्ञान का भंडार है. भाषा एक निरंतर विकासशील और परिवर्तनशील प्रक्रिया है. भाषा ने ही मनुष्य को गूढ़ दार्शनिक विचारों की क्षमता प्रदान की.

सूचना प्रौद्योगिकी की पहली जैव मशीन और स्मृति चिप

भारत को और संस्कृत भाषा को संसार के सब से पहले दार्शनिक ग्रंथ वेदों का रचयिता होने का गौरव प्राप्त हुआ. आरंभ में वेद मौखिक थे. वेदों के एक एक शब्द का सही उच्चारण और हर शब्द का सही अर्थ पीढ़ी दर पीढ़ी सुरक्षित रखने के लिए एक नितांत अनोखी प्रणाली विकसित की गई - समाज का एक पूरा वर्ग इस महा उद्यम के लिए मनोनीत कर दिया गया! इस वर्ग को सूचना प्रौद्योगिकी की पहली जैव मशीन और स्मृति चिप कहना अनुचित न होगा.

तभी से शब्दों के संकलन और कोश निर्माण की आवश्यकता का महत्व सर्वमान्य हो गया था. संसार के पहले कोश निघंटु की रचना वैदिक काल में ही हुई. इस थिसारस में अठारह सौ वैदिक शब्दों को विषय क्रम से संकलित किया गया था. इस की रचना का श्रेय प्रजापति कश्यप को दिया जाता है. महर्षि यास्क ने निरुक्त में निघंटु के तथा अन्य वैदिक शब्दों की विशद व्याख्या की. यह संसार का पहला शब्दार्थ कोश और तत्कालीन समाज का विश्वकोश यानी ऐनसाइक्लोपीडिया है

लिपि का अन्वेषण

लिपि का अन्वेषण भाषाओं के विकास का अगला युगांतरकारी चरण था. मिस्र की जन और धर्म लिपियां, तथा चीन और जापान की चित्र लिपियां प्रतीकों पर आधारित थीं. उन से आगे बढ़ कर यूरोप और मध्य एशिया की ग्रीक, सिरिलिक, रोमन और हिब्रू लिपियां अक्षरों पर आधारित थीं. उन्हीं की तरह की लेकिन दाहिने से बाएँ लिखी जाने वाली अक्षर लिपि खरोष्ठी का प्रादुर्भाव गांधार में हुआ. अरबी, फ़ारसी और उर्दू जैसी लिपियां इसी से निकली मानी जाती हैं. इन सभी अक्षर लिपियों में प्रत्येक वर्ण किसी ध्वनि का प्रतीक तो होता है, लेकिन कई स्वरों और व्यंजनों का उच्चारण परिवर्तनशील होता है, जैसे रोमन के ‘सी’ या ‘जी’ अक्षर. यही नहीं इन की वर्णमालाओं में वर्णों का कोई पारस्परिक सुनिश्चित वैज्ञानिक क्रम भी नहीं है.

ब्राह्मी लिपि का प्रादुर्भाव भारत की एक और महान देन था. इस में हर वर्ण का उच्चारण सुनिश्चित था. पाणिनी ने ब्राह्मी लिपि के सभी स्वरों ‘अआइईउऊऋॠलृलॣएऐओअंअः’ और व्यंजनों को ‘कवर्ग, चवर्ग आदि कचटप’ वर्गों में और उन के बाद के ‘यरलव’ और ‘शषसह’ क्रम से संकलित कर के वर्णमाला को वाचा तंत्र में उच्चारणानुसार सुनिश्चित आधार प्रदान किया. इस से निकली देवनागरी आदि भारतीय लिपि परिवार की तिब्बती से थाई तक सर्वाधिक वैज्ञानिक लिपियों में गिनी जाती हैं.

अमरकोश की रचना

लिपि काल में बने कोशों में शिरोमणि ग्रंथ के तौर पर आया - अमरसिंह कृत नामलिंगानुशासन या त्रिकांड. अपनी विलक्षणता के कारण आरंभ से ही यह थिसारस अपने रचेता के नाम परअमरकोश ही कहा जाता है, ठीक वैसे ही जैसे आजकल अँगरेजी का थिसारस अपने तमाम संस्‍करणोँ और प्रकारांतरों के बावजूद रोजेट्स थिसारस ही कहा जाता है. उस काल में हस्तलिखित प्रतिलिपियां आसानी से नहीं मिलती थीं. इसलिए सभी छात्रों को ग्रंथ कंठस्थ करने होते थे. स्मरण में सुविधा के लिए ऐसे सभी कोश छंदबद्ध होते थे. किसी श्लोक का एक पद या शब्द याद आते ही तत्संबंधी पूरा प्रकरण ज़बान पर आ जाता था. इस तरह याददाश्त ही अनुक्रम खंड का काम करती थी.

अमरकोश में 8000 (आठ हज़ार) शब्दों को 1502 (एक हज़ार पांच सौ दो) श्‍लोकोँ में पद्यबद्ध किया गया है. ये श्‍लोक तीन कांडोँ में विभाजित हैँ, जिन में कुल मिला कर 25 वर्ग हैँ. इन में से चार वर्ग मानव समाज से संबंधित हैं और उन का क्रम ब्राह्मण, क्षत्रिय, वैश्य और शूद्र वर्णों के क्रम से रखा गया है. हर विषय अपने से संबद्ध या विपरीत विषय की ओर ले जाता है.

अमरकोश की शैली से प्रभावित हो कर ही अमीर खुसरो ने फ़ारसी में द्विभाषी कोश (फ़ारसी-हिंदी) ख़ालिक़बारी की रचना की. यह संसार का पहला द्विभाषी थिसारस है. इस में हिंदी के साथ साथ अरबी फ़ारसी के शब्द समूह विषय क्रम से आते थे.

हाथ से बनी प्रतिलिपियों में अशुद्धियां रह जाती थीं. हस्तलिखित होने के कारण वे बड़ी संख्या में उपलब्ध नहीं हो सकती थीं, और बहुत महँगी भी होती थीं.

मुद्रण तकनीक का आविर्भाव

लिपि के अन्वेषण के बाद सब से बड़ी क्रांति हुई जर्मनी में जोहानिस गुटेनबर्ग द्वारा 1450 में मुद्रण तकनीक का आरंभ. तब और आजकल भी कई छापेख़ानों में छपने वाली सामग्री नीचे एक सपाट धरातल पर रखी जाती थी, उस पर स्याही लगा कर ऊपर काग़ज़ रखा जाता था. एक सपाट फलक को ऊपर से नीचे ला कर काग़ज़ पर छाप डाली जाती थी. यह काम दाब या प्रैस से होता था, इसलिए इस का नाम प्रिंटिग ‘प्रैस’ पड़ा. हिंदी में भी छाप डालने के कारण यह छापाख़ाना कहलाता है.

अब किताबें आसानी से मिलने लगीं और जानकारी का संप्रेषण एक साथ कई क़दम आगे बढ़ गया. तब से अब छापेख़ाने में होने वाले सुधारों के साथ विविध विषयों पर तरह तरह की किताबें आम आदमी तक पहुँचना और भी आसान होता गया. पहली पहली किताबें धार्मिक थीं, जैसे बाइबिल. बाद में कुछ दंतकथाएँ और रहस्य कथाएँ छपनी शुरू हुईं. साहित्य का नंबर बाद में आया. धीरे धीरे कोश छपने लगे. इंग्लैंड में सन 1755 में सैमुअल जानसन का पहला इंग्लिश कोश ए डिक्शनरी आफ़ द इंग्लिश लैंग्वेज छपा. सन 1828 में इस से कहीं आगे बढ़ कर और बड़ा नोहा वैब्स्टर का ऐन अमेरीकन डिक्शनरी आफ़ द इंग्लिश लैंग्वेज छपा.

clip_image004

अमेरिकी नेता बेंजमिन फ़्रैंकलिन के प्रैस में एक मशीन

शब्द कल्पद्रुम तथा अन्य कोश

भारत में भी आरंभ में छपी पुस्तकें बाइबिल के अनुवाद थे. बात न तो यहाँ रुक सकती थी, न रुक पाई. भारतीय अस्मिता ने शीघ्र ही अपनी संस्कृति को छापेख़ाने तक लाना शुरू कर दिया. भारतीय साहित्य लोगों तक पहुँचाया जाने लगा. मैं बात कोशों तक ही सीमित रखूँगा. कुछ बहुत महत्वपूर्ण मुद्रित भारतीय (संस्कृत तथा हिंदी और इंग्लिश) कोश इस प्रकार हैं:

­ शब्द कल्पद्रुम (संस्कृत कोश - आठ खंड). राजा राधाकांत देव. पहला भाग 1822 - आठवाँ अंतिम 1856.

­ संस्कृत-इंग्लिश डिक्शनरी. सर मोनिअर मोनिअर-विलियम्स. 1872.

­ अ प्रैक्टिकल संस्कृत-इंग्लिश डिक्शनरी. वामन शिवराम आप्टे. 1889.

­ संस्कृत-हिन्दी कोश. वामन शिवराम आप्टे.

­ हिंदी शब्द सागर (ग्यारह खंड). श्याम सुंदर दास. काशी नागरी प्रचारिणी सभा.

­ बृहत् हिंदी कोश. ज्ञानमंडल वाराणसी. पहला संस्करण 1954-55. तब से इस के कई संस्करण होते रहे हैं. अनेक प्रधान संपादक. मेरी राय में हिंदी वर्तनी के लिए यह मानक कोश है. अरबी फ़ारसी शब्दों के नुक़्ते इस के मुखशब्द में बोल्ड टाइप के कारण नहीं छपे हैं, लेकिन लाइट टाइप में हैं. नुक़्ते वाले शब्दों के लिए प्रामाणिक कोश है -

­ उर्दू-हिन्दी शब्द कोश. मुहम्मद मुस्तफ़ा ख़ाँ 'मद्दाह'. हिंदी समिति, सूचना विभाग, उत्तर प्रदेश, लखनऊ.

­ हिन्दी विश्वकोश. कमलापति त्रिपाठी तथा सुधाकर पांडेय. काशी नागरी प्रचारिणी सभा.

­ Comprehensive English-Hindi Dictionary. डाक्टर रघुवीर.

­ केंद्रीय हिंदी निदेशालय के बीसियोँ तकनीकी शब्दकोश.

­ अँग्रेज़ी-हिन्दी कोश. फ़ादर कामिल बुल्के.

­ इंग्लिश-हिंदी कोश. डाक्टर हरदेव बाहरी.

­ मीनाक्षी हिंदी-अँगरेजी कोश. डा. ब्रजमोहन - डा. बदरीनाथ कपूर.

­ Oxford Hindi-English Dictionary. आर.ऐस. मैकग्रेगर.

अब मैं अपने कोशों की बात करता हूँ – ये आधुनिक भारत के पहले थिसारस हैं.

कोश और थिसारस के क्षेत्र अलग अलग हैं. कोश शब्द को अर्थ देता है, थिसारस अर्थ को, विचार को, एक नहीँ अनेक शब्द देता है. कोश में हर शब्द अकारादि क्रम से छपा होता, जैसे:कक्ष, कक्षा, कगार.

थिसारस में शब्दों का संकलन अकारादि क्रम से न हो कर कोटि क्रम से होता है, जैसे इंद्रिय के बाद ज्ञानेंद्रिय, कर्मेंद्रिय या फिर कड़वा स्वाद के बाद कसैला स्वाद, खट्टा स्वाद, चरपरा स्वाद, नमकीन स्वाद और मीठा स्वाद. यह शब्दों के अर्थ तो नहीं देता, लेकिन किसी एक शब्द के अनेक पर्यायवाचियों से शब्द का अर्थ समझ में आ जाता है,

समांतर कोश बनाने की प्रेरणा मुझे रोजेट के थिसारस से मिली थी. तो 1973 में प्राथमिक अभ्यास या रिहर्सल के तौर पर मैं ने उसी के क्रम को अपनाने का फ़ैसला किया. सौभाग्य से अच्छी बात यह हुई कि मैं ने शब्दों के पर्याय याददाश्त के आधार पर न लिख कर, ज्ञानमंडल के बृहत् हिंदी कोश के पहले से अंतिम पन्ने तक एक एक शब्द पढ़ कर रोजेट की आर्थी कोटियों में फ़िट करने की नीति बनाई. इस दो कारण थे – 1) मैं भी अपनी याददाश्त मात्र के भरोसे नहीं रहना चाहता था. 2) मैं अपने थिसारस को पूरी तरह प्रामाणिक बनाना चाहता था. मैं ने इस कोश के अतिरिक्त कई विषयों के कोशों और पुस्तकों को भी अपने शब्दों के स्रोत के तौर पर इस्तेमाल किया.

जल्दी ही पता चल गया कि रोजेट का माडल मेरे काम का नहीं है. हिंदी की बहुत सारी कोटियोँ के लिए उस में जगह ही नहीँ थी. अब हमें अपना कोटि क्रम या संदर्भ क्रम बनाना था. करते करते सीखने के अलावा हमारे पास कोई उपाय नहीँ था. कम से कम पाँच बार हमें नए रास्ते अपनाने पड़े. 1973 से 1992 तक पूरे बीस साल बीतते बीतते, हमें लगा हम किसी कामचलाऊ क्रम तक पहुँच रहे हैँ. तब तक साठ हज़ार कार्डों पर हम लगभग दो लाख साठ हज़ार शब्द या अभिव्यक्तियां या रिकार्ड दर्ज़ कर चुके थे. एक शब्द या अभिव्यक्तियां या रिकार्ड का मतलब एक शब्द नहीँ एक पूरा वाक्यांश या मुहाविरा भी है.

इस तरह से काम करते करते कई समस्याएं खड़ी हो जाती थीं. पहली थी कि कई बार हम पहले किया काम फिर से दोहराने लगते थे – क्योंकि सारा काम याद रख पाना आसान नहीं था. पहले भी यह काम कर चुके हैं, यह जाँचने का कोई तरीक़ा नहीं था.

इस से भी बड़ी समस्या छपाई की थी जो मेरे सामने हर दिन सुरसा की तरह मुँह बाए खड़ी रहती. मैं छापेख़ाने में काम कर चुका था. छापेख़ाने में जो समस्याएँ आती हैं, उन का ध्यान आते ही मेरे रोंगटे खड़े हो जाते.

पहले हमारे कार्ड टाइपिस्टोँ को दिए जाएंगे. उन से कई कार्ड खो भी सकते हैं, और उन का क्रम भी बिगड़ सकता है. टाइपिस्ट बीच बीच में से कई शब्द ग़लत टाइप कर जाते हैं, कई शब्द और पंक्तियाँ टाइप करना भूल जाते हैं और कई पंक्तियां दोबारा टाइप कर जाते हैं. मैं टाइप किए दो लाख साठ हज़ार शब्दों को पढ़ूँगा, उन की ग़लतियां ठीक कराऊंगा. कई पेज कई बार टाइप कराने पड़ सकते हैं. हर बार नई ग़लतियां होने की संभावना रहेगी. फिर टाइप शीट छापेख़ाने में कंपोज़िंग के लिए जाएंगी. वहाँ बार बार उन की प्रूफ़ रीडिंग करानी होगी. सैकड़ों पेजों का कंपोज़्ड मैटर प्रैस वाला रखेगा कहाँ. उन दिनों छपाई के लिए मशीन पर जाने से पहले कई बार पेज टूट जाते थे. तब क्या होगा. वे पेज फिर से कंपोज़ करवाने और प्रूफ़ पढ़ने होँगे. हर शीर्षक और उपशीर्षक की एकोत्तर संख्या मैनुअली लिखते समय सही क्रम का अनुपालन हो पाएगा या नहीँ - यह समस्या भी रहेगी.

अनुक्रम बनाने की समस्या तो और भी जटिल थी. पूरा संदर्भ खंड छप जाने के बाद उस के एक एक शब्द को अकारादि क्रम से लिखने और उन की शीर्षक तथा उपशीर्षक संख्या लिखना - तौबा! यह मेरे बस का काम नहीं था. दूसरों से बनवाएं, तो उन्हें देने का पैसा कहाँ से आएगा, और वे सब संख्याएं सही लिखेंगे भी या नहीं, फिर प्रैस में कंपोज़िंग में कितनी ज़्यादा ग़लतियां होंगी – यह कौन जाँचेगा. यही सब सोच सोच कर मुझे दिन रात बुख़ार सा चढ़ा रहता था.

1992 में मेरे बेटे डाक्टर सुमीत कुमार ने कहा -

इन सभी समस्याओं का एकमात्र हल है कंप्यूटर – यानी सूचना प्रौद्योगिकी.”

सूचना प्रौद्योगिकी और कोशकारिता

कंप्यूटर को हिंदी में संगणक कहा जाता है. गणना करने की यह मशीन कोई भाषा नहीं, केवल दो संख्याएँ जानती है – 1 और 0. हर डाटा, चाहे वह बैंक का ख़ाता हो, सरकारी रिकार्ड हो, किताब हो या चित्र हो या फ़िल्म या फिर ध्वनि हो - कंप्यूटर के लिए बस इन दो संख्याओं से बनी शृंखला मात्र हैं. उन दिनों (1992) कंप्यूटिंग कुल छह-सात बिट तक सीमित थी. कुछ ही महीनों में आठ बिट तक जाने वाली थी. आजकल की सोलह, बत्तीस, चौसठ और एक सौ अट्ठाईस बिट वाली कंप्यूटिंग का कहीं अतापता नहीं था.

सूचना प्रौद्योगिकी से तात्पर्य है कंप्यूटर हार्डवेयर एवं साफ़्टवेअर के अनुप्रयोग से आँकड़ों का संकलन, प्रबंधन, संपादन, सुरक्षण, परिवर्तन, पुनर्प्राप्ति और मैनिपुलेशन द्वारा वांछित रूप में आउटपुट अथवा उस के द्वारा प्रदत्त आदेशों के द्वारा काररवाई या फिर दूर संचार माध्यमों (जैसे ईमेल, इंटरनैट आदि) से विश्व स्तर पर सूचना का आदानप्रदान.

डाटा का मैनिपुलेशन क्या होता है, किसी एक डाटा से किस तरह के आउटपुट लिए जा सकते हैं, यह दरशाने के लिए ग्राफ़िक दिखाए बिना बात समझाई नहीं जा सकती. मैं ने सभी ग्राफ़िक अपने कोश के ऐमऐस ऐक्सैस वाले डाटा से लिए हैं. हर चित्र के लिए एक शब्दकोटि – सफलता – को चुना है, ताकि बात आसानी से समझ में आ जाए.

सुमीत ने तय किया कि थिसारस बनाने के लिए डाटाबेस बनाना होगा. तब हिंदी में डाटाबेस बनाने की परिकल्पना तक किसी ने नहीं की थी. उन दिनों कंप्यूटर के लिए आरंभिक क़िस्म के हिंदी फ़ोंटों से टाइपसैटिंग तो होती थी, लेकिन डाटाबेस नहीँ बन सकते थे. पता चला कि कुछ महीने पहले पुणेँ स्थित सी-डैक की ओर से जिस्ट कार्ड (GIST card) नाम का उपकरण बनाया है. इस की सहायता से ब्राह्मी आधारित सभी लिपियोँ में डाटाबेस बन सकता है. इसे कहते हैं तकनीक और विचार का संगम और सुसंयोग! सही समय पर सही कर्मियोँ के हाथ सही तकनीक लग जाना!

काफ़ी बड़े लिखित डाटा के साथ हम तैयार थे. तकनीक भी बन गई थी. देरी किए बग़ैर हम ने जिस्ट कार्ड ख़रीद लिया और फ़ाक्स-प्रो (Fox-Pro) में हमारी आवश्यकताओं के अनुरूप प्रविधि सुमीत ने स्वयं लिखनी शुरू कर दी. अब तलाश थी दक्ष कंप्यूटर टाइपिस्ट की जो हमारे विशाल शब्द भंडार को डाटाबेस में डाल सके. वह भी मिल गया - दलीप. वह दिन भर शब्द डालता, रात में कुसुम प्रिंट आउटों पर प्रूफ़ रीडिंग कर के अगली सुबह करक्शन कराती रहतीं, मैं अगले दिन के काम के कार्ड छांट कर दलीप के लिए तैयार रखता. ग्यारह महीनों में यह पड़ाव पूरा हो गया.

अब मेरी बारी थी और शब्द डालने की. सन 73 से 93 तक जितने शब्द हम ने संकलित किए और डाटा में डलवाए थे लगभग उतने ही मैं ने सन 94 से 96 तक डाल लिए. यह था तकनीक का कमाल. अब हमारे पास 5,50,000 शब्दों वाला डाटाबेस था.

चौबीस साल का काम चौपट – अब क्या होगा!

मेरे काम में कई बाधाएँ पहले भी आ चुकी थीं – जैसे, घर में बाढ़, मेरा दिल का दौरा, पीलिए का आक्रमण आदि. पर काम पूरा होते होते तकनीकी संकट हमारे लिए सब से भारी था.

कंप्यूटर पर जो कई ख़तरे होते हैं, उन में से सब से बड़ा है डाटा वाली हार्ड डिस्क भ्रष्ट हो जाना. इस से बचने के लिए बैकअप करते रहना चाहिए. मेरा डाटा इतना बड़ा था कि सवा पाँच इंची 19 फ़्लौपियों पर बैकअप हो पाता था. इस लिए मैं हर रोज़ बैकअप करने से कतराता रहता था. हुआ यह कि काम पूरा होने से तीन चार दिन पहले हमारी हार्डडिस्क फ़ेल हो गई! कई कंप्यूटर विशेषज्ञों की शरण में गए. डाटा के पुनरुद्धार की कोई संभावना नहीं निकली. मेरी जान ही निकल गई. ऊपर का दम ऊपर, नीचे का दम नीचे. चौबीस साल का काम चौपट! फिर से यह सब करने की हिम्मत नहीं थी. लगा कि अब मेरा सारा काम गया.

अब तलाश हुई पुराने बैकअपों की. पाँच छह दिन पहले का एक बैकअप मिल गया. नई हार्डडिस्क पर वह डाला गया. पिछले कुछ दिन जो किया था – वह सब मैं भूल गया था. वह क्या था, अब पता नहीं. जो बचा था वही काफ़ी था. मेरी जान में जान आई.

आदेश देने पर कंप्यूटर ने डाटा में से चयनित 1,68,000 शब्दों का आउटपुट कर के समांतर कोश के संदर्भ खंड और अनुक्रम खंड तैयार कर दिए. कुल मिला कर अठारह सौ पेज. प्रकाशक के सामने न कंपोज़िंग की इल्लत, न प्रूफ़ रीडिंग का झंझट! कैमरा वर्क कराओ... और छाप दो. 24-25 सितंबर 1996 को दोनों खंडों के प्रिंटआउट नेशनल बुक ट्रस्ट के हवाले किए थे. 13 दिसंबर 1996 की पूर्वाह्न हम ने तत्कालीन राष्ट्रपति डाक्टर शंकरदयाल शर्मा के करकमलों में दोनों खंड प्रस्तुत कर दिए!

सितारों से आगे जहां और भी हैं

बात यहाँ समाप्त नहीं हो गई. अब हम अपने डाटा को द्विभाषी बनाने में जुट गए. अकेली हिंदी के लिए लिखी गई फ़ाक्स-प्रो ऐप्लीकेशन में इंग्लिश शब्द जोड़ने के लिए मूल प्रविधि में 1997 में परिवर्तन किया गया. आधार बना हमारा हिंदी वाला डाटाबेस. जिस तरह हिंदी थिसारस बनाने के लिए रोजेट में अनेक शब्दकोटियां नहीं थीं, उसी तरह हमारे डाटा में अनेक इंग्लिश शब्दकोटियां नहीं थीं. वे किस प्रकार कहां जोड़ी जाएं, इस के लिए भी काफ़ी सोचविचार किया गया. इंग्लिश शब्दों के स्रोत के लिए आक्सफ़र्ड यूनिवर्सिटी और वैब्सटर के कोश चुने गए. उन का एक एक शब्द परख कर हमारे पुराने डाटा में उपयुक्त जगह शामिल करने के लिए प्रावधान किया गया. 2007 में यह काम पूरा हुआ. उसी साल पेंगुइन इंडिया की ओर से द पेंगुइन इंग्लिश-हिंदी/हिंदी-इंग्लिश थिसारस ऐंड डिक्शनरी नाम से तीन विशाल खंडोँ में प्रकाशित हुई.

इस बीच हमारे दो और हिंदी कोश आ चुके थे—1) अरविंद सहज समांतर कोश – अकारादि क्रम से संयोजित थिसारस, और 2) शब्देश्वरी – भारतीय पौराणिक नामों का थिसारस.

और अभी सितंबर 2013 में आया है समांतर कोश का परिवर्धित और परिष्कृत संस्करण बृहत् समांतर कोश (प्रकाशक वही नेशनल बुक ट्रस्ट इंडिया. यह कोश हमारी कंपनी से भी मंगाया जा सकता है).

सफ़र की पांचवीं मंज़िल की ओर हमारा प्रयाण था - इंटरनेट पर अरविंद लैक्सिकन पहुँचाने की तैयारी. 2008 में सुमीत ने तय कि डाटा को फ़ाक्स-प्रो से निकाल कर विज़ुअल बेसिक की सहायता से माइक्रोसाफ़्ट नैट प्लैटफ़ार्म में लाना चाहिए. अतः डाटाबेस को ऐमऐस ऐक्सैस (MS Access) में इस तरह परिवर्तित किया गया कि वह ऐसक्यू लाइट (SQLite) में ढाला जा सके. यह डाटा ऐमऐस विंडोज़ और लाइनक्स (Linux) ही नहीँ हर प्लेटफ़ार्म पर चलता है.

जून 2011 में राष्ट्रीय राजधानी क्षेत्र की हिंदी अकादेमी ने मुझे शलाका सम्मान प्रदान किया. उसी दिन सुमीत ने अरविंद लैक्सिकन www.arvindlexicon.com लिंक पर लांच कर दिया.

तो बहुत थोड़े शब्दों में यह थी भाषा के उद्भव से सूचना प्रौद्योगिकी की सहायता से हिंदी कोश निर्माण की दास्तान.

clip_image006

áउच्चारण पर आधारित हिंदी का फ़ोनेटिक कीबोर्ड - इस में आ इ ई उ ऊ ए ऐ ओ औ आदि और उन की मात्राओं के लिए स्वतंत्र कुंजी है. मतलब कि ये मात्र ग्राफ़िक नहीं हैं, बल्कि स्वतंत्र उच्चारण है. टाइप राइटर में आ, ओ और औ तथा अन्य सभी मात्राएं व्यंजनों के बाएँ, दाएँ या ऊपर और नीचे टंकित की जाती थीं. कंप्यूटर में इन में से हर एक को अलग से टंकित करना होता है.

clip_image008

á प्रसंस्कृत डाटा - डाटा मैनिपुलेशन - डाटा प्रस्तुति – डाटा प्रदर्शन

clip_image010

áऐमऐस ऐक्सैस में डाटा – आप देख रहे हैं सफलता विषयक डाटा. इस में भिन्न रंग चयनक विधि दिखाते हैं

clip_image011

áसफलता का अकारादि क्रम से हिंदी-इंग्लिश कोश के लिए आउटपुट

clip_image013

áसफलता का संदर्भ क्रम से आउटपुट – यह बृहत् समांतर कोश का एक पेज है

clip_image015

इंटरनैट पर सफलता का आउटपुट

clip_image017

áऔर एक कमांड दे कर कंप्यूटर दिखा रहा है हमारे डाटा के आधार पर सफलता के भाषाई संपर्क

COMMENTS

BLOGGER: 4
  1. परम श्रद्धेय अरविन्‍द कुमार जी कोशकारिता के पर्याय हैं। एक आम आदमी अपने सीमित साधनों व सुविधाओं के बूते इतना कुछ कर सकता है, यह सोचकर आश्‍चर्य होता है। अपनी धर्मपत्‍नी और सुपुत्र के सहयोग से उन्‍होंने कोशकारिता के क्षेत्र में जो काम किया है, वह तमाम सुविधाओं व साधनों से युक्‍त कोई संस्‍था भी शायद नहीं कर पाती।

    इस लेख को पढ़वाने के लिए आभार।

    जवाब देंहटाएं
  2. नींव की ईंट इमारत को संभालती है पर कभी दि‍खाई नहीं देती...

    जवाब देंहटाएं
  3. लगन की प्रतिमूर्ति, स्तुत्य व्यक्तित्व हिन्दी के लिये।

    जवाब देंहटाएं
  4. आदरणीय अरविंद कुमार जी ने प्रशंसनीय काम किया है, उन्होंने पुराने और नई पीढ़ी को को जोड़ दिया है। हार्दिक धन्यवाद।

    जवाब देंहटाएं
आपकी अमूल्य टिप्पणियों के लिए आपका हार्दिक धन्यवाद.
कृपया ध्यान दें - स्पैम (वायरस, ट्रोजन व रद्दी साइटों इत्यादि की कड़ियों युक्त)टिप्पणियों की समस्या के कारण टिप्पणियों का मॉडरेशन लागू है. अतः आपकी टिप्पणियों को यहां पर प्रकट होने में कुछ समय लग सकता है.

नाम

तकनीकी ,1,अनूप शुक्ल,1,आलेख,6,आसपास की कहानियाँ,127,एलो,1,ऐलो,1,कहानी,1,गूगल,1,गूगल एल्लो,1,चोरी,4,छींटे और बौछारें,148,छींटें और बौछारें,341,जियो सिम,1,जुगलबंदी,49,तकनीक,56,तकनीकी,709,फ़िशिंग,1,मंजीत ठाकुर,1,मोबाइल,1,रिलायंस जियो,3,रेंसमवेयर,1,विंडोज रेस्क्यू,1,विविध,384,व्यंग्य,515,संस्मरण,1,साइबर अपराध,1,साइबर क्राइम,1,स्पैम,10,स्प्लॉग,2,हास्य,2,हिंदी,5,हिन्दी,509,hindi,1,
ltr
item
छींटे और बौछारें: अरविंद कुमार का आलेख - सूचना प्रौद्योगिकी और कोशकारिता
अरविंद कुमार का आलेख - सूचना प्रौद्योगिकी और कोशकारिता
http://lh6.ggpht.com/-H7Xi0LuMEFk/UtoVHHaD-WI/AAAAAAAAXQs/DFsXoKoF67Y/clip_image002%25255B3%25255D.jpg?imgmax=800
http://lh6.ggpht.com/-H7Xi0LuMEFk/UtoVHHaD-WI/AAAAAAAAXQs/DFsXoKoF67Y/s72-c/clip_image002%25255B3%25255D.jpg?imgmax=800
छींटे और बौछारें
https://raviratlami.blogspot.com/2014/01/blog-post_18.html
https://raviratlami.blogspot.com/
https://raviratlami.blogspot.com/
https://raviratlami.blogspot.com/2014/01/blog-post_18.html
true
7370482
UTF-8
Loaded All Posts Not found any posts VIEW ALL Readmore Reply Cancel reply Delete By Home PAGES POSTS View All RECOMMENDED FOR YOU LABEL ARCHIVE SEARCH ALL POSTS Not found any post match with your request Back Home Sunday Monday Tuesday Wednesday Thursday Friday Saturday Sun Mon Tue Wed Thu Fri Sat January February March April May June July August September October November December Jan Feb Mar Apr May Jun Jul Aug Sep Oct Nov Dec just now 1 minute ago $$1$$ minutes ago 1 hour ago $$1$$ hours ago Yesterday $$1$$ days ago $$1$$ weeks ago more than 5 weeks ago Followers Follow THIS PREMIUM CONTENT IS LOCKED STEP 1: Share to a social network STEP 2: Click the link on your social network Copy All Code Select All Code All codes were copied to your clipboard Can not copy the codes / texts, please press [CTRL]+[C] (or CMD+C with Mac) to copy Table of Content