यूनिकोड हिन्दी सामग्री से पीडीएफ़ फ़ाइल बन तो आसानी से जाती है (उदाहरण के लिए, एमएस वर्ड में फ़ाइल > एक्सपोर्ट > पीडीएफ़ > सेव ), प...
यूनिकोड हिन्दी सामग्री से पीडीएफ़ फ़ाइल बन तो आसानी से जाती है (उदाहरण के लिए, एमएस वर्ड में फ़ाइल > एक्सपोर्ट > पीडीएफ़ > सेव ), परंतु बनी हुई पीडीएफ़ फ़ाइल (यूनिकोड हिन्दी सामग्री से) से यूनिकोड टैक्स्ट निकालने का जुगाड़ सही तरीके से अब तक उपलब्ध नहीं था. मजबूरी में ओसीआर करना् होता था, जिसमें भी परिणाम शु्द्ध नहीं आता था.
अब एक जुगाड़ है आपके पास.
यूनिकोड हिन्दी से बनी पीडीएफ़ फ़ाइल को आर्काइव.ऑर्ग में अपलोड करें. ध्यान रहे कि फ़ाइल में कोई पासवर्ड सेट न हो.
कुछ समय पश्चात आपकी फ़ाइल की साइट में कई विकल्प डाउनलोड हेतु मिलेंगे. जिसमें फुल टैक्स्ट का विकल्प भी मिलेगा. यह आपकी फ़ाइल का यूनिकोड हिन्दी में केवल सादा टैक्स्ट रूप में होता है. फ़ार्मेटिंग आदि की आशा न रखें.
उदाहरण - आर्काइव.ऑर्ग की लिंक -
https://archive.org/details/kachh-ka-pad-yatri-bal-kavi-bairagi
इसमें मैंने यूनिकोड हिन्दी से बनी पीडीएफ़ फ़ाइल को अपलोड किया. और परिणाम आमतौर पर शुद्ध है. यही नहीं, आप देखेंगे कि यूनिकोड टैक्स्ट को सुनकर उपयोग में लेने के लिए ऑडियो स्ट्रीमिंग का विकल्प (हेडफ़ोन आइकन) भी वहाँ उपलब्ध है.
यदि आपकी फ़ाइल सार्वजनिक उपयोग की नहीं है तो काम हो जाने के बाद आर्काइव.ऑर्ग से डिलीट कर सकते हैं.
COMMENTS