हमारी चुनौतियाँ यूरोप की तुलना में बहुत ज्यादा हैं।

(स्वर्णलता जी भारतीय भाषाओं के लिए प्रौद्योगिकीय विकास (TDIL) की प्रमुख हैं, हमने कुछ सवालों को लेकर 2 वर्ष पहले उनसे बातचीत का प्रयास किया था , लेकिन यह संभव नहीं हो सका। इस बीच आल इंडिया रेडियो ने उनसे बातचीत का अंश दिनाँक 19/07/2012 को “सुर्खियों से परे” नामक कार्यक्रम में प्रसारित किया। हम स्वर्णलता जी से अनुमति के बाद इसे आप तक उपलब्ध करा रहे हैं)

Swarn Lata

प्रश्न: भारतीय भाषाओं के लिए प्रौद्योगिकी विकास ( TDIL ) का मूल उद्देश्य क्या है ?

उत्तर: आज सूचना-प्रौद्योगिकी का जो वैश्विक प्रसार हुआ है वह मूलत: अँग्रेजी में है। इससे भारतीय उद्योग-जगत तो लाभ उठा रहा है, लेकिन आमजन तक इसका लाभ नहीं पहुँच पा रहा है। हमारा उद्देश्य है कि भारतीय भाषाओं के माध्यम से हम इस सूचना-क्रांति का लाभ अपने हर नागरिक तक पहुँचाएं।

प्रश्न: भारतीय भाषाओं के लिए प्रौद्योगिकी विकास ( TDIL ) किन-किन भाषाओं में या किन-किन क्षेत्रों में प्रौद्योगिकी विकसित कर रहा है ?

उत्तर: इस कार्यक्रम का जो लाभ है वह पूरे भारत में मिलेगा। भारत की संवैधानिक रूप से पहचानी गई 22 भाषाएँ हैं और वो अलग-अलग लिपि में लिखी जाती हैं। पूरे देश में फैली हुई इन भाषाओं को लेकर हम काम कर रहे हैं।

प्रश्न: भारतीय भाषाओं के लिए प्रौद्योगिकी विकास ( TDIL ) की क्या-क्या खास उपलब्धियाँ हैं ?

उत्तर: जब हम कंप्यूटर का इस्तेमाल करते हैं तो हमारा प्रयास रहता है कि हमारी कार्य-क्षमता और उत्पादकता बढ़े। अपने कागजात को कंप्यूटर के माध्यम से तैयार कर सकें, उसका प्रस्तुतीकरण (presentation) किया जा सके, इंटरनेट का इस्तेमाल हो सके। इस सबके लिए बेसिक इन्फॉर्मेशन प्रोसेसिंग किट की जरूरत होती है, जिसमें हम अपने दस्तावेज़ तैयार कर सकते हैं। ये सब हमने एक लोकेलाइज ओपेन ऑफिस के द्वारा उपलब्ध करवाया है जो कि भारत की 22 भाषाओं में काम कर सकता है। आप जिस भी भाषा में चाहें अपने दस्तावेज़ लिख सकते हैं, ई-मेल कर सकते हैं और फायरफाक्स ब्राउज़र जो कि ओपेन सोर्स ब्राउज़र है; पर इंटरनेट का इस्तेमाल भी कर सकते हैं और इन सब सॉफ्टवेयर में स्थानीय भाषा का उपयोग किया जा सकता है। इस प्रकार जो भी अँग्रेजी नहीं जानता है वह इसके माध्यम से सूचना-क्रांति का लाभ ले सकता है। इसका शिक्षा में भी इस्तेमाल कर सकता है। बच्चे जिस तरह से अँग्रेजी में प्रस्तुतीकरण, परियोजना-कार्य और शोध-प्रबंध का कार्य करते हैं वे ऐसा स्थानीय भाषाओं में भी ऐसा कर सकते हैं।

प्रश्न: भारत में केवल 5 प्रतिशत लोग ऐसे हैं जो अँग्रेजी जानते हैं , शेष जो 95 प्रतिशत लोग हैं वे सूचना-प्रौद्योगिकी के विकास के लाभों से अभी भी वंचित है। आप ऐसे लोगों तक कैसे पहुँच बना रही हैं ?

उत्तर: इस तरह का लाभ पहुंचाने के लिए अभी बहुत कुछ करना बाकी है, इसके लिए और अधिक तकनीकी विकास की आवश्यकता है। जिस तरह से अँग्रेजी में ओसीआर (Optical Character Recognition) सॉफ्टवेयर होता है, उसी तरह हम भारतीय भाषाओं के लिए प्रयत्नशील हैं। इसमें किताब को स्कैनर पर रख दिया जाता है वह स्कैन करके ओसीआर सॉफ्टवेयर के द्वारा किताब को संपादनीय प्रारूप में परिवर्तित कर देता है। इस प्रकार हम आवश्यकतानुरूप किताब में काट-छाँट कर आगे इस्तेमाल कर सकते हैं। इसके लिए भारतीय भाषाओं में हमारी 11 तरह की लिपियाँ हैं जिनमें हम ओसीआर का विकास कर रहे हैं। इसमें अक्षर स्तर तक उत्साहजनक परिणाम मिला है, लेकिन इसे शब्द स्तर तक बढ़ाना है। इससे हमारी किताबें ई-बुक के रूप में उपलब्ध हो सकती हैं।

प्रश्न: इस प्रकार देश में उद्योग को बढ़ावा मिला है और बहु-राष्ट्रीय कंपनियों की दिलचस्पी इसमें बहुत ज्यादा बढ़ी है। इस तरह क्या भारत बहु-भाषी कम्प्यूटिंग की ओर अग्रसर है ?

उत्तर: हाँ ऐसा कह सकते हैं, क्योंकि हमारे जैसी चुनौती विश्व के किसी दूसरे देश के सामने नहीं है। हमारे सामने 22 भारतीय भाषाओं के लिए काम करना अपने आप में एक बहुत बड़ी चुनौती है, जबकि पूरे यूरोप की भाषाएँ मिलाकर 23 ही हैं। इसी लिए आज यूरोप भी हमको एक आदर्श की तरह देख रहा है । हमारे पद-चिह्नों की नकल करना चाहता है और हम यूरोप के साथ मिलजुल कर भी अपने-अपने कार्यक्रम को साझा करते हैं। हमारे 22 भाषाओं की चुनौती को हमारे राष्ट्रीय भाषा हिंदी से शुरू करके फिर उसको हर क्षेत्र की एक-दो भाषाओं को उदाहरण के रूप में लेकर चलते हैं। उसके बाद भाषिक विकल्पनों के आधार पर सभी क्षेत्रों को अपनी योजना में शामिल करने का प्रयास करते हैं।

प्रश्न: इतने बड़े क्षेत्र में अगर हम काम कर रहे हैं , तो हमारी चुनौतियाँ भी उतनी ही बड़ी होती होंगी ?

उत्तर: हमारी चुनौतियाँ यूरोप की तुलना में बहुत ज्यादा हैं, क्योंकि यूरोप की भाषाएँ रोमन लिपि पर आधारित हैं और अँग्रेजी जिस भाषा में सूचना-तकनीक का विकास हुआ है उसकी लिपि भी रोमन है। इसलिए इसे अन्य रोमन लिपि केन्द्रित भाषाओं तक विस्तारित करना आसान है। जबकि भारतीय भाषाएँ इस मामले में बहुत जटिल हैं। इसमें बहुत अधिक मात्राओं एवं संयुक्ताक्षरों का प्रयोग होता है। इसके लिए हमने बहुत सारे कदम उठाए हैं और भाषाओं के बीच समानता लाने के लिए मशीनी अनुवाद पर भी काम कर रहे हैं। इसके साथ ही अन्य उपकरणों पर भी कार्य हो रहा है। हम इस बात का प्रयास कर रहे हैं कि जितनी सुविधा और मानक अँग्रेजी के लिए है उतनी भारतीय भाषाओं की भी हो। इसके साथ ही इन्टरनेट के माध्यम से भी भारतीय भाषाएँ लाभान्वित हों।

प्रश्न: इन सबकी पहुँच गाँव-गाँव तक बढ़ाने के लिए मंत्रालय क्या कर रहा हैं ?

उत्तर: आज ई-गवर्नेंस के माध्यम से ‘नागरिक सेवा केंद्र’ प्रत्येक पंचायत में बनाए जा रहे हैं, जिसके माध्यम से हर नागरिक वहाँ जाकर अपनी भाषा के द्वारा उसका उपयोग कर सकता है। ये भाषा-विकास जो हम कर रहे हैं उसी के फलस्वरूप यह संभव है कि आमजन अपनी भाषा के द्वारा इन सेवाओं का लाभ ले सके।

प्रश्न: तो आप मानती हैं कि भारतीय भाषाओं में अभी भी सामग्री का अभाव है। कितना मुश्किल होता होगा एक-एक सामग्री इकट्ठा करना ?

उत्तर: शोध के लिए भी हमें भारतीय भाषाओं में इलेक्ट्रोनिक डाटा की आवश्यकता होती है और भारतीय भाषाओं का डाटा वैसे भी इंटरनेट पर बहुत कम है। ई-फॉर्म में भी काफी कम है और अगर है भी तो विभिन्न फॉन्ट में है। फॉन्ट का डाटा अमानक माना जाता है, जब तक वह डाटा यूनिकोड न हो इस्तेमाल नहीं किया जा सकता है। इसलिए हम शोध के लिए काफी डाटा तैयार कर रहे हैं ताकि शोध को बढ़ावा मिले। हमारे विभिन्न टूल्स द्वारा जब लोग प्रशिक्षित हो जाएंगे, तब वही जनता अपना कंटेन्ट क्रिएट करके, छोटे-छोटे वेबसाइट अपनी भाषाओं में बनाएँगे, अपने-अपने काम को करेंगे। तब ये सारा डाटा बढ़ता चला जाएगा। भाषा-सीडी हमारा सबसे बड़ा प्रोजेक्ट है, जिसको हमने राष्ट्रीय स्तर पूरे देश में पहुंचाया है। 60 लाख उपयोगकर्ता इसका लाभ उठा रहे हैं । इसके लिए हमें डिजिटल वाच फाउंडेशन्स पुरस्कार भी मिला है। इससे हमें पहली बार ये महसूस हुआ भारतीय भाषाओं के लिए प्रौद्योगिकी विकास (TDIL) के कार्यक्रम की पहचान समाज में है।

प्रश्न: क्या भारतीय भाषाओं के लिए कोई सिंगल फॉन्ट का भी इस्तेमाल किया जा सकता है ?

उत्तर: पिछले दिनों मुझे कुछ लोगों के पत्र ऐसी जगह से मिले जो सीधे कंप्यूटर से जुड़े हुए नहीं हैं, जैसे- परिवहन-व्यवसायी, गृहिणी और अनेक व्यक्तिगत स्तर पर छोटे-छोटे काम करने वाले लोग और समूह आदि। ये लोग हमें पत्र लिखकर भाषा-सीडी माँग रहे हैं और इसका इस्तेमाल अपने-अपने क्षेत्र में अपने-अपने काम को अच्छे से करने के लिए इस्तेमाल कर रहे हैं। तो इससे मुझे बड़ी आशा है, कि हम इस काम में आगे और बढ़ेंगे और हमारे आने वाले प्रयास बहुत शीघ्र ही ई-गवर्नेन्स के साथ जुड़कर जन-जन तक इसका लाभ पहुचाएंगे।

प्रश्न:- आजकल मोबाइल की दुनिया हो गयी है तो क्या धीरे-धीरे इस मोबाइल के इस युग में क्या हम एसएमएस भी भारतीय भाषाओं में प्राप्त कर पाएंगे कभी ?

उत्तर: भारतीय भाषाओं में एसएमएस अभी भी कुछ मोबाइल मॉडल में ही उपलब्ध है, लेकिन यह उत्पाद आधारित ही है। अभी एसएमएस एक मोबाइल से दूसरे मोबाइल में जाने एवं दिखने में कुछ समस्या है। इसको दूर करने के लिए हम एक मानक का विकास करेंगे। हमने सामान्य सूचना-प्रौद्योगिकीय उपकरणों पर काफी कार्य किया है और काफी कार्य अभी हो रहा है। आगे ई- गवर्नेंस में मोबाइल की भूमिका को देखते हुए इस पर कार्य किया जा रहा है ताकि भारत की जो ई- गवर्नेंस सेवा है वो भी मोबाइल के माध्यम से भी मिल सके। और एसएमएस भी भारतीय भाषाओं में आ सके और मोबाइल में पूरा अनुभव, नाम, पता आदि भारतीय भाषाओं में संग्रहित किया जा सके। इसके मानक के लिए हमने कदम उठाए हैं।

प्रश्न:- भारतीय भाषाओं के लिए प्रौद्योगिकी विकास ( TDIL ) के नतीजों का किस तरह से इस्तेमाल लोग कर पाएंगे ?

उत्तर: जो भी मानक हमने विकसित किए हैं, उनको ई-गवर्नेन्स में अनिवार्य किया गया है ताकि जो अनुप्रयोग बने उनका इन्टरनेट पर उपयोग किया जा सके और प्रत्येक व्यक्ति उन सुविधाओं को प्राप्त कर सके। उसकी सुविधा में कोई रुकावट न हो। वो किसी भी साइबर कैफे में बैठकर, अपने घर में बैठकर, जहाँ भी इंटरनेट उपलब्ध है जिस तरीके से भी उपलब्ध है और आने वाले समय में मोबाइल से भी वह उपलब्ध हो जाए। इसके लिए हम सारे विभागों से कदम मिलाकर चल रहे हैं और ई- गवर्नेन्स कार्यक्रम के साथ मिलकर काम कर रहे हैं।

प्रश्न: लेकिन इस समग्र प्रौद्योगिकीय विकास-प्रक्रिया का भविष्य आप कहाँ आँकती हैं ?

उत्तर: हम जन-जन तक पहुँचने के लिए बहुत सारे रास्ते अपना चुके हैं। हमने अपना वेबसाइट tdil.mit.gov.in भी रखा है, जिसपर देश की सभी भाषाओं में सॉफ्टवेयर उपलब्ध हैं, भारत सरकार द्वारा निर्मित या बाजार में उपलब्ध सभी की सूचना हमारी वेबसाइट पर है। इसके साथ ही हमने डाटा सेंटर भी तैयार किया है, जिसके द्वारा भाषा-सीडी को डाउनलोड किया जा सकता है। उसके लिए अनुरोध किया जा सकता है, वो आपके घर तक पहुँच जाएगी। उसके अलावा हम एक टेक्निकल जर्नल विश्व-भारत भी निकालते हैं। पूरे भारत में आने वाले दिनों में दिन-ब-दिन हमारे शोध-संस्थान बढ़ते जा रहे हैं, अधिक से अधिक संस्थान हमसे जुडते जा रहे हैं। आज मैं भारत के हर नागरिक को ये संदेश देना चाहूंगी कि वो हमसे जुड़ें और हम सब मिलकर इस काम को पूरा करें।

Tags:

Computational Linguistics, Language Technology, Multilingualism, TDIL