कृत्रिम बुद्धि : एक दिशा

मानव भाषा सबसे रोमांचक पहेली है। हम मशीन को एक साथी के रूप में जोड़ने में सफल हुए हैं। नब्बे के दशक से शुरू हुए आर्थिक उदारीकरण से व्यापार को बढ़ावा देने के लिए राष्ट्रीय और बहुराष्ट्रीय कंपनियों ने अपने उत्पाद को जन-जन तक पहुँचाने के लिए भाषा को अपना हथियार बनाया, क्योंकि भाषा के माध्यम से ही उत्पाद के बारे में जानकारी दी जा सकती है। टीडीआईएल के महत्त्वपूर्ण कदम से हिंदी और अन्य भारतीय भाषाओं को अनुवाद के क्षेत्र में जाना जा रहा है। आज अनुवाद को शीघ्रता से अनुवादित करने के लिए इसे मशीन (कंप्युटर) से जोड़ा जा रहा है। इसके लिए सी-डैक, पुणे ने मशीन सहायक अनुवाद उपकरण को विकसित किया है। साथ-ही-साथ ओसीआर, पाठ-से-वाणी और वाणी-से-पाठ, संगणक आधारित शिक्षण और प्रशिक्षण कार्यक्रम आदि के लिए क्षेत्रीय स्तर पर कई इंटरफेस बनाए गए हैं और इससे संबंधित उन्नत प्रणालियों को विकसित किया जा रहा है, जिससे सूचना का प्रवाह विश्व स्तर से क्षेत्रीय स्तर तक हो सके।

भारत के साथ-साथ विश्व के अन्य देशों में भी बोली और समझी जाने वाली हिंदी भाषा को तकनीकी से जोड़ने की कोशिश जारी है, जिसे हम सूचना-प्रौद्योगिकी कहते हैं, जो आज अपने शीर्ष स्तर पर पहुँचने की अवस्था में है। विश्व स्तर पर हिंदी भाषा अपनी पहचान बनाने के लिए प्रयासरत है। सूचना-प्रौद्योगिकी के क्षेत्र में मानव और मशीन के शाब्दिक और वाणीगत संव्यवहार के कारण दूर स्थान से सूचना का आदान-प्रदान आसानी से संभव हो जाता है। आज इसी संव्यवहार के कारण सूचना-प्रौद्योगिकी के बीच भाषाविज्ञान का महत्त्व बढ़ता जा रहा है। कंप्यूटेशनल भाषाविज्ञान तथा कंप्यूटर विज्ञान जो मानव भाषा के संगणकीय पहलुओं से संबंधित है, के बीच एक अनुशासन है। यह कंप्यूटर विज्ञान के संज्ञानात्मक विज्ञान और कृत्रिम बुद्धि की एक शाखा, जो मानव अनुभूति के संगणकीय मॉडल पर आधारित है। इसमें भाषाविज्ञान और कंप्यूटेशन के सैद्धांतिक घटकों को लिया गया है। इन्हीं घटकों को साथ लेकर धीरे-धीरे इस क्षेत्र में भारत सरकार के राजभाषा विभाग और संचार तथा सूचना प्रौद्योगिकी मंत्रालय की वैज्ञानिक संस्था सी-डैक ने मिलकर इस दिशा में आगे बढ़ने का बीड़ा उठाया जिसमें इनका सहयोग सी-डैक का पुणे केंद्र दे रहा है। साथ ही राष्ट्रीय सूचना केंद्र भी इस दिशा में कार्य कर रहा है।

सी-डैक, पुणे के एप्लाइड आर्टिफीसियल इंटेलिजेंस समूह ने इस दिशा में उल्लेखनीय कार्य किया है। यह समूह प्राकृतिक भाषा संसाधन के विभिन्न पहलुओं पर शोध करते हुए आगे बढ़ रहा है। इस समूह ने क्षेत्रीय भाषाओं के माध्यम से प्रबोध, प्रवीण तथा प्राज्ञ शिक्षण के लिए सॉफ़्टवेयर का विकास क्षेत्रीय भाषाओं जिसमें असमिया, बांग्ला, मणिपुरी, मराठी, उड़िया, नेपाली, पंजाबी, कश्मीरी, गुजराती, तमिल, तेलुगु,, कन्नड़, मलयालम और अँग्रेजी के माध्यम से नि:शुल्क ऑनलाइन हिंदी शिक्षण के लिए लीला सॉफ़्टवेयर का विकास किया गया है, जिससे विज्ञान, प्रौद्योगिकी और शोध के क्षेत्रों में ऑनलाइन शिक्षण का महत्त्व बढ़ गया हैं। यह सॉफ्टवेयर हिंदी शिक्षण योजना के तहत प्रबोध, प्रवीण, प्राज्ञ पाठ्क्रम पर आधारित है। मशीन अनुवाद की दिशा में आगे बढ़ते हुए इस समूह ने मंत्रा-राजभाषा अनुवाद सिस्टम का विकास किया है। इस सिस्टम के माध्यम से प्रशासन, वित्त, कृषि, लघु उद्योग, स्वास्थ्य सुरक्षा, बैंकिंग और सूचना प्रौद्योगिकी के क्षेत्रों में उपयोग होने वाले प्रलेखों दस्तावेजों का अनुवाद किया जा सकता है। 14 सितंबर, 2008, को हिंदी दिवस के अवसर पर भारत की महामहिम राष्ट्रपति द्वारा द्विभाषी द्विआयामी ई-महाशब्दकोश (प्रशासनिक प्रयोग के लिए) का प्रमोचन किया गया। सभी उपर्युक्त उल्लिखित सॉफ्टवेयर राजभाषा विभाग के पोर्टल पर नि:शुल्क उपलब्ध हैं।

Mantra
Launching of Mantra

इसी क्रम में सी-डैक, पुणे के एप्लाइड आर्टिफीसियल इंटेलिजेंस समूह (ए.ए.आई. ग्रुप) ने मंत्रा-राज्यसभा नाम से एक अँग्रेजी से हिंदी में अनुवाद सिस्टम विकसित की है, जो संसदीय दस्तावेजों का अनुवाद करता है। यह दस्तावेज संसद के सत्र के दौरान सभा के पटल पर रखे जाते हैं, जिसमें सभा पटल पर रखे जाने वाले पत्र, कार्यावली, संसदीय समाचार भाग –I शामिल हैं। यह अनुवाद सिस्टम 90 से 95 प्रतिशत तक सही-सही अनुवाद करता है। इसके विकसित होने में पाँच वर्ष लग गए। यह संसद के अनुवाद प्रभाग के अधिकारियों और सी-डैक, पुणे के एप्लाइड आर्टिफीसियल इंटेलिजेंस समूह के भाषाविदों तथा संगणक अभियंताओं का संयुक्त प्रयास है। पिछले तीन वर्षों से यह अनुवाद सिस्टम संसद के उच्च सदन के दस्तावेजों के अनुवाद कार्य में अपनी महत्त्वपूर्ण भूमिका निभा रहा है। यह संसार की ऐसी उन्नत और विकसित मशीनी अनुवाद प्रणाली है, जो अन्य कहीं नहीं है। इस सिस्टम में बहुत सारे टूल्स दिए गए हैं, जो पश्च संपादन के कार्यों को करने में सहायता करते हैं। इस सिस्टम के विकसित होने से सभा की कार्रवाई के समय में बचत होती है साथ-ही-साथ अनुवादक पेपर कार्य से भी बच जाता है। अनुवादक अनुवाद का पूरा कार्य इसी सिस्टम पर करता है और सिस्टम के माध्यम से अपने अधिकारियों को अनुवाद भेज देता है। इस मशीन अनुवाद सिस्टम का विमोचन भारत के माननीय उपराष्ठ्रपति तथा राज्यसभा के सभापति, श्री मो. हामिद अंसारी द्वारा 29 अगस्त, 2007 को संसद भवन, नई दिल्ली में किया। इस अवसर पर राज्यसभा के उपसभापति श्री के. रहमान खान, श्री सुरेश पचौरी, संसदीय कार्यमंत्री, राज्यसभा के महासचिव डॉं. योगेंद्र नारायन, लोकसभा के महासचिव श्री पी.डी.टी. आचारी, राज्यसभा के अपर सचिव श्री एन. सी. जोशी, सी-डैक के महानिदेशक श्री रामाकृष्णन, सी-डैक, पुणे के एप्लाइड आर्टिफीसियल इंटेलिजेंस समूह के कार्यक्रम समन्वयक, डॉ. हेमंत दरबारी, प्रो. डॉ. महेंद्र कुमार सी. पाण्डेय तथा अन्य गणमान्य व्यक्ति उपस्थित थे।

Tags:

Artificial Intelligence, C-DAC, Computational Linguistics, Language Technology, Machine Translation