देवनागरी से रोमन लिप्यंतरण : अँग्रेजी-हिंदी मशीनी अनुवाद के विशेष संबंध में

संपूर्ण विश्व में अलग-अलग धर्मों का पालन करने वाले और अलग-अलग जातियों के लोग होते हैं। हर समाज के लोग एक-दूसरे से संप्रेषण के लिए भाषा का प्रयोग करते हैं। समाज में संप्रेषण का अन्य माध्यम भी हो सकता है किंतु भाषिक संप्रेषण सबसे अधिक महत्त्वपूर्ण माना जाता है। भाषा का मूल रूप ध्वनि पर आधारित है, उन ध्वनियों को केवल सुना और समझा जा सकता है। ध्वनियां तभी तक सुनी जा सकती हैं, जब तक वह बोली जाती हैं परंतु एक सीमा के बाद अधिक दूरी से बोलने पर कुछ स्पष्ट सुनाई नहीं देता। भाषा के विस्तार और ज्ञान को संचित करने के लिए मानव समाज ने लिपियों का अविष्कार किया, जिसकी सहायता से आदि-काल का ज्ञान आज भी सुरक्षित है। इन बातों से ज्ञात होता है कि भाषा जब पूर्ण रूप से विकसित हो गई तभी लिपियों का विकास किया गया। हम आगे लिपियों के विकास पर विस्तृत रूप से चर्चा करेंगे कि किस तरह से मानव पहले कुछ सीमित चित्रों से अपने विचारों को व्यक्त करते थे। फिर धीरे-धीरे लिपि के विभिन्न रूपों का अविष्कार किया। लिपि का संबंध भाषा को मूल (ध्वनियों) से निकाल कर उसे कुछ रेखाओं के द्वारा प्रस्तुत करने का प्रमाण प्रदान करना है।

कालांतर में मानव समाज इतना बड़ा होता चला गया कि वह एक भाषा के माध्यम से विश्व में व्याप्त संपूर्ण ज्ञान को प्राप्त नहीं कर सकता था, इसलिए अनुवाद की परम्परा का विकास हुआ। अनुवाद का मूल उद्देश्य यह था कि मानव किसी भी स्रोत भाषा के ज्ञान को प्राप्त करके उसे लक्ष्य भाषा में आगे आने वाली पीढ़ियों तक आसानी से तथ्यगत प्रमाण के साथ दे सके। वस्तुत: लिप्यंतरण (Transliteration) की प्रक्रिया से अनुवाद-प्रक्रिया का अर्थ ग्रहण किया जाता है, जो सर्वथा दोषपूर्ण है। अनुवाद एक भाषा की प्रत्येक इकाई और उससे प्रतिपादित होनेवाले अर्थ का दूसरी भाषा की इकाइयों और अर्थ में परिवर्तित करने की प्रक्रिया है, जबकि लिप्यंतरण एक भाषा की लिपि का दूसरी भाषा की लिपि में परिवर्तन है। परंतु लिप्यंतरण के संदर्भ में दो लिपि व्यवस्था पाई जाती है। पहली वह व्यवस्था, जो प्रत्येक भाषिक-व्यवस्था के अंतर्गत गठित होती है, जैसे हिंदी के संदर्भ में 'अ' के लिए ‘a’, 'क' के लिए ‘ka’ आदि। दूसरी वह व्यवस्था है, जो अंतरराष्ट्रीय संघ ने अंतरराष्ट्रीय लिपि बनाई है, जिसमें वर्णों को वैज्ञानिक रूप से रखा गया है।

आज अनुवाद कार्य कंप्यूटर द्वारा भी किया जा रहा है, जिसका एक बड़ा क्षेत्र लिप्यंतरण से जुड़ा है। लिप्यंतरण मूलत: संस्कृत का शब्द है, अंग्रेजी में इसे Transliteration कहा जाता है। इसकी व्याख्या सहज शब्दों में इस तरह की जा सकती है कि लिपि का अंतर करना लिप्यंतरण कहलाता है।

भाषा को उसकी प्रचलित लिपि छोड़कर किसी अन्य भाषा का लिपि अथवा अन्य लिपि व्यवस्था में प्रयुक्त करना। उदाहरण के लिए देवनागरी में 'श' को रोमन में लिखने के लिए ‘sh’ के रूप में लिप्यंतरित किया जाता है। रोमन का 'sh' देवनागरी के 'श' का लिप्यंतरित रूप है।

अनुवाद के समय प्रयुक्त होने वाले सांस्कृतिक शब्दों का अनुवाद करना नामुमकिन है क्योंकि हर समाज का अलग पर्व-त्योहार और रीति-रिवाज होता है। उन सभी को तय करने वाला एक समाजिक परिवेश होता है, जो उनके नाम करण है। यहां हिंदी-अंग्रेजी लिप्यंतरण की बात हो रही है, जहां दो भाषा परिवार के साथ-साथ दो विभिन्न लिपियां भी हैं। अगर देखा जाए तो अनुवाद की गुणवत्ता में सुधार लाने के लिए लिप्यंतरण का सहारा लिया जाता है। क्योंकि हिंदी के अनेक ऐसे शब्द हैं, जिनके सिर्फ लिपि परिवर्तन से उसे समझा जा सकता है। लिप्यंतरण को परिभाषित करते हुए कहा जा सकता है कि 'किसी भी भाषा के प्रतीकों को अन्य भाषा के लेखन प्रतीकों में बदलना लिप्यंतरण है।'

लिप्यंतरण भाषा शिक्षण में बहुत उपयोगी साबित हो सकती है, जब कोई शिक्षार्थी किसी अन्य भाषा को सीखता है तो उसे लिपि को समझने में काफी दिक्कतों का सामना करना पड़ता है। उदाहरण के लिए यदि किसी चीनी भाषा-भाषी को हिंदी सीखना हो तो पहले उसे देवनागरी लिपि को पढ़ाना पड़ेगा उसके बाद वह छात्र हिंदी सीखना शुरू करेगा लेकिन शिक्षक पहले छात्र को देवनागरी लिपि से चीनी में लिप्यंतरण करके पढ़ाए तो छात्र को बहुत आसानी होगी, जिससे वह सरलता से सीख सकता है।

लिप्यंतरण की समस्या- अनुवाद और लिप्यंतरण का संबंध आत्मा और शरीर का है, जहां अनुवाद करते समय कोई शब्द ऐसा है, जिसका अनुवाद नहीं हो सकता उसे लिप्यंतरित करके लक्ष्य भाषा में पहुचाया जाता है। अनुवाद करते समय अनुवादक को स्रोत भाषा को लक्ष्य भाषा में लिखने के लिए अतिरिक्त वर्णों की आवश्यकता पड़ती है। डॉ. रामप्रकाश सक्सेना लिप्यंतरण की इस समस्या को दो स्तरों से हल करते हैं-

i. नए वर्णों का निर्माण या पुराने वर्णों में कुछ विशेष चिह्न लगाकर बनाया जा सकता है, जैसे- क़, ख़ आदि।

ii. एक से अधिक वर्णों से किसी एक स्वनिम को अभिव्यक्त करना, जैसे- रोमन लिपि में दो वर्णों द्वारा महाप्राण स्वरों को व्यक्त करना- ख-kh, घ-gh आदि।

यह लिप्यंतरण मशीन के माध्यम से किया जाएगा इसलिए कई समस्याओं का सामना करना होगा पहला यह कि इसका आधार क्या होगा? अंग्रेजी शब्दों की स्पेलिंग दिया जाए या हिंदी के उच्चारण को अधार माना जाए। इन सभी बातों को ध्यान में रखते हुए इसको वैकल्पिक ज्ञानाधारित (optional knowledge basad) बनाया गया है। इसके लिए दो टेबल लेकर अंग्रेजी के उन शब्दों को रख दिया है, जो हिंदी भाषा के प्रयोग में लाए जाते हैं।

मशीनी अनुवाद में लिप्यंतरण- मशीनी अनुवाद में किसी भी पाठ को स्रोत भाषा से लक्ष्य भाषा में अनुवादित किया जाता है। आज का विकसित समाज विश्वग्राम की संकल्पना कर रहा है। ऐसा तभी हो सकता है, जब समूचा विश्व आसानी से एक दूसरे से संप्रेषण्ा कर ले किन्तु यह भी इतनी आसानी से होनेवाला नहीं है क्योंकि एक व्यक्ति अधिक से अधिक दो या तीन भाषाओं पर सफलता प्राप्त कर सकता है। इन सभी बातों को ध्यान में रखकर ही कंप्यूटर वैज्ञानिकों और भाषा वैज्ञानिको ने मिल कर अनुवाद को मशीन के माध्यम से करने का प्रयास प्रारम्भ किया। आज वह प्रयास काफी हद तक सफल भी है। वाक्य के प्रत्येक घटकों का भाषा की प्रकृति के अनुकूल अनुवाद किया जाता है। परंतु भाषा में कुछ शब्द ऐसे होते हैं, जिनके अनुवाद से स्रोतभाषा पाठ में संचित अर्थ का खंडन होता है; जैसे- सांस्कृतिक शब्द, नामवाची शब्द आदि। इसलिए आवश्यकता होती है कि ऐसे शब्दों का लिप्यंतरण किया जाए। उदाहरणस्वरूप ंसिंदूर, बुरका, जनेऊ, गंगाजल, चरणामृत आदि ऐसे कई शब्द हैं, जिनका अनुवाद करने से इन शब्दों का वास्तविक अर्थ-सौंदर्य नष्ट होगा। नामवाची सभी शब्दों का भी अनुवाद नहीं किया जा सकता; जैसे- राजा, कमल, रानी, मुस्कान आदि नामों का अनुवाद करने से इनके अर्थ का अनर्थ हो जाता है। ऐसे में लिप्यंतरण की अवाश्यकता होती है। इस समस्या से बचने के लिए शब्दों के लिए मशीनी अनुवाद हेतु विशेष प्रकार का डाटाबेस बना कर स्रोत्र भाषा के शब्दों को लक्ष्य भाषा में लिप्यंतरित करके रखा जाता है, जिससे सूचना प्रत्यानयन में सुविधा हो सके।

उपसंहार

भाषा समाज का आईना होता है, जिसे लेखन रूप में लिपि के माध्यम से व्यक्त किया जाता है। किसी लिपि के विकास से भाषा का विकास नहीं हो सकता क्योंकि किसी भाषा के बोलनेवालों की संख्या पर ही भाषा का विस्तार माना जा सकता है। जब इस विस्तृत क्षेत्र को संरक्षित करने की आवश्यकता महसूस होती है, तब लिपि का महत्त्व प्रतिपादित होता है। प्रत्येक भाषा की अपनी कुछ स्वायत्ता व्यवस्था होती है अर्थात किसी समाज और संस्कृति की विशेषताओं को द्योतित करने वाले शब्द और उसके अर्थ को हूबहू व्यक्त करने की क्षमता भाषा विशेष में निहित होती है। भाषा और लिपि में अन्योन्याश्रित संबंध होने के कारण ही ऐसे शब्दों और उनके अर्थों को उस भाषा विशेष की लिपि द्वारा व्यक्त किया जा सकता है। इसी को केंद्र में रखकर इस मॉडल का निर्माण किया गया है। इस संदर्भ में देवनागरी और रोमन की विशेषताओं और समानताओं-असमानताओं को विश्लेषित कर ऐसे नियम निर्मित हुए हैं, जिसकी सहायता से किसी भी हिंदी पाठ को अंग्रेजी पाठ में लिप्यंतरित किया जा सकता है। इससे कोई अंग्रेजी पाठक हिंदी समाज और संस्कृति की विशेषताओं से और हिंदी पाठक अंग्रेजी समाज और संस्कृति की विशेषताओं से बिना किसी अर्थ-खंडन के भलीभांति समझ सकता है। साथ ही अनुवाद के संदर्भ में हिंदी के सांस्कृतिक परिवेश में प्रयुक्त हुए शब्द, हिंदी नामों को यथावत् प्रस्तुत किया जा सकता है।

सं र्दभ सूची-

1. कुमार, नरेश. 'भाषा और लिपि* (2008) गरिमा बुक्स प्रकाशन, दिल्ली।

2. सिंह, दिलीप. 'भाषा का संसार* (2008) वाणी प्रकाशन, दिल्ली।

3. गोस्वामी, कृष्णकुमार. 'शैक्षिक व्याकरण और व्यवहारिक हिंदी* (2002) आलेख प्रकाशन, दिल्ली।

4. जैन, वृषभ प्रसाद. 'मशीनी और मशीनी अनुवाद' (1995) सारांश प्रकाशन प्रा.लि, दिल्ली।

5. टण्डन, पूरनचन्द्र, सेठी, हरीश कुमार. 'अनुवाद के विविध आयाम*-(2005) तक्षशिला प्रकाशन, दिल्ली।

6. तिवारी, भोलानाथ. 'हिंदी भाषा की लिपि संरचना* (2001) साहित्य सहकार, दिल्ली।

7. तिवारी, भोलानाथ. 'भाषाविज्ञान* (2005) किताब महल, इलाहाबाद।

8. त्रिपाठी, सत्यनारायण. 'हिंदी भाषा और लिपि का ऐतिहासिक विकास' (2006) विश्वविद्यालय प्रकाशन, वाराणसी।

9. सक्सेना, रामप्रकाश. 'लिप्यंतरण : सिध्दांत एवं प्रयोग* (2004) वैभव प्रकाशन, छत्तीसगढ़।

10. सिंह, सूरजभान. 'अंग्रेजी हिन्दी अनुवाद व्याकरण* (2003) प्रभात प्रकाशन, दिल्ली।

11. श्रीवास्तव, रविन्द्रनाथ. 'अनुप्रयुक्त भाषा विज्ञान सिध्दान्त एवं प्रयोग* (2000) राधाकृष्ण प्रकाशन प्राइवेट लि., दिल्ली।

12. श्रीवास्तव, रविन्द्रनाथ, तिवारी, भोलानाथ, गोस्वामी, कृष्ण कुमार. 'अनुप्रयुक्त भाषा विज्ञान* (1995) आलेख प्रकाशन, दिल्ली।

13. शर्मा, राजमणि, 'आधुनिक भाषा-विज्ञान* (2007) वाणी प्रकाशन, दिल्ली।

14. मल्होत्रा, विजय कुमार (2002) कंप्यूटर के भाषिक अनुप्रयोग; साहित्य सहकार, नई दिल्ली।

15. रस्तोगी, कविता (2000) समसामायिक भाषाविज्ञान; सुलभ प्रकाशन, लखनऊ।

वेबसाइट

•hhttp://books.google.co.in/books?id=QbrIVd9H9xAC&printsec=frontcover&dq=language+:#v=onepage&q&f=false

•http://hi.wikipedia.org/wiki/हिन्दी


Tags:

Computational Linguistics, Language Technology, Machine Translation, Transliteration