प्राकृतिक भाषा संसाधन में संदिग्धार्थकता की प्रकृति
मानव समुदाय आपस में विचार विनिमय करने हेतु किसी न किसी प्राकृतिक भाषा का प्रयोग करता है। इसी प्राकृतिक भाषा के प्रयोग से मानव अपने दैनिक जीवन के सभी कार्य को पूर्ण करने में सफल हो पाता है। समस्त भाषाओं की अपनी एक वाक्य संरचना होती है, जिसके माध्यम से मानव अपनी अभिव्यक्ति को पूरा करता है। कभी-कभी भाषा की संरचना अथवा प्रकार्य का गठन ही कुछ ऐसा हो जाता है कि वह शब्द अथवा वाक्य एकाधिक अर्थ को प्रकट करने लगता है, जिससे मानव आपस में विनोद भी करने लगता है। भाषावैज्ञानिक दृष्टिकोण से ऐसे एकाधिक अर्थ को प्रकट करने वाले शब्दों अथवा वाक्यों को ‘अनेकार्थक’ या ‘संदिग्धार्थक’ शब्द अथवा वाक्य कहते हैं। मानव भाषिक अभिव्यक्ति को पूरा करने में जिन-जिन कारक तत्वों अथवा घटकों के द्वारा संदिग्धार्थकता उत्पन्न होती है, उनका संक्षिप्त अध्ययन एवं विश्लेषण यहाँ पर किया गया है। चूँकि आज सूचना प्रौद्योगिकी का युग है इसलिए प्रौद्योगिकी को भी संदिग्धार्थकता कैसे प्रभावित करती है; के विभिन्न कारणों को स्पष्टत: यहाँ पर समझा जा सकता है।
भाषा अभियांत्रिकी के प्रमुख दो लक्ष्य हैं: पहला प्राकृतिक भाषा का विश्लेषण, संसाधन एवं संश्लेषण तथा दूसरा प्राकृतिक भाषा को संगणक के समझने योग्य बनाना। इन दोनों ही परिस्थिति की समस्याओं में से एक प्रमुख समस्या ‘संदिग्धार्थकता’ की समस्या है। मानवीय भाषिक अभिव्यक्ति के अंतर्गत संदिग्धार्थकता की समस्या कम होती है क्योंकि उसके पास संदर्भगत एवं सांसारिक ज्ञान का भण्डार होता है जबकि संगणक का ज्ञान मानव द्वारा प्रदत्त ज्ञान तक ही सीमित होता है। जिस कारण संगणक में संदिग्धता की समस्या पर्याप्त मात्रा में होती है। चूँकि संगणक में विश्व की समस्त भाषाओं के शब्दों को भण्डारित अथवा विस्तृत कार्पस का संकलन कर उसका विश्लेषण, संसाधन एवं संश्लेषण कर समझने योग्य बनाया जाता है जहां पर एक शब्द, पद, पदबंध एवं वाक्य के अर्थ को प्रकट करने वाले एकाधिक होते हैं, जिससे यह संदिग्धता आ जाती है कि संगणक किस अर्थ को ग्रहण करे। यहाँ पर संगणक के लिए ज्यादा आवश्यक हो जाता है कि भाषा के प्रत्येक स्तर पर एकाधिक अर्थ को प्रकट करने वाली समस्याओं को रेखांकित कर उसके समाधान हेतु नियमों का प्रतिपादन एवं निरूपण किया जाय।
संदिग्धार्थकता की परिभाषा:
मानव अपने समुदाय में विचार-विनिमय करने के लिए भाषिक अभिव्यक्ति का प्रयोग करता है, जिसके अर्थबोध में एक संदर्भगत अभिव्यक्ति भी होती है। यह भाषिक अभिव्यक्ति विभिन्न प्राकृतिक भाषा के द्वारा किया जा सकता है। सस्यूर ने भाषिक अभिव्यक्ति का संबंध प्रतीक के संकेतार्थ को माना है, जिसके कारण किसी भी शब्द, पदबंध, वाक्य एवं प्रोक्ति के अर्थ का निर्धारण होता है। भाषा के अर्थ को समझने के लिए शब्द, पद, पदबंध, वाक्य एवं प्रोक्ति का संकेतिक वस्तु बनना अतिआवश्यक हो जाता है। जब तक सभी स्तर के संकेतिक वस्तु नहीं बनते तब तक भाषा की अभिव्यक्ति पूर्ण नहीं होती है। कभी-कभी किसी शब्द, पद, पदबंध, वाक्य, प्रोक्ति का एकाधिक संकेतिक वस्तुओं का बनना ही संदिग्धार्थकता को प्रकट करना होता है। ‘संदिग्धार्थकता’ शब्द का विस्तार बहुत बड़ा है लेकिन यह भाषा के प्रकरण के आधार पर बहुत ही छोटा हो जाता है। सामान्य प्रयोग में ‘संदिग्धार्थकता’ वाक्य की प्रकृति पर निर्भर करता है जिसे एकाधिक अर्थों में व्याख्यायित कर सकते हैं और जिसके अपर्याप्त कारण मौजूद होते हैं। संगणकीय भाषाविज्ञान के संदर्भ में कई विद्वानों ने संदिग्धार्थकता को परिभाषित किया है जो निम्नानुसार है-
विलियम एम्प्सन ने 7 Types of ambiguity नामक पुस्तक में संदिग्धार्थकता को परिभाषित करते हुए लिखा है कि- “Any Verbal nuance, however slight, which gives room for alternative reaction to the same piece of language.”
केन्ट बैच , राउटलेज इन्साइक्लोपेडिया ऑफ फिलॉसफी इन्ट्री ऑन एम्बीग्युटी में संदिग्धार्थकता को परिभाषित करते हुए लिखा है कि- “A word, phrase, or sentence is ambiguous if it has more than one meaning. ”
ब्रेन्डन एस . गिल्लोन ने AMBIGUITY, GENERALITY, AND INDETERMINACY: TESTS AND DEFINITIONS नामक शोध पत्र में संदिग्धार्थकता की परिभाषा देते हुए कहा है कि – “An expression is ambiguous if the expression has more than one meaning”.
लोबन र के अनुसार- “an expression or utterance is ambiguous if it can be interpreted in more than one way . ”
उल्मान के मतानुसार- “Ambiguity as a linguistics condition which can arise in variety of ways”.
उपर्युक्त परिभाषाओं से ‘संदिग्धार्थकता’ के बारे में तीन प्रमुख बातें स्पष्ट हो रही है जो इस प्रकार हैं-
अ. एक शब्द के कई अर्थों में प्रयोग के द्वारा।
आ. वाक्य के विभिन्न वाक्यात्मक संरचना के प्रयोग द्वारा।
इ. विभिन्न अर्थों में भाषिक अभिव्यक्ति के प्रयोग द्वारा।
उपर्युक्त परिभाषाओं के आधार पर संदिग्धार्थकता को संक्षिप्त रूप में इस प्रकार परिभाषित किया जा सकता है- “एक शब्द, पद, पदबंध, वाक्य, संकेत पद्धति, संकेत, प्रतीक अथवा विचार विनिमय के अन्य माध्यमों के रूप में प्रयुक्त होने वाले तत्व जिन्हें एकाधिक अर्थों में व्याख्यायित किया जा सकता है, उसे ‘संदिग्धाथर्कता’ कहते हैं”।
संदिग्धार्थकता का वर्गीकरण :
संदिग्धार्थकता के वर्गीकरण को विभिन्न विद्वानों ने भाषाविज्ञान के आधार पर अलग-अलग प्रकार से वर्गीकृत किए हैं, प्रस्तुत शोध-पत्र के अंतर्गत संगणकीय भाषाविज्ञान के आधार पर वर्गीकृत किया गया है जो इस प्रकार हैं:
1. पाठ संसाधान में आने वाली संदिग्धार्थकता :
पाठ संसाधान की प्रक्रिया हेतु मशीन में पाठ को इनपुट किया जाता है और इसकी एक निश्चित संसाधन प्रक्रिया संपन्न करने के पश्चात आवश्यक आउटपुट पाठ के रूप में प्राप्त किया जाता है। संसाधन प्रक्रिया में पाठ का सामान्यीकरण कर उसे सरल और सहज रूप में विश्लेषित एवं संश्लेषित किया जाता है। विश्लेषण एवं संश्लेषण के दौरान प्राकृतिक भाषा की अपनी विशेषता के कारण विभिन्न प्रकार की संदिग्धार्थकता प्रजनित हो जाती है। उक्त पाठ संसाधन में आने वाली संदिग्धार्थकता को निम्न प्रकारों में वर्गीकृत किया जा सकता है:
1.1. स्थानीय संदिग्धार्थकता :
स्थानीय संदिग्धार्थकता का अर्थ वाक्य संरचना के अंतर्गत किसी एक भाग से है जो दो यो दो से अधिक अर्थ को ध्वनित करता है। स्थानीय संदिग्धार्थकता को कभी-कभी वाक्यगत विश्लेषण कर विसंदिग्ध किया जा सकता है।
उदाहरण- गर्म चाय और दूध पीने में अच्छा लगता है।
[गर्म चाय] और [दूध] पीने में अच्छा लगता है।
गर्म [चाय और दूध] पीने में अच्छा लगता है।
पाठ संसाधन में स्थानीय संदिग्धार्थकता को निम्न प्रकार से देखा जा सकता है:
1.1.1. शब्द स्तरीय संदिग्धार्थकता :
पाठ संसाधन में जब किसी एक शब्द के एकाधिक अर्थ प्रकट होते हैं एवं
मशीन उस शब्द के सही अर्थ को प्राप्त करने में असमर्थ हो जाती है तब वह ‘शब्द स्तरीय’ संदिग्धार्थकता कहलाती है। उदाहरण- मुझे सोना चाहिए।
1.1.2. संरचनात्मक संदिग्धार्थकता :
जब भाषा की वाक्य संरचना एवं व्याकरणिक संरचना दोनों ही शुद्ध एवं सही हो परन्तु वाक्य संरचना को एकाधिक अर्थों में व्याख्यायित किया जा सके तब वह संरचनात्मक संदिग्धार्थकता कहलाती है। संरचनात्मक संदिग्धार्थकता के अंतर्गत पदबंध अथवा वाक्यांश के बीच ज्यादातर संदिग्धता उभरती है जिसे निम्न प्रकार से वर्गीकृत किया जा सकता है:
1.1.2.1. वाक्यात्मक संदिग्धार्थकता :
भाषा के वाक्य-रचना में स्वीकृत ढांचे के अंतर्गत प्राय: कुछ ऐसे वाक्य मिल जाते है जिनकी वाक्य संरचना एवं व्याकरणिक संरचना दोनों ही शुद्ध एवं सही होते हैं लेकिन इनकी संरचनात्मक गठन ही ऐसा होता है कि वे एक से अधिक अर्थ को ध्वनित करते हैं, जो ‘संदिग्ध ’ होते हैं।
उदाहरण– राम को कुर्ता-पजामा अच्छा लगता है।
राम को कुर्ता-पजामा पहनना पसंद है।
राम को कुर्ता-पजामा फबता है।
1.1.2.2. पदबंधीय संदिग्धार्थकता :
पदबंध या वाक्यांश आपस में संबद्ध दो या दो से अधिक शब्दों का समूह होता है, जिसके कई अर्थ तो निकलते हैं परन्तु कोई पूरी बात मालुम नहीं होती। पाठ संसाधन में जब वाक्य के किसी एक भाग यानि किसी एक पदबंध स्तर पर ‘संदिग्धार्थकता’ पाई जाती है, वह ‘पदबंधीय संदिग्धार्थकता’ कहलाती है। पदबंधीय संदिग्धार्थकता को निम्न प्रकार से समझा जा सकता है:
1.1.2.2.1. संज्ञा पदबंधीय संदिग्धार्थकता :
संज्ञा पदबंध में संज्ञा एक अनिवार्य घटक होता है जिसके साथ ऐच्छिक रूप से विशेषकों का प्रयोग हो सकता है। इस रूप में संज्ञा पदबंध एक अंत:केन्द्रिक रचना विशेषक का प्रयोग होता है। जब अनिवार्य घटक के रूप में प्रयुक्त संज्ञा एवं इसके विशेषकों की वाक्य संरचना का गठन इस प्रकार हो कि वाक्य एकाधिक अर्थों को प्रकट करें, तब संज्ञा पदबंध स्तरीय संदिग्धार्थकता कहलाती है। संज्ञा पदबंधीय संदिग्धार्थकता को निम्न उदाहरणों में देखा जा सकता है-
उदाहरण – मुर्गा खाने को तैयार है।
[मुर्गा] [खाने को] तैयार है।
[मुर्गा खाने] [को] तैयार है।
1.1.2.2.2. क्रिया पदबंधीय संदिग्धार्थकता:
पाठ संसाधन में जब किसी भी वाक्य का क्रिया पदबंध एकाधिक अर्थों को ग्रहण करने की क्षमता से युक्त होता है, तब उसे क्रिया पदबंधीय संदिग्धार्थकता कहते हैं। मुख्यत: क्रिया पदबंध में जब दो या दो से अधिक कोशीय क्रिया प्रयुक्त होती है, तब क्रिया पदबंधीय संदिग्धार्थकता प्रदर्शित होती है।
उदाहरण– वह खाता चला जा रहा है।
वह [खाता चला जा] रहा है।
वह [खाता][चला जा] रहा है।
1.1.2.2.3. विशेषण पदबंधीय संदिग्धार्थकता:
विशेषण पदबंध भी एक अंत:केन्द्रिक संरचना है जिसका शीर्ष एक विशेषण होता है तथा अन्य घटक इसकी विशेषता बताते है। जब अनिवार्य घटक विशेषण एवं प्रयुक्त विशेषकों की वाक्य संरचना के गठन में जब दोनों का अपना-अपना स्वतंत्र होता है अथवा इनका जुड़ाव विधेय विषेशण के रूप में या विशेषक के रूप में होता है तब विशेषण पदबंधीय संदिग्धार्थकता पाई जाती है, जिसे ‘विशेषण पदबंधीय संदिग्धार्थकता’ कहते हैं।
उदाहरण- राम ने मुझे हल्की काली पुस्तक दी।
राम ने मुझे [हल्की][ काली पुस्तक] दी।
राम ने मुझे [हल्की काली ][पुस्तक] दी।
1.1.2.2.4. क्रिया विशेषण पदबंधीय संदिग्धार्थकता:
जब क्रिया विशेषण/परसर्गीय पदबंध का जुड़ाव कर्ता अथवा कर्म के बीच संदिग्ध होता है अर्थात् यहाँ पर यह अस्पष्ट रहता है कि कर्ता अथवा कर्म में से इस पदबंध का जुड़ाव किसके साथ है तो इसे क्रिया विशेषण/परसर्गीय पदबंध संदिग्धार्थकता कहते हैं। इस पदबंध की संदिग्धार्थकता को समझने हेतु निम्न उदाहरण प्रस्तुत हैं-
उदाहरण : राम ने दौड़ते हुए कुत्ते को देखा।
[राम ने दौड़ते हुए][कुत्ते] को देखा।
[राम ने][दौड़ते हुए कुत्ते] को देखा।
1.2. वैश्विक संदिग्धार्थकता :
जब एक पूरे वाक्य को एकाधिक अर्थों में व्याख्यायित किया जा सके एवं उसे वाक्य स्तर पर विश्लेषित कर विसंदिग्ध न किया जा सके तब वह वैश्विक संदिग्धार्थकता कहलाती है। वैश्विक संदिग्धार्थकता हेतु संदर्भित अर्थ एवं प्रैगमैटिक विश्लेषण अति आवश्यक हो जाता है। अर्थात् बिना संदर्भ अथवा प्रकरण के पूरे वाक्य को ही नहीं समझा जा सकता है क्योंकि पूरा वाक्य एकाधिक अर्थ को प्रकट करता है। वैश्विक संदिग्धार्थकता को निम्न प्रकार से समझा जा सकता है:
1.2.1. अर्थीय संदिग्धार्थकता:
भाषा में कुछ ऐसे वाक्यों का प्रयोग किया जाता है जो पूर्णत: संदर्भ आधिारित होते है। ऐसे वाक्य एकाधिक अर्थ को ध्वनित करते हैं, जिन्हें संदर्भ के बिना समझ पाना मशीन को ही नहीं बल्कि मानव को भी मुश्किल हो जाता है। जो वाक्य संरचना एवं व्याकरणिक संरचना दोनों पूर्ण एवं शुद्ध होते हैं परंतु भाषा की संरचना के आधार पर संदर्भ का गठन ही ऐसा होता है कि उन्हें संदर्भ से विलग करने पर कई अर्थों को ग्रहण करने की क्षमता से परिपूर्ण होता है। कुछ ऐसे वाक्यों को उदाहरण स्वरूप यहाँ पर देखा जा सकता है।
उदाहरण- तेरा भेजा चाट खाएंगे।
तुम्हारे द्वारा भेजा हुआ खाद्य पदार्थ चाटकर खाएंगे।
तुम्हारी बुद्धि को ठीक से काम नहीं करने देंगे।
तुम्हारे द्वारा भेजे हुए ‘चाट’ को खाऐंगे
1.2.2. अन्वादेशिक संदिग्धार्थकता :
अन्वादेश एक ही पाठ में पीछे की संरचना को आगे की संरचना से जोड़ता है। हिंदी के सर्वनाम ज्यादातर अन्वादेशक के रूप में कार्य करते हैं। जब वाक्य संरचना के अग्र भाग में कर्ता और कर्म दोनों की अर्थीय संरचना लगभग एक तरह की होती है तब अन्वादेशक का संबंध किसके साथ होता है; यह अस्पष्ट हो जाता है, तो इस परिस्थिति में उत्पन्न संदिग्धता ‘अन्वादेशिक संदिग्धार्थकता’ कहलाती है।
उदाहरण– जब मोहन हिरण का शिकार कर रहा था तब वह जंगल की तरफ भागा।
जब मोहन हिरण का शिकार कर रहा था तब मोहन जंगल की तरफ भागा।
जब मोहन हिरण का शिकार कर रहा था तब हिरण जंगल की तरफ भागा।
2. वाक् संसाधन में आने वाली संदिग्धार्थकता :
जिस तरह मानव-मानव के बीच संवाद स्थापित होता है, ठीक उसी प्रकार मानव-मशीन के बीच संवाद स्थापित किया जा सकता है। मानव-मशीन के बीच संवाद स्थापित करते वक्त वाक् का संसाधन आवश्यक हो जाता है। वाक् को संसाधित करने पर कई प्रकार की समस्याएं प्राप्त होती है जिनमें से ‘संदिग्धार्थकता’ की समस्या महत्वपूर्ण समस्या है। यहाँ पर वाक् संसाधन में आने वाली ‘संदिग्धार्थकता’ का वर्गीकरण निम्न प्रकार से किया जा सकता है:
2.1. संगम (Juncture) :
वाक् संसाधन में जब किसी भी शब्द में प्रथम ध्वनि के पश्चात द्वितीय ध्वनि को उच्चरित किया जाता है तब प्रयुक्त शब्द के मध्य में लघु-काल के लिए रूकना आवश्यक हो जाता है। “जिसे हिंदी में संगम एवं अंग्रेजी में Juncture कहते हैं”।
जैसे- तुम्हारे — तुम हारे
सामान लादो – सामान ला दो
शराब पीली है – शराब पी ली है
उपर्युक्त शब्द ‘तुम्हारे’ के उच्चारण में वर्णों के बीच किसी प्रकार के ठहराव की आवश्यकता नहीं है लेकिन ‘तुम हारे’ में ‘तुम’ और ‘हारे’ के बीच यदि संगम न हो तो ‘तुम्हारे’ हो जाएगा।
2.1.1. बलाघात (Stress Accent) :
मानव द्वारा उच्चरित वाक्यों पर समान मात्रा में बल लगा पाना मुश्किल कार्य होता है। “संदर्भ के आधार पर वाक्य के किसी एक शब्द पर ज्यादा बल देकर उच्चारित किया जाता है, जिसे ‘बलाघात’ कहते हैं”। मशीन के द्वारा वाक् संसाधन में प्रयुक्त एक शब्द के बलाघात की पहचान करना मुश्किल हो जाता है एवं मशीन उचित अर्थ वाले वाक्य को ग्रहण करने में असमर्थ हो जाती है। अर्थात जब मशीन के पास एक वाक्य के प्रयोगिक आधार पर एकाधिक अर्थ प्रकट होते हैं तो वहां यह संदिग्धता विद्यमान हो जाती है कि सही मायने में किस अर्थ को ग्रहण किया जाय।
जैसे – मोहन बाजार जा रहा है।
अर्थ – केवल मोहन बाजार जा रहा है, कोई दूसरा नहीं।
मोहन बाजार जा रहा है।
अर्थ – मोहन अभी बाजार जा रहा है, किसी दूसरी जगह और समय में जायेगा।
2.1.2. सुरलहर (Intonation):
वाक् संसाधन में जब किसी वाक्य को एकाधिक सुर में प्रयोग किया जाता है तब इसके एकाधिक अर्थ भी प्रकट होते हैं। वक्ता द्वारा उच्चरित वाक्य किस सुर में बोला गया यह महत्वपूर्ण होता है जो विभिन्न अर्थों को समझने में मदद करता है। अत: वाक् संसाधन में वाक्य के विभिन्न अर्थ में संदिग्धता विद्यमान रहती है। जैसे- ‘तुम जा रहे हो’
उपर्युक्त वाक्य में यदि तुम के बाद की ध्वनियों का सुर बढ़ाते जाएं और ‘हो’ को बहुत ऊंचे सुर पर बोले तो अर्थ होगा – क्या तुम जा रहे हो? एक सामान्य कथन वाले वाक्य को प्रश्नवाचक वाक्य में बदल देना सुरलहर का ही काम है। लिखित भाषा में तो विराम चिह्नों के द्वारा वाक्यों को विविध भावों के द्योतक बना देते हैं और इससे पढ़ने वालों को अर्थबोध में कोई कठिनाई नहीं होती। परन्तु श्रव्यभाषा में वाक्यों का सारा अर्थ सुरलहर जैसे भाषिक तत्वों पर ही निर्भर करता है।
2.1.3. विराम (Pause) :
विराम का शाब्दिक अर्थ ‘ठहराव’ होता है। पदबंधो अथवा वाक्यों को बोलने में हम किसी शब्द पर थोड़ी देर के लिए रूक जाते हैं, यही विराम है। वाक् संसाधन में भी विराम का महत्वपूर्ण योगदान होता है अन्यथा सहजतम रूप से एकाधिक अर्थ प्रकट होने लगते हैं।
जैसे – पकड़ो मत जाने दो
1. पकड़ो, मत जाने दो
2. पकड़ो मत, जाने दो।
निष्कर्ष :
प्राकृतिक भाषा संसाधन के अंतर्गत ‘संदिग्धार्थकता’ की समस्या एक प्रमुख समस्या है, जो विभिन्न अवस्था में भिन्न-भिन्न स्वरूप ग्रहण करती है एवं विभिन्न स्तरों पर भाषा के अर्थ को प्रभावित करती है। प्रस्तुत शोध-पत्र के अंतर्गत हिंदी भाषा के विभिन्न स्तरों में आने वाली संदिग्धार्थकता को संक्षिप्त रूप में समझा जा सकता है। प्राकृतिक भाषा संसाधन में संदिग्धार्थकता की समस्या का विश्लेषण एवं उनका निश्चित समाधान प्रस्तुत शोध पत्र से किया जा सकता है।
संदर्भ-सूची:
1. ओझा, त्रिभुवन. हिंदी में अनेकार्थकता का अनुशीलन. विश्वविद्यालय प्रकाशन: वाराणसी. 1986.
2. सिंह, सूरजभान. हिंदी का वाक्यात्मक व्याकरण. साहित्य सहकार प्रकाशन : दिल्ली. 1985.
3. सिंह, सूरजभान. अंग्रेजी-हिंदी अनुवाद व्याकरण. प्रभात प्रकाशन : दिल्ली. 2000.
4. श्रीवास्तव, रवीन्द्रनाथ. भाषाविज्ञान सैद्धान्तिक चिंतन. रामकृष्ण प्रकाशन : नई दिल्ली. 1997.
5. गुरु, कामताप्रसाद. हिंदी व्याकरण. लोकभारती प्रकाशन : इलाहाबाद. 2009.
6. मल्होत्रा, विजय कुमार. कंप्यूटर के भाषिक अनुप्रयोग. वाणी प्रकाशन : नई दिल्ली. 2002.