April 24, 2024

సహజ భాషా ప్రవర్తనం (Natural Language Processing) – 2

రచన : సౌమ్య వి.బి.

 

“కంప్యుటేషనల్ లింగ్విస్టిక్స్” అని ఒక జర్నల్ ఉంది. Computational Linguistics అంటే గణనాత్మక భాషాశాస్త్రం (అనుకుందాం తాత్కాలికంగా). సాధారణంగా, సహజ భాషా ప్రవర్తనానికి సమానార్థకంగానే వాడుతూ ఉంటారు. సహజ భాషా ప్రవర్తనం (నేచురల్ లాంగ్వేజీ ప్రాసెసింగ్ – రంగంలోని ప్రముఖ పత్రికల్లో ఇదీ ఒకటి. తరుచుగా సమకాలీన పరిశోధనల గురించిన పత్రాలతో పాటు, “చివరి మాటలు” (Last Words) అన్న శీర్షికన, ఈ పరిశోధనల గురించిన ఆలోచనల వ్యాసాలు కూడా వస్తూ ఉంటాయి. ఇటీవలి కాలంలో (అంటే జూన్ 2010 లో) ఈ శీర్షికలో వచ్చిన వ్యాసం తాలూకా స్వల్ప పరిచయమే ఈ నా వ్యాసం. ఇదివరలో ఎన్.ఎల్.పీ. గురించి రాసిన వ్యాసానికి కొనసాగింపు కాకపోయినా, సంబంధితమైనది అని అనుకోవడం వల్ల, రాస్తున్నాను.
(వ్యాసంలో పదజాలం చాలా మట్టుకు మూల రచనదే.)

ఇంతకీ, నేను మాట్లాడుతున్న వ్యాసం:
What computational linguists can learn from psychologists (and vice versa)
దీని రచయిత: Emiel Krahmer.
ఆంగ్ల మూలం ఇక్కడ లభ్యం:

 

భాషా సంబంధిత సాంకేతికత ఈ పాతికేళ్ళలో ఎవరూ ఊహించనంత మలుపులు తిరిగింది. పాతికేళ్ళ క్రితం “వాక్ప్రవర్తనం” (Speech Processing)  అభివృద్ధి గురించి మాట్లాడినంతగా దీని గురించి ఎవరూ మాట్లాడలేదు. కానీ, ఇప్పుడు ముఖ్యంగా అంతర్జాలం ఎదిగినందువల్ల, భాషా సంబంధిత సాంకేతికత చాలా వేగంవా వ్యాప్తి చెందింది.
అయితే, భాష అంటే అదొక్కటే కాదు. చెప్పేవారి నుండి వచ్చే మాటల వెనుక, ఒక క్లిష్టమైన నిర్మాణ ప్రక్రియ ఉంది. అలాగే వినేవాడి మస్తిష్కంలో కూడా ఒక క్లిష్టమైన అర్థం చేసుకునే ప్రక్రియ ఉంటుంది. కానీ, ప్రస్తుత పరిశోధనల్లో, ఈ రెండు ప్రక్రియలనీ అర్థం చేసుకునే ప్రయత్నం జరగడం లేదు. భాషని ఒక ప్రక్రియగా (process) కంటే ఒక ఉత్పత్తి (product) గా అర్థం చేస్కుని సాగుతోంది ప్రస్తుత పరిశోధన.  మాటలు వింటున్నప్పుడు అవతల వ్యక్తి మనోగతం కూడా తెలుస్తుంది, ఎలాంటి పదాలు వాడుతున్నాడు? ఎలా వాడుతున్నాడు? అనేదాన్ని బట్టి. అయితే, ప్రస్తుత పరిశోధనల్లో ఇలాంటి అంశాలు పరిగణలలోకి తీసుకోవడం లేదు. ఈ రంగంలో పరిశోధనలు మొదలైన తొలినాళ్ళలో పరిస్థితి కొంచెం వేరు.  భాషా ప్రవర్తనం కోసం ప్రజ్ఞాన (cognitive) కోణాలని కూడా పరిశోధించిన దాఖలాలు ఉన్నాయి. అప్పటి పరిశోధనల్లో మానవ భాషకి సాంకేతిక నమూనా సిద్ధం చేసే ప్రయత్నంలో మానసిక శాస్త్ర పరిశోధనా ఫలితాలను కూడా పరిశీలించిన ఉదాహరణలు ఉన్నాయి. ఈ కోణంలో, మానసికశాస్త్ర పరిధిలోని కొన్ని ఇటీవలి పరిశోధనలనీ, అవి మన ప్రస్తుత విషయానికి ఏ విధంగా ఉపయోగపడగలవు అన్నదీ చూద్దాము.

భాష ఉపయోగం, సామాజిక ప్రభావం:

సామాజిక మానస్తత్వవేత్తలు ఒక వ్యక్తికి ఇతర వ్యక్తులతో ఉండే సంబంధాల గురించి అధ్యయనం చేస్తారు. అందులో భాగంగా, కొందరు మనుషులు వివిధ సందర్భాల్లో ఉపయోగించే భాష మీద కూడా పరిశోధనలు చేసారు. వీటిల్లో ఒక ఉపశాఖ “వ్యవహార పదాల” (నాకు Function words ని తెలుగులోకి అనువదించడం తెలియలేదు.) వాడుక గురించి. ఇక్కడ వ్యవహార పదాలు అంటే – సర్వనామాలు, ఉపసర్గలు (Preposition-బూదరాజు ఆధునిక వ్యవహార కోశం),  ఉపపదాలు (Article -బూదరాజు ఆధునిక వ్యవహార కోశం),  సముచ్చయాలు (Conjunctions – బూదరాజు ఆధునిక వ్యవహార కోశం) మరియు సహాయక క్రియలు(Auxiliary Verbs).

ఈ కోణంలోకనుక్కున్న ఒక ముఖ్యమైన ఇషయం – ప్రథమ పురుషలో వాడే సర్వనామాలు నిరాశాజనకమైన స్థితిని సూచించే అవకాశం ఉందనడం. ఉదాహరణకు మానసిక వ్యాకులతకు గురైన విద్యార్థులు తక్కిన విద్యార్థులతో పోలిస్తే  “నేను”,”నాకు” వంటి సర్వనామాలు ఎక్కువగా వాడతారని, అలాగే ఈ రెండో శాఖలో కూడా ఎప్పుడో ఒకప్పుడు ఇలాంటి మానసిక వ్యాకులతకు గురైన వారిలో మళ్ళీ తక్కిన వారితో పోలిస్తే ఈ ప్రథ పురుష సర్వనామాల వాడుక ఎక్కువనీ పరిశోధనల్లో తేలింది.  అలాగే,  ఆత్మఘాతుక భావాలు గల కవుల రచనల్లోనూ, మిగితా వారికంటే ఈ “నేను, నా, నాకు” వంటి సర్వనామాలు ఎక్కువగా కనిపిస్తాయట. అంతే కాదు, మరో అధ్యయనంలో, “నేను”, “మేము” అన్న పదాల వాడుక వ్యక్తుల స్వార్థ, సామూహిక చింతనలను కూడా సూచిస్తుందనీ, సెప్టెంబర్ పద్కొండు నాటి దాడుల తరువాత కొద్ది గంటల్లో, చాలామంది ఆన్లైన్ బ్లాగర్ల పదాల్లో “నా, నేను” వంటివి తగ్గి “మనం, మేము” వంటి పదాలు ఎక్కువగా కనిపించాయట.

ఈ పరిశోధనల ఫలితాలని విశ్లేషించే క్రమంలో కలన యంత్ర సహాయం తీసుకునే మనస్తత్వవేత్తలు అరుదు. అలా తీసుకున్నా కూడా, సాధారణంగా భాష పూర్వోత్తర సంబంధాలను (Linguistic Context) పరిగణనలోకి తీసుకోరు. దీని వల్ల సమస్యలు వచ్చే అవకాశాలు లేకపోలేదు. ఉదాహరణకు -“ప్రథమ పురుష సర్వనామాలు ఎక్కువగా వాడితే మానసికవ్యాకులతకు సూచన” అని అనుకుంటే “నేను జీవితాన్ని ప్రేమిస్తున్నాను”, సర్వనామాన్ని మాత్రమే పరిగణనలోకి తీసుకుని, ఇది వ్యాకులత ని సూచించింది అనడం పొరపాటు కదా.  గణనాత్మక భాషాశాస్త్ర పద్ధతుల ద్వారా, పద పూర్వాపర సందర్భాలను పరిగణలోకి తీసుకుని విశ్లేషించవచ్చు. (ఎలా? అన్నది తెలుసుకోవాలంటే, వికీ పేజీ చూడండి. http://en.wikipedia.org/wiki/Natural_language_processing).

సామాజిక మనస్తత్వశాస్త్రంలోనే మరొక పరిశోధనా ఉప-విభాగంలో ,  వ్యక్తుల మధ్య సంబంధాలను గురించి చెప్పే కొన్ని సకర్మక క్రియల గురించి పరిశోధించారు.  ఈ క్రియల వాడుకకూ, వాక్యాలలోని గూఢత లేదా నిర్దిష్టతకూ మధ్య గల సంబంధాలు ఏమిటి? అన్నది అధ్యయనం చేసారు. వీళ్ళ పరిశోధనల్లో స్థితిని సూచించే క్రియలతో (Transitive verbs) పోలిస్తే కార్యాన్ని సూచించే క్రియలు (Action verbs) నిర్ధుష్టంగా ఉంటాయని తేల్చారు. (అంటే, “నాకు నువ్వంటే  కోపం” అనడానికీ, “నేను నిన్ను కొడతాను”  అనడానికీ వాడిన క్రియల్లో తేడా అనమాట!!).  మొదటి వాక్యం మానసిక స్థితిని సూచిస్తే, రెండో వాక్యం స్పష్టంగా జరగబోయే విషయం చెప్పింది.  పై రెండింటికంటే గూఢంగా ఉండేది – “నాకు  అసలే కోపం ఎక్కువ” వంటి వాక్యం.   నిజానికి మూడు రకాల్లో ఏదన్నా ఉపయోగించి విషయం చెప్పవచ్చు (కోపం వచ్చిందన్న సంగతి).  ఒక వ్యక్తి ఇలా భిన్న నిర్దుష్టతా పరిమాణాలలో ఏది ఎంచుకుంటాడు? అన్న దాన్ని బట్టి అతని గురించి ఒక అంచనాకు రావొచ్చు. ఈ నిగూఢ-నిర్దుష్ట పద ప్రయోగాల పరిధి ఇక్కడికి పరిమితం కాదు. వ్యక్తులు ప్రపంచాన్ని చూసే పద్ధతిని కూడా ప్రభావితం చేస్తుందని పరిశోధనల్లో తేలింది (వివరాలకు, మూల వ్యాసం, అందులోని రిఫరెన్సులను చదవండి).  చివరగా, నిగూఢత ద్వారా (ముఖ్యంగా విశేషణాల ద్వారా),  ఒక ప్రాపంచిక దృష్టినీ, నిర్దుష్టత ద్వారా ప్రత్యేకాంశ దృష్టినీ చూపవచ్చు అని తేల్చారు.

ఈ పరిశోధనాఫలితాలు వినగానే భాషాశాస్త్రవేత్తలకీ, కలనయంత్ర భాషాశాస్త్రవేత్తలకీ కూడా ఒక సందేహం కలుగుతుంది. అది విశేషణాలను నిగూఢతకు అన్వయించడం గురించి. “లావు, సన్నం, చిన్న, పెద్ద” వంటి విశేషణాల ంఆటేమిటి? “కోపం, మౌనం” వంటి వాటితో పోలిస్తే, ఇవి నిర్దుష్టమైనవే కదా. గ్రహణశక్తిని ప్రభావితం చేసేది వ్యక్తుల మధ్య సంభాషణ జరిగే తీరా? లేక నీగూఢ-నిర్దుష్ట భాషల మధ్య తేడానా? అన్న దృష్టిలో ఇటీవలి కాలంలో జరిగిన పరిశోధనలు రెండోదాన్ని బలపరిచాయి.

పైన ప్రస్తావించిన అంశాల్లో కొన్నింటి వల్ల సహజభాషా ప్రవర్తన పరిశోధనలో ఉపయోగం ఉంది. ఉదాహరణకు: ప్రవర్తన పద్ధతిలో కాకపోయినా, మూలపాఠాన్ని (text) ని అర్థం చేసుకోవడానికి (Natural Language Understanding), ఆపై, చివరికి దీన్ని ఉపయోగిస్తున్న వారికి అంత్యపాఠాన్ని(Natural Language Generation) అందించడానికి, ఈ పరిశోధనా ఫలితాలు పనికిరావొచ్చు.  ముఖ్యంగా,  భావ విశ్లేషణ (Sentiment Analysis), అభిప్రాయ సేకరణ (Opinion Mining) వంటి పరిశోధనల్లో పైఅన ఉదహరించిన లాంటి పరిశోధనలు బాగా పనికొస్తాయేమో! కానీ, ఇప్పటికైతే, ఈ రెండు రంగాల మధ్య అంత పరిశోధన మార్పిడి జరగడం లేదు.

అయితే,  గణనాత్మక భాషాశాస్త్రానికి మనస్తత్వ శాస్త్ర పరిశోధనల ఫలితాలతో సంబంధం తక్కువున్నా, దానితో పోలిస్తే,    మనస్తత్త్వసంబంధి భాషాశాస్త్రం (Psycholinguistics – బూదరాజు ఆధునిక వ్యవహారకోశం) తో కొంచెం సంబంధం ఉంది.  వీరి ఆలోచనల నుండి గణన భాషా శాస్త్రీయులూ, వారి ఫలితాలనుండి వీరూ స్పూర్తి పొందడం కనిపిస్తూనే ఉంటుంది.

(వివరాల్లోకి వెళ్ళకుండా, టూకీగా చెప్పాలంటే)
ముఖ్యంగా, వస్తు వర్ణనల అభ్వ్యక్తి ని తెలిపే విషయంలో (ఉదాహరణకు : ఒక జంతు సమూహంలో  ఉన్న ఏకైక కుక్కను వర్ణించడానికి “ఆ కుక్క” అనకుండా, “ఆ పెద్ద, నల్ల మచ్చలు గల బొచ్చు కుక్క” అనడం వంటివన్నమాట. ) మనస్తత్త్వ భాషాశాస్త్రవేత్తలు కనిపెట్టిన విషయాలు గణన భాషాశాస్త్రవేత్తలకు ఉపయోగపడతాయి.  మనుషులు వివరణ అవసరం లేని సందర్భంలో కూడా పైన చెప్పినట్లు వివరణ వాడతారని ఒక పరిశోధనలో తేలీంది. ఇలాగే, మరి కొన్ని ఆసక్తి కరమైన పరిశోధనలు ఉన్నాయి. ఇలాంటి వాటిని భాషా ప్రవర్తనం లోని చివరి అంకంలో..అంటే,  భాషా ఉత్పత్తి సమయంలో మృదులాంత్రం ఉపయోగించే మనుషులకు అర్థమయ్యేలా, నచ్చేలా వాక్య నిర్మాణాలు చేయడానికి ఉపకరించవచ్చు.

కనుక, ఈ పరిశోధనారంగాల మధ్య పరస్పర సహకారం అవసరం అన్నది వ్యాసం సారాంశం.

నాకెందుకు నచ్చిందీ అంటే, ఇలా భిన్న విషయాలను స్పృశించింది కనుక. ఏదో, వీలైనంత సులభంగా అర్థమయ్యేలా రాసేందుకు ప్రయత్నించాను. తప్పులుంటే మన్నించండి.

3 thoughts on “సహజ భాషా ప్రవర్తనం (Natural Language Processing) – 2

  1. భాష అంటే అదొక్కటే కాదు. చెప్పేవారి నుండి వచ్చే మాటల వెనుక, ఒక క్లిష్టమైన నిర్మాణ ప్రక్రియ ఉంది. అలాగే వినేవాడి మస్తిష్కంలో కూడా ఒక క్లిష్టమైన అర్థం చేసుకునే ప్రక్రియ ఉంటుంది. కానీ, ప్రస్తుత పరిశోధనల్లో, ఈ రెండు ప్రక్రియలనీ అర్థం చేసుకునే ప్రయత్నం జరగడం లేదు.
    ——————-
    చాలా చక్కగా చెప్పారు. అందుకేగదా అభిప్రాయ బేధాలు వచ్చేది. ఇద్దరి మనస్సుల్లో ఉన్న కోడింగ్, డికోడింగ్ పరికరాలు (నిర్మాణ ప్రక్రియ, అర్థం చేసుకునే ప్రక్రియ) సింక్రొనైజ్ అవలేదు. చక్కటి రిసెర్చి టాపిక్.

    వ్యాసం బాగుంది. చెప్పాల్సినవి చక్కగా చెప్పారు.

  2. “స్థితిని సూచించే క్రియలతో (Action verbs) పోలిస్తే కార్యాన్ని సూచించే క్రియలు (Action verbs) ”
    -I think the first one is “Transitive Verb”

    Pardon me for so many typos! 🙁

Leave a Reply

Your email address will not be published. Required fields are marked *