În lingvistică, dezambiguizarea este procesul de determinare a sensului a cuvânt este folosit într-un anumit context. Cunoscută și sub denumirea de dezambiguizare lexicală.
În lingvistica computațională, acest proces discriminativ se numește dezambiguizare cuvânt-sens (WSD).
Exemple și observații
„Se întâmplă ca noștri comunicare, în diferite limbi deopotrivă, permite ca aceeași formă a cuvântului să fie folosită pentru a însemna lucruri diferite în tranzacțiile comunicative individuale. Consecința este că cineva trebuie să-și dea seama, într-o anumită tranzacție, sensul intenționat al unui anumit cuvânt printre sensurile sale potențial asociate. In timp ce ambiguități care decurg din astfel de asocieri multiple forme-sens sunt la lexical nivel, acestea trebuie deseori rezolvate printr-un context mai larg din discurs înglobând cuvântul. Prin urmare, diferitele sensuri ale cuvântului „serviciu” ar putea fi deosebite doar dacă s-ar putea privi dincolo de cuvântul însuși, ca în contrast cu „ serviciul jucătorilor la Wimbledon" cu "serviciul ospătarului în Sheraton". Acest proces de identificare a semnificațiilor cuvintelor într-un discurs este în general cunoscut ca
sens al cuvântului dezambiguizare (WSD).” (Oi Yee Kwong, Noi perspective asupra strategiilor computaționale și cognitive pentru dezambiguizarea sensului cuvintelor. Springer, 2013)Dezambiguizare lexicală și dezambiguizare cuvânt-sens (WSD)
"Lexical dezambiguizare în definiția sa cea mai largă, este nimic mai puțin decât determinarea sensului fiecărui cuvânt în context, care pare a fi un proces în mare parte inconștient la oameni. Ca problemă de calcul, este adesea descrisă ca „AI-completă”, adică o problemă a cărei rezolvare presupune o soluție de completat. limbaj natural înțelegere sau raționament de bun-simț (Ide și Véronis 1998).
„În domeniul lingvisticii computaționale, problema se numește în general dezambiguizarea sensului cuvântului (WSD) și este definită ca problema determinării computaționale care „sens” al unui cuvânt este activat prin utilizarea cuvântului într-un anumit context. WSD este în esență o sarcină de clasificare: sensurile cuvintelor sunt clasele, contextul oferă dovezi și fiecare apariție a unui cuvânt este atribuită uneia sau mai multor clase posibile pe baza lui dovezi. Aceasta este caracterizarea tradițională și comună a WSD care îl vede ca un proces explicit de dezambiguizare în ceea ce privește un inventar fix de sensuri ale cuvintelor. Se presupune că cuvintele au un set finit și discret de simțuri din a dicţionar, o bază de cunoștințe lexicale sau o ontologie (în aceasta din urmă, sensurile corespund conceptelor pe care un cuvânt lexicalizează). Pot fi, de asemenea, utilizate inventare specifice aplicației. De exemplu, într-o setare de traducere automată (MT), se pot trata traducerile de cuvinte ca sensuri ale cuvintelor, an abordare care devine din ce în ce mai fezabilă din cauza disponibilității mari multilingve paralel corpuri care pot servi drept date de antrenament. Inventarul fix al WSD tradițional reduce complexitatea problemei, dar există câmpuri alternative.. .." (Eneko Agirre și Philip Edmonds, "Introducere". Dezambiguarea sensului cuvântului: algoritmi și aplicații. Springer, 2007)
Omonimie și dezambiguizare
"Lexical dezambiguizare este bine potrivită în special pentru cazurile de omonimie, de exemplu, o apariție a bas trebuie mapat pe oricare dintre elementele lexicale bas1 sau bas2, în funcție de sensul dorit.
„Dezambiguizarea lexicală implică o alegere cognitivă și este o sarcină care inhibă procesele de înțelegere. Ar trebui să se distingă de procesele care duc la o diferențiere a sensurilor cuvintelor. Prima sarcină este îndeplinită destul de sigur și fără prea multe informații contextuale, în timp ce a doua nu este (cf. Veronis 1998, 2001). De asemenea, s-a demonstrat că cuvintele omonime, care necesită dezambiguizare, încetinesc accesul lexical, în timp ce cuvintele poliseme, care activează o multitudine de sensuri ale cuvintelor, accelerează accesul lexical (Rodd e.a. 2002).
„Cu toate acestea, atât modificarea productivă a valorilor semantice, cât și alegerea simplă între elemente lexical diferite au în comun că necesită informații suplimentare non-lexicale.” (Peter Bosch, „Productivity, Polysemy, and Predicate Indexicality”. Logica, limbajul și calculul: al 6-lea simpozion internațional de la Tbilisi despre logică, limbaj și calcul, ed. de Balder D. ten Cate și Henk W. Zeevat. Springer, 2007)
Dezambiguizarea categoriei lexicale și principiul probabilității
„Corley și Crocker (2000) prezintă un model de acoperire largă al categorie lexicalădezambiguizare bazat pe Principiul probabilității. Mai exact, ei sugerează că pentru o propoziție formată din cuvinte w0... wn, procesorul de propoziții adoptă cel mai probabil parte de vorbire secvenţă t0... tn. Mai precis, modelul lor exploatează două probabilități simple: (i) probabilitatea condiționată a cuvântului wi dată o anumită parte de vorbire ti, și (ii) probabilitatea de ti dată fiind partea anterioară de discurs ti-1. Pe măsură ce fiecare cuvânt al propoziției este întâlnit, sistemul îi atribuie acea parte de vorbire ti, care maximizează produsul acestor două probabilități. Acest model valorifică perspectiva pe care mulți sintactic ambiguitățile au o bază lexicală (MacDonald et al., 1994), ca în (3):
(3) Preturile de depozit/marcile sunt mai ieftine decat restul.
„Aceste propoziții sunt temporar ambigue între o lectură în care preturi sau face este verb principal sau parte dintr-un substantiv compus. După ce a fost instruit pe un corpus mare, modelul prezice partea cea mai probabilă a vorbirii pentru preturi, ținând seama corect de faptul că oamenii înțeleg Preț ca substantiv dar face ca verb (vezi Crocker & Corley, 2002, și referințele citate aici). Nu numai că modelul ține cont de o serie de preferințe de dezambiguizare înrădăcinate în categoria lexicală ambiguității, explică și de ce, în general, oamenii sunt foarte precisi în rezolvarea unor astfel de ambiguități.” (Matei W. Crocker, „Modele raționale de înțelegere: abordarea paradoxului performanței”. Psiholingvistica secolului XXI: patru pietre de temelie, ed. de Anne Cutler. Lawrence Erlbaum, 2005)