Redes de palabras alineadas como recurso en la extracción de equivalencias léxicas de traducción y su aplicación en la alineación

Authors: Eduardo Cendejas, Grettel Barceló, Gigori Sidorov, Alexander Gelbukh, and Liliana Chanona-Hernandez

Polibits, Vol. 46, pp. 39-48, 2012.

Abstract: La equivalencia léxica de traducción se define mediante correspondencias establecidas entre dos lenguas, comúnmente denominadas lengua de origen y lengua meta. Este artículo propone un método de extracción de dichas equivalencias en palabras no funcionales. El algoritmo se basa en dos recursos principales: (1) MultiWordNet como léxico especializado para cada uno de los idiomas involucrados y (2) textos paralelos como información adicional para proporcionar diversas lexicalizaciones de las palabras a corresponder. Utiliza como fundamento principal el hecho de que las redes de palabras que conforman MultiWordNet están alineadas. Además, se presenta la reutilización del repositorio de pares léxicos obtenidos, señalando la forma en que esta información es susceptible de ser usada en un sistema de alineación a nivel de palabras. Para realizar los experimentos se emplearon textos paralelos bilingües sin notación morfosintáctica alguna, alineados a nivel de oración en los pares de idiomas Español / Inglés y Español / Italiano.

Keywords: Equivalencias léxicas, alineación, redes de palabras, textos paralelos

PDF: Redes de palabras alineadas como recurso en la extracción de equivalencias léxicas de traducción y su aplicación en la alineación
PDF: Redes de palabras alineadas como recurso en la extracción de equivalencias léxicas de traducción y su aplicación en la alineación