Desambiguador en línea

Con el ánimo de poner al alcance de todos los interesados en el español esta útil herramienta, hemos incorporado a nuestra página (http://www.gedlc.ulpgc.es) para su uso gratuito y discrecional un desambiguador morfosintáctico del español basado en la estructura sintáctica de la frase u oración (http://www.gedlc.ulpgc.es/investigacion/desambigua/morfosintactico.htm).

Debido a que en español existe una considerable cantidad de palabras que pueden desempeñar diferentes funciones gramaticales, el análisis de un texto produciría una desmesurada multiplicidad de combinaciones posibles en caso de no tener en cuenta la función de cada voz en el contexto en que aparece.

El método de desambiguación reduce el tamaño de la respuesta gracias al tratamiento que hace de las estructuras sintácticas tanto locales como globales apoyándose en un analizador sintáctico automático –no usa criterios estadísticos.

Para cada palabra, el lematizador proporciona un conjunto de caracterizaciones gramaticales y léxicas, entre otras; el desambiguador asigna a cada caracterización un comportamiento funcional. El desambiguador discrimina para la categoría verbo entre cuatro opciones: infinitivo, gerundio, participio y forma verbal personal, ya que presentan diferencias de función y de posición en las estructuras sintácticas; por el mismo motivo, para la categoría pronombre, se distingue entre pronombre personal, pronombre de relativo y otro pronombre.

El universo que contempla está compuesto por más de 4 900 000 palabras (sin sumar la ampliación inherente a los prefijos y a los pronombres enclíticos), formado a partir de 151 103 formas canónicas (incluye 14 859 nombres de personas y apellidos).

Esta aplicación no propone una solución única, sino todas aquellas que aparecen aceptables al sistema. No tiene en cuenta aspectos semánticos en el análisis. En próximas versiones se irán depurando los resultados para aumentar el grado de desambiguación del sistema.

Esta versión de la aplicación, disponible para hacer pruebas en línea de manera libre y discrecional, tiene las entradas limitadas a 80 caracteres.

Deja tu opinión

*

Este sitio usa Akismet para reducir el spam. Aprende cómo se procesan los datos de tus comentarios.