Algunas consideraciones sobre el procesamiento de lenguaje natural

Procesamiento de lenguaje natural

Mg. Augusto Cortez Vásquez, Mg. Hugo Vega Huerta, Lic. Jaime Pariona Quispe.

Definición de Lenguaje:

Un lenguaje se puede definir de diferentes formas:
desde el punto de vista funcional lingüístico se define  como una función que expresa pensamientos y comunicaciones
entre la gente. Esta función puede realizarse mediante signos escritos (escritura) o mediante señales y vocales (voz). Desde un punto de vista formal se define como un conjunto de frases, que generalmente es infinito y se forma con combinaciones de elementos tomados de un conjunto (usualmente infinito) llamado alfabeto, respetando un conjunto de reglas de formación
(sintácticas o gramaticales) y de sentido (semánticas).
Además de las características fundamentales del lenguaje debe considerarse que sea funcional, es decir, el lenguaje debe permitirnos expresar nuestras ideas.
El lenguaje será bueno en la medida en que sea fácil de leer, fácil de entender y fácil de modificar. Lo mismo ocurre en los lenguajes formales[6]. Podemos distinguir entre dos clases de lenguajes: los lenguajes naturales (inglés, alemán, español, etc.) y lenguajes formales (matemático, lógico, programable etc.).

Definición de lenguaje natural

Cuando queremos definir qué es lenguaje natural, nos hacemos la pregunta ¿Qué surgió primero las reglas gramaticales o el lenguaje? Un lenguaje natural es aquel que ha evolucionado con el tiempo para fines de comunicación humana, como el español o alemán [2].  Estos lenguajes continúan su evolución sin considerar la gramática, cualquier regla se desarrolla después de
sucedido el hecho. En contraste, los lenguajes formales están definidos por reglas preestablecidas, y por tanto
se rigen con todo rigor a ellas.

El lenguaje natural(LN) es el medio que utilizamos de manera cotidiana para establecer nuestra comunicación con las demás personas. El LN ha venido perfeccionándose a partir de la experiencia a tal punto que puede ser utilizado para analizar situaciones altamente complejas y razonar muy sutilmente. Los lenguajes naturales tienen un gran poder expresivo y su función y valor como una herramienta para razonamiento. Por otro lado, la sintaxis de un LN puede ser modelada fácilmente por un lenguaje formal, similar a los utilizados en las matemáticas y la lógica.

 

Problema del procesamiento de lenguaje natural
La principal dificultad en los procesos de recuperación de información mediante lenguajes formales no es de índole técnica sino psicológica: entender cuál es la necesidad real del usuario, cual es la correcta formulación de su pregunta o necesidad. La dirección más prometedora de resolver este problema es el uso de lenguaje natural. Sin embargo, uno de los grandes problemas
del PLN se produce cuando una expresión en LN posee más de una interpretación, es decir, cuando en el lenguaje de destino se le pueden asignar dos o más expresiones distintas. Este problema de la ambigüedad se presenta en todos los niveles del lenguaje, sin excepción.

Ejemplo:
“Hay alguien en la puerta, que te quiere hablar”
“ Hay alguien, en la puerta que te quiere hablar”

No está claro, si el predicado “te quiere hablar” se adjudica a “alguien” o a “la puerta”, sabemos que la puertas no hablan, por tanto deducimos que es a alguien. Pero esto no lo puede deducir la máquina, a no ser que esté enterada de lo que hacen o no hacen las puertas. En apariencia este problema es demasiado sencillo, pero en realidad, es uno de los más complicados y que más complicaciones ha dado para que el PLN pueda desarrollarse por completo, ya que al presentarse en todos los niveles del lenguaje, se tienen que desarrollar programas (lenguaje formal) para solucionarlos en cada caso.