Aproximación a la linguística computacional

Tesis doctoral de Milka Villayandre Llamazares

Esta tesis surge con el objetivo de intentar dar respuesta, desde la perspectiva de la lingí¼ística, a una serie de preguntas básicas planteadas a raíz de una primera toma de contacto con el campo de la lingí¼ística computacional. En primer lugar, buscando delimitar el objeto, finalidad, líneas de investigación e historia de la disciplina. En segundo lugar, analizando las implicaciones del tratamiento computacional del lenguaje a través de sus principales áreas de trabajo, así como algunas de las aplicaciones de la lc. Por último, incidiendo en uno de los aspectos que más interés han suscitado, el de la recopilación de grandes muestras textuales de uso de la lengua, o corpus. Todos estos puntos se han articulado en sendos materiales en línea que sirven desde hace algunos años como apoyo de la docencia de las asignaturas correspondientes de la licenciatura en lingí¼ística y que son de consulta libre para todos aquellos que quieran utilizarlos. la aparición del ordenador digital ha marcado un cambio en la forma de contemplar el objeto de estudio de la lingí¼ística y, con ello, el surgir de una nueva disciplina, de una nueva ciencia, que ya cuenta con medio siglo de andadura, más todo el saber acumulado antes por el hombre sobre el lenguaje; que propone reglas y formalismos para describirlo de forma exhaustiva; que parte de datos reales, verdaderos; que, mediante su análisis y descripción, busca mejorar los conocimientos de que disponemos sobre él, para lo que elabora teorías nuevas, adapta otras ya existentes, verifica su funcionamiento, descarta las que no sirven, plantea hipótesis que contrasta continuamente con los datos, y así sucesivamente hasta encontrar aquella teoría o modelo general sobre el lenguaje más satisfactorio, bien sea desde una perspectiva meramente científica o con vistas al desarrollo de una aplicación determinada, pues también contribuye a la obtención de productos, como fase final de todo el proceso. el interés por emular el lenguaje humano no es nuevo, sino que sus orígenes hay que buscarlos ya en la antigí¼edad. Ese empeño humano por entenderlo y reproducirlo en algún tipo de ingenio artificial ha estado presente en toda nuestra historia. Por eso, el ordenador solo ha sido el catalizador de todos esos intentos que han contemplado los siglos precedentes. Después de la ii guerra mundial, se aplican las técnicas ideadas para descifrar códigos al lenguaje, pensando que la tarea de decodificarlo iba a ser sencilla. Sin embargo, pronto surgieron las primeras dificultades pero, al mismo tiempo, estímulos para desarrollar nuevas vertientes de trabajo: no solo los aspectos más formales del lenguaje (sintaxis) debían recibir tratamiento, también otros en principio menos sistematizados (semántica, pragmática), pero fundamentales para la comunicación humana: sin atender al significado, sin considerar el conocimiento del mundo, sin atender a las intenciones de los hablantes, a la forma de urdir el discurso no se puede entender el lenguaje. estos fracasos fueron necesarios, en cierta medida, para que los investigadores se dieran cuenta de que tenían que ajustar los objetivos iniciales a otros más modestos o más realistas. Al fin y al cabo, la finalidad última de la lc es entender mejor el lenguaje y desarrollar herramientas útiles para su tratamiento, así como aplicaciones en las que el lenguaje es una parte fundamental. Un requisito previo resulta fundamental en esta tarea: contar con formalismos de representación de la información lingí¼ística, aplicados a los diferentes niveles en que se divide el estudio del lenguaje: desde el fonético-fonológico hasta el pragmático, pasando por el morfológico, el sintáctico y el semántico. Esta concepción modular configura las distintas áreas de interés de la lc, de las que se ha intentado presentar una visión panorámica. aunque la perspectiva adoptada en este acercamiento es la de la lingí¼ística, ha sido especialmente interesante descubrir las aportaciones de otras disciplinas, como la informática, la inteligencia artificial, la lógica, las matemáticas, la psicología, etc., En un marco de trabajo más general e interdisciplinar, el de la ciencia cognitiva. Y también, dentro de la propia lingí¼ística, llama la atención la riqueza de matices que se aprecia y la integración de enfoques: desde la gramática tradicional hasta la cognitiva, pasando por la estructural o la generativa, todas las corrientes han contribuido al desarrollo de la disciplina. El resultado son las diferentes líneas de investigación que conforman el campo: cada una pone el énfasis en aspectos de índole diversa: unas más en el lado cognitivo, otras en el psicológico, en el humano, en la naturaleza lógica, en los aspectos matemáticos, estadísticos, tecnológicos, etc. Así, se distinguen trabajos desde una vertiente más teórica (lingí¼ística computacional propiamente dicha), más aplicada (procesamiento del lenguaje natural), más cognitiva (inteligencia artificial), más auxiliar (lingí¼ística informática), más centrada en la lengua hablada (tecnologías del habla), más comercial (industrias de la lengua), más preocupada por el desarrollo de recursos básicos (ingeniería lingí¼ística). Precisamente, el diseño y recopilación de corpus lingí¼ísticos es un apartado en el que se ha incidido, en tanto que hoy en día constituyen una fuente de información privilegiada para los estudios lingí¼ísticos. Por este motivo, se ha puesto especial empeño en presentar una visión más exhaustiva del mismo: desde los primeros corpus que mostraban cierta modestia en unos planteamientos, por otra parte, muy bien fundamentados, hasta los recursos más recientes, en los que los nuevos medios (internet principalmente) permiten compilar cantidades ingentes de datos; pasando por los problemas y ventajas que supone trabajar con corpus, la necesidad de definir claramente los criterios de selección de los textos o las posibilidades de explotación que implica disponer de corpus anotados con distintos tipos de información. con la lingí¼ística como referente en este acercamiento, hay que reconocer que las teorías surgidas en su seno en ocasiones han resultado insuficientes para los propósitos de la lc, que ha tenido que desarrollar sus propias propuestas o acudir a los conocimientos y técnicas que, con otros objetivos, se habían empleado en otros campos del saber. Especialmente notable ha sido la incidencia de la inteligencia artificial, que en su afán por simular las capacidades cognitivas humanas, ha otorgado un papel destacado al lenguaje, conducta inteligente por excelencia. Sus principales contribuciones se han dejado sentir sobre todo en los aspectos relacionados con la representación del conocimiento. las dificultades del tratamiento computacional del lenguaje son muchas (ambigí¼edades de todo tipo, elipsis, información que depende del contexto, conocimientos generales, etc.), Pero basta echar la vista atrás para ver el recorrido que se ha realizado en unas pocas décadas. Los resultados están muchas veces presentes en nuestras vidas diarias: un ascensor que nos indica mediante una voz sintetizada el piso en el que estamos, un teléfono móvil que nos permite la marcación por voz, un programa que lee en voz alta los contenidos de un documento a una persona con problemas de visión, buscadores de información a través de la web que integran tratamiento del lenguaje para mejorar los resultados de las búsquedas, diccionarios electrónicos, programas de ayuda a la traducción, servicios automáticos de información operados mediante la voz, etc. en el ámbito específico de la lingí¼ística, los beneficios que se derivan del empleo de ordenadores son numerosos: bases de datos para la elaboración de diccionarios, conjugadores, lematizadores, analizadores de diverso tipo, programas de concordancias, programas para la síntesis y el reconocimiento del habla, corpus electrónicos, etc. Sin duda, el abanico de posibilidades es tan amplio como abierto es el lenguaje.

 

Datos académicos de la tesis doctoral «Aproximación a la linguística computacional«

  • Título de la tesis:  Aproximación a la linguística computacional
  • Autor:  Milka Villayandre Llamazares
  • Universidad:  León
  • Fecha de lectura de la tesis:  13/07/2010

 

Dirección y tribunal

  • Director de la tesis
    • Salvador Gutiérrez Ordóñez
  • Tribunal
    • Presidente del tribunal: guillermo Rojo sánchez
    • mercedes Sánchez sánchez (vocal)
    • Emilio Jesús Prieto de los mozos (vocal)
    • José ramon Morala rodriguez (vocal)

 

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Scroll al inicio