Método general de extracción de información basado en el uso de lógica borrosa. aplicación en portales web

Tesis doctoral de Jorge Ropero Rodríguez

En esta tesis se ha elaborado un nuevo método de extracción de información basado en el uso de la lógica borrosa para un conjunto de conocimiento general, aplicando este método, en particular, a portales web. Para ello, ha sido necesario realizar las siguientes tareas: 1. La elaboración de un estudio del estado del arte en cuanto a la búsqueda de información (information retrieval, ir) y la extracción de información (information extraction, ie) y las distintas técnicas existentes para llevarlas a cabo, entre las que destacan el modelo de espacio vectorial (vector space model, vsm) y las denominadas ontologías, así como las razones que nos han llevado a elegir el primero de estos modelos (vsm), para la realización del modelo basado en lógica borrosa propuesto en esta tesis. 2. El análisis del estado del arte de las aplicaciones de lógica borrosa a la búsqueda de conocimiento, tanto en el enfoque vectorial como en el enfoque semántico (basado en ontologías). 3. La confección de un método general de búsqueda de conocimiento mediante el uso de un agente inteligente basado en la lógica borrosa. Para ello, se presentan agentes inteligentes o asistentes virtuales, desarrollados tanto en el ámbito de la investigación como en el ámbito comercial y, habida cuenta de la falta de flexibilidad de estos agentes inteligentes cuando la información es abundante, confusa, imprecisa o heterogénea, se propone un método de extracción de conocimiento basado en el modelo de espacio vectorial y la lógica borrosa. Para ello, se divide el conjunto de conocimiento en distintos niveles jerárquicos hasta llegar a un último nivel en el que se encuentran las instancias u objetos, asignándose a cada objeto una serie de preguntas tipo, basadas en las posibles consultas de un usuario en lenguaje natural. Estas preguntas tipo generadas conllevan la extracción de términos índice, cada uno con un cierto peso asignado. el desarrollo de este método constituye una de las dos aportaciones principales de esta tesis a la comunidad científica. 4. La validación del método mediante la aplicación a la extracción de información en portales web. La información contenida en un portal web cumple todas las características antes mencionadas, que hacen que la lógica borrosa sea una herramienta muy útil a la hora de extraer información relevante. Para ello se realiza el estudio de los parámetros necesarios en el sistema de lógica borrosa para obtener los mejores resultados utilizando el portal web de la universidad de sevilla como marco para las pruebas. 5. Por último, y dada la necesidad de automatizar los pesos generados para los distintos términos índice derivados de la aplicación del modelo de espacio vectorial, se propone un nuevo método para la asignación de pesos (term weighting, tw), basado así mismo en el uso de la lógica borrosa, sustituyendo este método al método clásico, denominado tf-idf. la introducción de la lógica borrosa a la asignación de pesos representa la segunda aportación importante de esta tesis.

 

Datos académicos de la tesis doctoral «Método general de extracción de información basado en el uso de lógica borrosa. aplicación en portales web«

  • Título de la tesis:  Método general de extracción de información basado en el uso de lógica borrosa. aplicación en portales web
  • Autor:  Jorge Ropero Rodríguez
  • Universidad:  Sevilla
  • Fecha de lectura de la tesis:  22/02/2010

 

Dirección y tribunal

  • Director de la tesis
    • Carlos León De Mora
  • Tribunal
    • Presidente del tribunal: Francisco Perez García
    • cándido Bariain aisa (vocal)
    • Manuel Berenguel soria (vocal)
    • Juan Carlos Montaño asquerino (vocal)

 

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Scroll al inicio