Minería de patrones temporales basados en redes de restricciones

  1. Guil Reyes, Francisco Gabriel
Dirigée par:
  1. Roque Luis Marín Morales Directeur/trice
  2. Alfonso Bosch Arán Directeur/trice

Université de défendre: Universidad de Almería

Fecha de defensa: 30 janvier 2009

Jury:
  1. Manuel Berenguel Soria President
  2. Samuel Túnez Rodríguez Secrétaire
  3. Ramón Ruiz Merino Rapporteur
  4. José Tomás Palma Méndez Rapporteur
  5. Paulo Félix Lamas Rapporteur

Type: Thèses

Teseo: 305333 DIALNET

Résumé

La incorporación de la semántica temporal en las técnicas de minería de datos tradicionales ha dado lugar a la creación de una nueva disciplina denominada "Minería de Datos Temporales". Esta incorporación es especialmente necesaria cuando el objetivo consiste en obtener conocimiento útil en dominios dinámicos, cuya naturaleza es variable en el tiempo. Sin embargo, este proceso da lugar a un problema de gran complejidad y, por lo tanto, su solución presenta mayores desafíos computacionales que las técnicas de minería de datos no temporales. Basado en el esquema intertransaccional, en esta tesis se propone un algoritmo denominado TSET-Miner para la minería de secuencias frecuentes a partir de conjuntos de datos transaccionales y relacionales. La principal aportación de esta propuesta consiste en la utilización de una única estructura de datos arborescente, llamada TSET, para la generación y almacenamiento de todas las secuencias (asociaciones temporales) extraídas en el proceso de minería de datos. Dada la versatilidada asociada al uso de una única estructura de datos, en esta tesis se propone también un conjunto de algoritmos basados en el uso de TSET que mejoran en eficiencia al original y amplian su uso en nuevos dominios de aplicación, permitiendo extraer un nuevo tipo de patrón temporal denominado patrón secuencial. El resultado es la familia de algoritmos denominada TSET-Miner, actualmente compuesta por {TSET-max, TSET-fuzzy, TSET-iterative, TSET-sequentia}-Miner. Uno de los principales problemas asociados con las técnicas asociacionistas de minería es el gran número de patrones que se suelen extraer, incluso si se tratan de conjuntos de datos de tamaño mediano. Esto implica que el proceso de evaluación e interpretación sea prácticamente inabordable por los expertos del dominio. Una solución a este problema consiste en la aplicación de técnicas de minería de segundo orden, cuyo objetivo consiste en obtener un modelo global o conjunto de patrones que muestren de forma compacta y con mayor nivel de abstracción la información temporal presente en el conjunto de secuencias frecuentes. En esta tesis se propone la obtención de un tipo de patrón temporal basado en un modelo de redes de restricciones propuesta por Dubois y cols. Cada restricción muestra la relación temporal incierta entre parejas de eventos y se denota como un vector compuesto por tres valores de posibilidad que expresan el grado de plausibilidad relativo de cada una de las relaciones temporales básicas entre dos instantes de tiempo, es decir, "antes", "en el mismo instante" y "después". El método propuesto se basa en la Teoría de la Evidencia de Shafer como herramienta matemática para la obtención de los grados de posibilidad de los patrones a partir del valor de frecuencia de las secuencias que lo forman. Relativo al campo de aplicación, el dominio en el que se han realizado los experimentos ha sido el denominado "Cuidados Intensivos", perteneciente al dominio de la medicina. Este dominio de aplicación, además de poseer una gran complejidad conceptual, es de naturaleza dinámica y variable. En esta tesis se ha estudiado la aplicación de las técnicas de minería propuestas en conjuntos de datos pertenecientes a dos problemas de distinta naturaleza. Los resultados obtenidos muestran la validez de las técnicas en este tipo de dominios, estableciendo la solución como punto de partida prometedor para la obtención de aplicaciones inteligentes de análisis de datos y de ayuda al diagnóstico temporal.