Learning Bayesian networks form data with factorisation and classification purposesapplications in biomedicine

  1. Blanco Gómez, Rosa
Dirigida por:
  1. Pedro Larrañaga Múgica Director/a
  2. Iñaki Inza Cano Director/a

Universidad de defensa: Universidad del País Vasco - Euskal Herriko Unibertsitatea

Fecha de defensa: 15 de julio de 2005

Tribunal:
  1. Ramón López de Mántaras Presidente/a
  2. Antonio Lozano Guerrero Secretario
  3. Joao Gama Vocal
  4. Miguel De Campos Luis Vocal
  5. Serafin Moral Vocal

Tipo: Tesis

Teseo: 126754 DIALNET

Resumen

El trabajo de la tesis realiza aportaciones en dos áreas relacionadas: el aprendizaje automático desde datos de redes Baysianas y los clasificadores Bayesianos, En el aprendizaje de redes Bayesianas, las aproximaciones de "score+search" buscan la mejor red Bayesiana para una medida y un espacio de búsqueda dados. En este campo, las aportaciones de la tesis se centran en el uso de los métodos floating, el GRASP y los algoritmos de estimación de distribuciones como motores en la búsqueda de redes Bayesianas. Aunque los resultados obtenidos no son tan buenos como se esperaba, sí son competitivos con los obtenidos por otros algoritmos propuestos por la literatura. La clasificación supervisada consiste en construir un modelo a partir de un conjunto de d atos etiquetados, para que en el futuro ese modelo prediga la clase de una instancia sin etiquetar. Relacionado con la clasificación supervisada se encuentra la selección de variables, donde sólo de eligen las variables que aportan información para la clase. En esta tesis, los paradigmas de clasificación elegidos son un subconjunto de clasificadores Bayesianos; naive Bayes, semi naive Bayes, tree augmented naive Bayes and k dependence Bayesian classifier. Las aportaciones en esta área se centran an la propuesta de aproximaciones de filtrado y envoltura para estos clasificadores. De la experimentación realizada se puede apreciar que los clasificadores Bayesianos propuestos mejoran el resultado del naive Bayes cuando los datos incluyen variables redundantes e irrelevantes. Finalmente, se han aplicado las aproximaciones de filtrado y envoltura para los clasificadores Bayesianos a tres problemas reales de entornos biomédicos, obteniendo resultados muy prometedores.