Learning Bayesian networks form data with factorisation and classification purposesapplications in biomedicine
- Blanco Gómez, Rosa
- Pedro Larrañaga Múgica Director
- Iñaki Inza Cano Director
Defence university: Universidad del País Vasco - Euskal Herriko Unibertsitatea
Fecha de defensa: 15 July 2005
- Ramón López de Mántaras Chair
- Antonio Lozano Guerrero Secretary
- Joao Gama Committee member
- Miguel De Campos Luis Committee member
- Serafin Moral Committee member
Type: Thesis
Abstract
El trabajo de la tesis realiza aportaciones en dos áreas relacionadas: el aprendizaje automático desde datos de redes Baysianas y los clasificadores Bayesianos, En el aprendizaje de redes Bayesianas, las aproximaciones de "score+search" buscan la mejor red Bayesiana para una medida y un espacio de búsqueda dados. En este campo, las aportaciones de la tesis se centran en el uso de los métodos floating, el GRASP y los algoritmos de estimación de distribuciones como motores en la búsqueda de redes Bayesianas. Aunque los resultados obtenidos no son tan buenos como se esperaba, sí son competitivos con los obtenidos por otros algoritmos propuestos por la literatura. La clasificación supervisada consiste en construir un modelo a partir de un conjunto de d atos etiquetados, para que en el futuro ese modelo prediga la clase de una instancia sin etiquetar. Relacionado con la clasificación supervisada se encuentra la selección de variables, donde sólo de eligen las variables que aportan información para la clase. En esta tesis, los paradigmas de clasificación elegidos son un subconjunto de clasificadores Bayesianos; naive Bayes, semi naive Bayes, tree augmented naive Bayes and k dependence Bayesian classifier. Las aportaciones en esta área se centran an la propuesta de aproximaciones de filtrado y envoltura para estos clasificadores. De la experimentación realizada se puede apreciar que los clasificadores Bayesianos propuestos mejoran el resultado del naive Bayes cuando los datos incluyen variables redundantes e irrelevantes. Finalmente, se han aplicado las aproximaciones de filtrado y envoltura para los clasificadores Bayesianos a tres problemas reales de entornos biomédicos, obteniendo resultados muy prometedores.