[Todos CMAT] Defensa de Maestría en Ingeniería Matemática de Meliza González: Lunes 3 de Diciembre, 15:00 horas.

frobledo frobledo en fing.edu.uy
Vie Nov 30 16:12:53 -03 2018


Estimados Sres. Docentes, Investigadores y Estudiantes:

Nos complace informarles que el lunes 3 de diciembre tendrá lugar la
Defensa Pública de la Tesis de Maestría en Ingeniería Matemática de la  
Lic. Meliza González.

Les hago llegar los detalles del evento.

Están todos cordialmente invitados.

Saludos,

     Franco Robledo Amoza

------------------------------


Fecha: Lunes 3 de Diciembre de 2018

Hora: 15:00

Lugar: Salón de Seminarios del IMERL, Facultad de Ingeniería, UDELAR.

Título de la tesis: "Comparación de particiones en aprendizaje  
automático no supervisado".

Director de Tesis: Dr. Mathias Bourel,
Co-Director de Tesis: Dr. Badih Ghattas.
Director Académico: Dr. Franco Robledo

Tribunal:
• Dr. Ing. Marcelo Fiori (Instituto de Matemática y Estadística  
(IMERL), Facultad de Ingeniería, UDELAR).
• Dr. Gustavo Guerberoff (Instituto de Matemática y Estadística  
(IMERL), Facultad de Ingeniería, UDELAR).
• Dr. José Rafael León   (Instituto de Matemática y Estadística  
(IMERL), Facultad de Ingeniería, UDELAR).


RESUMEN:

En esta tesis se presenta un estudio sobre índices de comparación de  
particiones de un mismo conjunto de datos, utilizados para la  
evaluación externa de los resultados de métodos de clasificación no  
supervisada. Se elabora un estado del arte en cuanto a los índices  
existentes y sus propiedades y se calculan algunos de los más  
conocidos sobre datos simulados a modo de ejemplo.

Este trabajo se centra en el índice Mínimo Error de Clasificación  
(MCE, por su sigla en inglés), medida basada en la  tabla de  
contingencia de dos particiones. Se estudia y profundiza sobre sus  
propiedades y en especial su distribución. Se establece la expresión  
analítica de la función de distribución teórica para el caso de la  
comparación de dos particiones independientes, con dos clases  
balanceadas. Algunas propiedades demostradas pudieron extenderse para  
el caso de tres clases y para el caso general. También se estudian las  
propiedades de la distribución empírica sobre datos simulados,  
variando algunos parámetros experimentales, y mostramos una aplicación  
sobre un conjunto de datos supervisados reales de imágenes de dígitos  
escritos a manos, conocido como mnist. En este último caso, planteamos  
el problema de clasificación no supervisada y la validación externa de  
los resultados basada en nuestro índice se realiza comparándolos con  
la verdadera etiqueta de los datos. Los resultados del MCE se comparan  
con otros índices de validación externa mediante correlaciones y en  
distintos escenarios.

Finalmente, a partir de la distribución del índice, se diseña un test  
de hipótesis que permite contrastar si dos particiones son  
independientes. El desempeño de la prueba se evalúa calculando los  
errores de tipo I y II  obtenidos con datos simulados artificialmente.

Pablabras Clave: Comparación de particiones, Índices de validación  
externa, Error de clasificación, Análisis de cluster, Aprendizaje no  
supervisado.










Más información sobre la lista de distribución Todos