[Todos CMAT] Defensa de Maestría en Ingeniería Matemática de Meliza González: Lunes 3 de Diciembre, 15:00 horas.
frobledo
frobledo en fing.edu.uy
Vie Nov 30 16:12:46 -03 2018
Estimados Sres. Docentes, Investigadores y Estudiantes:
Nos complace informarles que el lunes 3 de diciembre tendrá lugar la
Defensa Pública de la Tesis de Maestría en Ingeniería Matemática de la
Lic. Meliza González.
Les hago llegar los detalles del evento.
Están todos cordialmente invitados.
Saludos,
Franco Robledo Amoza
------------------------------
Fecha: Lunes 3 de Diciembre de 2018
Hora: 15:00
Lugar: Salón de Seminarios del IMERL, Facultad de Ingeniería, UDELAR.
Título de la tesis: "Comparación de particiones en aprendizaje
automático no supervisado".
Director de Tesis: Dr. Mathias Bourel,
Co-Director de Tesis: Dr. Badih Ghattas.
Director Académico: Dr. Franco Robledo
Tribunal:
• Dr. Ing. Marcelo Fiori (Instituto de Matemática y Estadística
(IMERL), Facultad de Ingeniería, UDELAR).
• Dr. Gustavo Guerberoff (Instituto de Matemática y Estadística
(IMERL), Facultad de Ingeniería, UDELAR).
• Dr. José Rafael León (Instituto de Matemática y Estadística
(IMERL), Facultad de Ingeniería, UDELAR).
RESUMEN:
En esta tesis se presenta un estudio sobre índices de comparación de
particiones de un mismo conjunto de datos, utilizados para la
evaluación externa de los resultados de métodos de clasificación no
supervisada. Se elabora un estado del arte en cuanto a los índices
existentes y sus propiedades y se calculan algunos de los más
conocidos sobre datos simulados a modo de ejemplo.
Este trabajo se centra en el índice Mínimo Error de Clasificación
(MCE, por su sigla en inglés), medida basada en la tabla de
contingencia de dos particiones. Se estudia y profundiza sobre sus
propiedades y en especial su distribución. Se establece la expresión
analítica de la función de distribución teórica para el caso de la
comparación de dos particiones independientes, con dos clases
balanceadas. Algunas propiedades demostradas pudieron extenderse para
el caso de tres clases y para el caso general. También se estudian las
propiedades de la distribución empírica sobre datos simulados,
variando algunos parámetros experimentales, y mostramos una aplicación
sobre un conjunto de datos supervisados reales de imágenes de dígitos
escritos a manos, conocido como mnist. En este último caso, planteamos
el problema de clasificación no supervisada y la validación externa de
los resultados basada en nuestro índice se realiza comparándolos con
la verdadera etiqueta de los datos. Los resultados del MCE se comparan
con otros índices de validación externa mediante correlaciones y en
distintos escenarios.
Finalmente, a partir de la distribución del índice, se diseña un test
de hipótesis que permite contrastar si dos particiones son
independientes. El desempeño de la prueba se evalúa calculando los
errores de tipo I y II obtenidos con datos simulados artificialmente.
Pablabras Clave: Comparación de particiones, Índices de validación
externa, Error de clasificación, Análisis de cluster, Aprendizaje no
supervisado.
Más información sobre la lista de distribución Todos