[Todos CMAT] SEMINARIO DE PROBABILIDAD Y ESTADISTICA

wschebor en cmat.edu.uy wschebor en cmat.edu.uy
Lun Jun 19 14:44:19 UYT 2006


EL SEMINARIO CONJUNTO IESTA,IMERL,CMAT se reune el martes 20 de junio de 17:00 a
18:30 en el IMERL.
El expositor será Gonzalo Perera.


TITULO:
Construyendo clasificadores fuertes y estables a partir de clasificadores
debiles y/o inestables.

RESUMEN

  En el problema de clasificacion, debe decidirse a que clase pertenece un
individuo a partir de la observacion de alguna variables explicativas. El
tipico ejemplo es decidir si un paciente es portador o no de una cierta
patologia  partir de ciertas evaluaciones clinicas y paraclinicos.

  En 1984, Leo Breiman y colaboradores desarrollaron la tecnica conocida como
CART (Classification and Regression Trees), que se mostro muy eficaz en las
aplicaciones ecologicas y clinicas. Sin embargo, el mismo Breiman observo
posteriormente que dicho algoritmo resultaba inestable frente a variaciones de
la secuencia de entrenamiento.
  Esto dio pie, en 1996, al nacimiento de la tecnica llamada Bagging, donde,
mediante la realizacion del mismo algoritmo varia sveces sobre muestras
boostrap de  la secuencia de entrenamiento, se obtienen procedimientos
estables. Al final de su prolifica carrera, desde 2001 en adealnte, Leo Breiman
(y a nivel computacional, Breiman y Adele Cutler) desarrollaron una de las
tecnicas de clasificacion mas eficaces conocidas hasta el momento, llamado
Random Forests (Boques Aleatorios) que aún estabilidad con eficiencia,
combinando en su interior las ideas centrales de CART y Bagging.

  La presentacion breve de los hechos esenciales de este recorrido intelectual y
tecnologico, ocupara la primera parte de la exposicion, que podria denominarse
"establizando algoritmos".

  La segunda parte podria llamarse "fortificando clasificadores". Un
clasificador se llama debil si su probabilidad de error es menor que 1/2 (es
decir, es apenas mejor que lanzar una moneda). La tecnica llamada Boosting (en
particular el algoritmo AdaBoost) es un procedimiento iterativo que, a partir
de un calsificador d.ebil consytruye uno de alta eficiencia. Expondremos
brevemente esta tecnica y un enfoque alternativo, propuestop recientemente por
Badih Ghattas (IML, Marseille), Juan Piccini y el expositor. En el mismos,
apoyandose en un procedimiento muy elemental, se obtienenen clasificadores
fuertes por iteracion de uno debil, obteniendose resultados rigurosos,
particularmente idoneos para el caso en que muestra de entrenamiento tiene
datos escondidos.

----------------------------------------------------------------
This message was sent using IMP, the Internet Messaging Program.
------------ próxima parte ------------
Se ha borrado un adjunto en formato HTML...
URL: http://cmat.edu.uy/pipermail/todos/attachments/20060619/ab51ff52/unnamed.htm


Más información sobre la lista de distribución Todos