[Probabilidad-Estadistica-Seminario] Curso de Cadenas de Markov Controladas. Comienzo: Lunes 17 de marzo

Ernesto Mordecki ernesto.mordecki en gmail.com
Lun Mar 10 14:49:33 -03 2025


*Cadenas de Markov Controladas (una introducción al Reinforcement Learning)*

*Primer semestre 2025 – Licenciatura en Matemática*

Luego de introducir los problemas de control determinísticos, se introducen
las cadenas de Markov. En este marco se introducen los problemas de control
con tiempo finito, y con tiempo infinito y costos descontados. Planteada la
ecuación de Bellman, se estudian algoritmos de solución de estos problemas.
Para terminar se estudian algoritmos de reinforcement learning, que se ven
como los problemas anteriores cuando las probabilidades de transición en la
cadena de Markov subyacente es desconocida. Equipo docente: E. Mordecki
(teórico) L. Bentancur (práctico). La referencia central es el libro:

Reinforcement Learning: Foundations. S. Mannor, Y. Mansour and A. Tamar,
November 2024 <https://sites.google.com/view/rlfoundations/home>

Salón de seminarios del Cmat. Piso 14 de Facultad de Ciencias

Lunes 16:30 a 18:00 (Teórico)

Miércoles 15:00 a 16:30 (Práctico)

Miércoles 16:30 a 18:00 (Teórico

Opción remota:

-Todo el material (diapositivas de teórico y repartidos de práctico) en EVA.

-En función del interés se dictarán algunas clases y consultas virtuales.

Método de aprobación: entrega de ejercicios durante el curso y presentación
de un tema (no hay examen)

Por consultas me escriben
Saludos
E. Mordecki

-- 
Ernesto Mordecki  <http://www.cmat.edu.uy/~mordecki/>
------------ próxima parte ------------
Se ha borrado un adjunto en formato HTML...
URL: <http://listas.cmat.edu.uy/pipermail/seminario-probabilidad-estadistica/attachments/20250310/d910beeb/attachment.html>


Más información sobre la lista de distribución seminario-probabilidad-estadistica