<div dir="ltr"><div dir="ltr"><div><div style="text-align:center"><b>Cadenas de Markov Controladas (una introducción al Reinforcement
Learning)</b></div>
<p align="center" style="line-height:100%;margin-bottom:0in;background:transparent"><b>Primer
semestre 2025 – Licenciatura en Matemática</b></p>
<p align="left" style="font-weight:normal;line-height:100%;margin-bottom:0in;background:transparent">
Luego de introducir los problemas de control determinísticos, se
introducen las cadenas de Markov. En este marco se introducen los
problemas de control con tiempo finito, y con tiempo infinito y
costos descontados. Planteada la ecuación de Bellman, se estudian
algoritmos de solución de estos problemas. Para terminar se estudian
algoritmos de reinforcement learning, que se ven como los problemas
anteriores cuando las probabilidades de transición en la cadena de
Markov subyacente es desconocida. Equipo docente: E. Mordecki
(teórico) L. Bentancur (práctico). La referencia central es el
libro:</p>
<p align="left" style="font-weight:normal;line-height:115%;margin-bottom:0.1in;background:transparent"><a href="https://sites.google.com/view/rlfoundations/home" style="color:rgb(0,0,128);text-decoration:underline" target="_blank">Reinforcement
Learning: Foundations. S. Mannor, Y. Mansour and A. Tamar, November
2024</a></p>
<p align="left" style="font-weight:normal;line-height:100%;margin-bottom:0in;background:transparent">
Salón de seminarios del Cmat. Piso 14 de Facultad de
Ciencias</p>
<p align="left" style="font-weight:normal;line-height:100%;margin-bottom:0in;background:transparent">
Lunes 16:30 a 18:00 (Teórico)</p>
<p align="left" style="font-weight:normal;line-height:100%;margin-bottom:0in;background:transparent">
Miércoles 15:00 a 16:30 (Práctico)</p>
<p align="left" style="font-weight:normal;line-height:100%;margin-bottom:0in;background:transparent">
Miércoles 16:30 a 18:00 (Teórico</p>
<p align="left" style="font-weight:normal;line-height:100%;margin-bottom:0in;background:transparent">
Opción remota:
</p>
<p align="left" style="font-weight:normal;line-height:100%;margin-bottom:0in;background:transparent">
-Todo el material (diapositivas de teórico y repartidos de
práctico) en EVA.</p>
<p align="left" style="font-weight:normal;line-height:100%;margin-bottom:0in;background:transparent">
-En función del interés se dictarán algunas clases y consultas
virtuales.</p>
<p align="left" style="font-weight:normal;line-height:100%;margin-bottom:0in;background:transparent">
Método de aprobación: entrega de ejercicios durante el curso y
presentación de un tema (no hay examen)</p>
</div><div><br></div><div>Por consultas me escriben</div><div>Saludos</div><div>E. Mordecki</div><br><span class="gmail_signature_prefix">-- </span><br><div dir="ltr" class="gmail_signature" data-smartmail="gmail_signature"><div dir="ltr">Ernesto Mordecki <a href="http://www.cmat.edu.uy/~mordecki/" target="_blank"></a></div></div></div>
</div>