Seminario Departamental: Aprendizaje por refuerzo evolutivo multi-objetivo

Conferencista: Dr. Carlos Ignacio Hernández Castellanos

 


Resumen:

A menudo, nos enfrentamos a problemas en los que necesitamos optimizar múltiples objetivos en conflicto. Además, podemos encontrarnos en situaciones inciertas y donde sea necesario realizar una serie de decisiones. Este tipo de problema puede modelarse como un proceso de decisión de Markov multiobjetivo (MOMDP, por sus siglas en inglés), y una forma de resolverlo es mediante el llamado aprendizaje por refuerzo multiobjetivo (MORL, por sus siglas en inglés). De forma similar a optimización multi-objetivo, la solución para este tipo de problema es un conjunto en lugar de una única solución. En MORL tenemos un conjunto de políticas (mapeos de estados y acciones a probabilidades). En los últimos años, la atención en la resolución de MOMDPs ha aumentado debido a su importancia en problemas del mundo real. Desde la perspectiva de la optimización multiobjetivo, los MOMDPs plantean desafíos interesantes, ya que suelen ser problemas de alta dimensionalidad, dinámicos y presentan distintos tipos de incertidumbre.

En esta platica, se explorarán las ventajas y desventajas de algoritmos evolutivos comparadas con técnicas tradicionales para resolver este tipo de problemas. Por otra parte, se presentará un caso de estudio en vehículos autónomos y se finalizará con algunas perspectivas y preguntas abiertas.


Semblanza personal:

Carlos Hernández recibió su grado de maestría y doctorado por el CINVESTAV-IPN en 2013 y 2017 respectivamente. En 2018 realizó una estancia posdoctoral en la Universidad de Oxford en Reino Unido en estrategias de manejo para vehículos autónomos. Actualmente, es Investigador asociado en el Instituto de Investigaciones en Matemáticas Aplicadas y en Sistemas de la Universidad Nacional Autónoma de México. Por sus trabajos de investigación, ha recibido distintos premios entre los que destaca el premio Arturo Rosenblueth por su tesis Doctoral en 2018 y el Google Academic Research Award 2024 en IA y sociedad. Es Miembro del Sistema Nacional de Investigadores nivel 1. Ha publicado más de 25 artículos científicos y es autor de dos libros en temas especializados. Google Scholar reporta más de 500 citas a sus trabajos. Sus intereses de investigación son optimización multi-objetivo bajo incertidumbre, algoritmos evolutivos, aprendizaje por refuerzo.

Lugar:  Auditorio de Ing. Eléctrica.
Fecha:  Lunes 12 de mayo.
Hora:   12:00 - 14:00 hrs.
Vídeo de la Conferencia:  aquí.

Print
CONTÁCTENOS

Logo Cinvestav

Av. Instituto Politécnico Nacional 2508
Col. San Pedro Zacatenco, Alcaldía Gustavo A. Madero
Ciudad de México, C.P. 07360
Apartado Postal: 14-740, 07000 Ciudad de México

Tel. +52 (55) 5747 3800

Cinvestav © 2025
19/03/2024 12:10:28 p. m.