Thesis proposals
La vida es acerca tomar decisiones. Tomar decisiones, sin importar si son realizadas por individuos, grupos o “computadoras” suelen ser complicadas. Esto se debe, en parte, a que normalmente se tienen objetivos que están en conflicto entre ellos (por ejemplo, queremos algo barato, pero de calidad). Otra razón se debe a que puede ser una decisión de muchas por venir (toma de decisión secuencial), entonces debemos tomar en cuenta las consecuencias que la decisión puede traer. Si esto no fuese suficiente, típicamente estos problemas se encuentran en la clase NP-Hard. Estos temas se pueden tratar formalmente mediante optimización multi objetivo y aprendizaje por refuerzo.
Los proyectos que se proponen se enfocan en diseñar algoritmos que permitan a un tomador de decisión el conjunto de soluciones de interés. Esto se realiza mediante el uso de técnicas de programación matemática y algoritmos evolutivos. Los proyectos se dividen en algorítmicos y aplicados
Algorítmicos
- Optimización bajo incertidumbre: diseñar algoritmos que permitan incluir la incertidumbre en el ambiente (por ejemplo, cambios en el ambiente, errores de medición, ruido en los sistemas) para obtener soluciones que tengan buena calidad y que tengan utilidad práctica.
- Configuración automática de algoritmos: utilizar técnicas de aprendizaje por refuerzo y estadística Bayesiana para diseñar algoritmos que selección los “mejores” componentes para resolver problemas de optimización por ejemplo problemas de la mochila, viajero, calendarización, etc. (en sus versiones multi objetivo y/o con incertidumbre.
- Archivos externos para algoritmos evolutivos: diseñar algoritmos que incluyan una “memoria” de las mejores soluciones que han encontrado a lo largo de la búsqueda para aprender de ellas y guiar la búsqueda de algoritmos evolutivos para obtener mejores soluciones que aquellas del estado del arte.
Aplicados
- Optimización de portafolios financieros con muchos objetivos
- Problema de ruteo multi-objetivo bajo incertidumbre
- Problemas de calendarización multi-objetivo (tareas, tripulaciones de aviación, calendarización de transporte, etc.)
- Optimización de rutas para vehículos aereos no tripulados
- Aprendizaje profundo multi tarea: desarrollo y estudio de métodos multi objetivo para diseñar un algoritmo de aprendizaje máquina que pueda realizar múltiples tareas de forma simultánea (por ejemplo, reconocer un rostro y su edad).
- Aprendizaje por refuerzo multi recompensa: desarrollo y estudio de métodos que permitan considerar sistemas donde existen múltiples fuentes de recompensa (posiblemente en conflicto) para permitir que agentes tomen decisiones y puedan actuar en estos ambientes.
