Skip to content

manjavacas/rl-temario

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

65 Commits
 
 
 
 
 
 
 
 
 
 

Repository files navigation

License

Aprendizaje por refuerzo

Temario sobre aprendizaje por refuerzo (reinforcement learning) en español.

Elaborado por Antonio Manjavacas ([email protected]).

📃 Contenidos

  1. Introducción
  2. Bandits
  3. Procesos de decisión de Markov
  1. Programación dinámica
  2. Métodos basados en muestreo
    4.1. Monte Carlo
    4.2. TD-learning
  3. Planificación
  4. Resumen
  1. Aproximación de funciones de valor
  2. Aproximación de políticas

📝 TO-DO

📁 Material

📚 Bibliografía

Principales fuentes empleadas en la elaboración de este temario:

🚀 Contribuye

Si quieres ayudar a mejorar este proyecto, envía sugerencias o colabora reportando errores a través de issues.

✍️ Uso y licencia

Este material se distribuye bajo licencia GPLv3.