Lecciones
Resumen de cada lección de los cursos de la Academia:
16 - Práctica 4: Diferencia Temporal con OpenAI Gym y Python
(Abril 23, 2022 - Aprendizaje por Refuerzo Nivel Intermedio)
En esta última práctica del curso usaremos los métodos de Diferencia Temporal para entrenar un agente capaz de moverse en un pequeño tablero que emula un Taxi que debe recoger a un pasajero y dejarlo en otro punto del tablero.