Lecciones

Resumen de cada lección de los cursos de la Academia:

14 - El objetivo del Agente

(Febrero 10, 2022 - Aprendizaje por Refuerzo Nivel Básico)

En esta lección tomaremos lo aprendido hasta el momento para reformular el objetivo del agente en un problema de Aprendizaje por Refuerzo.

13 - El tablero bidimensional estocástico: el descuento

(Febrero 8, 2022 - Aprendizaje por Refuerzo Nivel Básico)

En esta lección vamos a introducir el concepto del descuento, que permitirá que más adelante el agente “aprenda” a llegar a la meta de forma óptima.

12 - El tablero bidimensional estocástico: el horizonte

(Febrero 5, 2022 - Aprendizaje por Refuerzo Nivel Básico)

En esta lección introduciremos explícitamente la variable tiempo en nuestro Proceso de Decisión de Markov usando el concepto de horizonte.

11 - El tablero bidimensional estocástico: función de transición y recompensa

(Febrero 3, 2022 - Aprendizaje por Refuerzo Nivel Básico)

En esta lección hablaremos en detalle de la función de transición y de las recompensas asociadas a cada acción ejecutada por el agente en nuestro juego.

10 - El tablero bidimensional estocástico: las acciones

(Febrero 1, 2022 - Aprendizaje por Refuerzo Nivel Básico)

En esta lección hablaremos de las acciones de nuestro juego y de las diferentes características que puede tener el espacio de acciones.

9 - El tablero bidimensional estocástico: los estados y la propiedad de Markov

(Enero 29, 2022 - Aprendizaje por Refuerzo Nivel Básico)

En esta lección veremos los estados de nuestro juego y hablaremos de la Propiedad de Markov, una condición fundamental en la teoría del Aprendizaje por Refuerzo.

8 - El tablero bidimensional estocástico: entorno y reglas del juego

(Enero 27, 2022 - Aprendizaje por Refuerzo Nivel Básico)

En esta lección veremos cómo construir un Proceso de Decisión de Markov para un tablero unidimensional, como el de la lección anterior, pero estocástico.

25 - Práctica 5 (parte 3): ¡Juguemos Bop-it!

(Enero 26, 2022 - Python Nivel Básico)

En esta última lección del curso veremos cómo terminar la implementación de Bop-it y cómo poner a prueba nuestro juego.

7 - Procesos de decisión de markov: el tablero unidimensional estocástico

(Enero 25, 2022 - Aprendizaje por Refuerzo Nivel Básico)

En esta lección veremos cómo construir un Proceso de Decisión de Markov para un tablero unidimensional, como el de la lección anterior, pero estocástico.

24 - Práctica 5 (parte 2): ¡Juguemos Bop-it!

(Enero 24, 2022 - Python Nivel Básico)

En esta lección implementaremos tres funciones auxiliares que se encargarán de tareas fundamentales en nuestro juego.

6 - Procesos de Decisión de Markov: un tablero unidimensional

(Enero 22, 2022 - Aprendizaje por Refuerzo Nivel Básico)

En esta lección construiremos nuestro primer Proceso de Decisión de Markov para un caso muy sencillo: un juego con un tablero unidimensional.

23 - Práctica 5 (parte 1): ¡juguemos Bop-it!

(Enero 21, 2022 - Python Nivel Básico)

En esta lección veremos cómo funciona Bop-it, definiremos los requerimientos del programa y escribiremos el pseudo-código