Lecciones

Resumen de cada lección de los cursos de la Academia:

3 - Práctica 1: ¡juguemos ahorcado!

(Febrero 18, 2022 - Python Nivel Intermedio)

En esta lección veremos de forma práctica cómo usar varios módulos de la Librería Estándar de Python.

17 - La función acción-valor

(Febrero 17, 2022 - Aprendizaje por Refuerzo Nivel Básico)

En esta lección hablaremos de la función acción-valor, que permite al agente determinar el valor de una acción partiendo de un estado en particular.

2 - Tour práctico por la Librería Estándar de Python

(Febrero 16, 2022 - Python Nivel Intermedio)

En esta lección veremos de forma práctica cómo usar varios módulos de la Librería Estándar de Python.

16 - La función estado-valor

(Febrero 15, 2022 - Aprendizaje por Refuerzo Nivel Básico)

En esta lección hablaremos de la función estado-valor, que permite cuantificar los diferentes estados alcanzados por el Agente.

1 - Introducción a la librería estándar de Python

(Febrero 14, 2022 - Python Nivel Intermedio)

En esta primera lección del curso veremos qué es y todos los elementos que componen la Librería Estándar de Python.

15 - La política

(Febrero 12, 2022 - Aprendizaje por Refuerzo Nivel Básico)

En esta lección hablaremos de la política, que permite al agente tomar decisiones considerando todos los posibles escenarios.

14 - El objetivo del Agente

(Febrero 10, 2022 - Aprendizaje por Refuerzo Nivel Básico)

En esta lección tomaremos lo aprendido hasta el momento para reformular el objetivo del agente en un problema de Aprendizaje por Refuerzo.

13 - El tablero bidimensional estocástico: el descuento

(Febrero 8, 2022 - Aprendizaje por Refuerzo Nivel Básico)

En esta lección vamos a introducir el concepto del descuento, que permitirá que más adelante el agente “aprenda” a llegar a la meta de forma óptima.

12 - El tablero bidimensional estocástico: el horizonte

(Febrero 5, 2022 - Aprendizaje por Refuerzo Nivel Básico)

En esta lección introduciremos explícitamente la variable tiempo en nuestro Proceso de Decisión de Markov usando el concepto de horizonte.

11 - El tablero bidimensional estocástico: función de transición y recompensa

(Febrero 3, 2022 - Aprendizaje por Refuerzo Nivel Básico)

En esta lección hablaremos en detalle de la función de transición y de las recompensas asociadas a cada acción ejecutada por el agente en nuestro juego.

10 - El tablero bidimensional estocástico: las acciones

(Febrero 1, 2022 - Aprendizaje por Refuerzo Nivel Básico)

En esta lección hablaremos de las acciones de nuestro juego y de las diferentes características que puede tener el espacio de acciones.

9 - El tablero bidimensional estocástico: los estados y la propiedad de Markov

(Enero 29, 2022 - Aprendizaje por Refuerzo Nivel Básico)

En esta lección veremos los estados de nuestro juego y hablaremos de la Propiedad de Markov, una condición fundamental en la teoría del Aprendizaje por Refuerzo.