4.10 - Las Redes LSTM (parte 2): actualización de la celda de memoria y del estado oculto

Lección 10 de la sección “Redes Recurrentes y LSTM” del curso Fundamentos de Deep Learning con Python.

Introducción

En la lección anterior vimos dos de los componentes esenciales de una Red LSTM: las compuertas y las celdas de memoria, que permiten a esta red procesar una secuencia usando una memoria tanto de largo como de corto plazo.

En esta lección veremos cómo interactuan estos elementos para controlar el flujo de información y permitir así la actualización tanto del contenido de la celda de memoria como del estado oculto durante el procesamiento de una secuencia.

Contenido exclusivo suscriptores

Suscríbete para tener acceso al video con la explicación detallada de esta lección. Además podrás disfrutar de todos los cursos de la Academia Online

Actualización de la celda de memoria

Para determinar la información que se incluirá en la celda de memoria es necesario tomar los datos procesados por las compuertas olvidar y de entrada, así como por la celda de memoria candidata.

Así, operando sobre estos valores, la Red podrá determinar cuál información tanto de largo plazo (controlada por la información de la compuerta olvidar) y qué tanta de corto plazo (controlada por la compeurta de entrada y la celda de memoria candidata) será preservada.

Actualización del estado oculto

Con la celda de memoria actualizada, sólo resta hacer algo similar para el estado oculto.

Este estado oculto se actualiza tomando la información entregada por la compuerta de salida y por la celda de memoria actualizada (descrita en los párrafos anteriores).

¡Y con esto ya tenemos actualizados las dos salidas de la Red LSTM!

Contenido exclusivo suscriptores

Recuerda suscribirte para acceder al video con la explicación detallada de esta lección. Además podrás disfrutar de todos los cursos de la Academia Online

Conclusión

Ahora sí tenemos todos los elementos que conforman una Red LSTM y hemos visto cómo interactúan para de manera selectiva preservar la información relevante (tanto a largo como a corto plazo) durante el procesamiento de la secuencia.

Así que estamos listos para la segunda práctica de esta sección, en donde pondremos a prueba todo lo aprendido hasta el momento para implementar una aplicación muy usada actualmente en el ámbito del Procesamiento del Lenguaje Natural.

Veremos entonces cómo implementar y entrenar un modelo capaz de realizar el Análisis de sentimientos con Redes LSTM.

Ver todas las lecciones de este curso