3.6 - Los Strides

Lección 6 de la sección “Redes Convolucionales” del curso Fundamentos de Deep Learning con Python.

Introducción

En la lección anterior hablamos del padding, una operación que evita reducciones drásticas en la imagen resultante tras la convolución.

En esta lección hablaremos de la operación opuesta, los strides, que permite reducir el tamaño del mapa de características resultante, y que, al igual que el padding, es muy usado en la implementación práctica de Redes Convolucionales.

Contenido exclusivo suscriptores

Suscríbete para tener acceso al video con la explicación detallada de esta lección. Además podrás disfrutar de todos los cursos de la Academia Online

Los strides en la convolución básica

Como lo vimos anteriormente, durante el cálculo de la convolución el kernel se desplaza, en cada iteración, un pixel. Este tamaño del desplazamiento se conoce como “salto” o, usando el término en Inglés, stride. Así, para el caso de la convolución básica, se usa un stride igual a 1.

Strides mayores que 1

Pero resulta que spodemos usar strides de tamaños mayores que 1 (es decir iguales a 2, 3, 4, etc.) al momento de realizar la convolución.

En estos casos el tamaño de la imagen resultante será aún inferior al obtenido al usar un stride igual a 1. Y esto resulta útil si queremos “comprimir” aún más el mapa de características resultante al momento de procesar la imagen con la Red Convolucional.

En términos generales: entre mayor sea el tamaño del stride menor será el tamaño del mapa de características resultante.

Contenido exclusivo suscriptores

Recuerda suscribirte para acceder al video con la explicación detallada de esta lección. Además podrás disfrutar de todos los cursos de la Academia Online

Conclusión

Bien, hasta este punto hemos visto el filtro o kernel y las operaciones básicas usadas en una Red Convolucional: la convolución, el padding y los strides.

La idea ahora es ver situaciones más generales, es decir cuando por ejemplo tenemos imágenes con múltiples canales (como las imágenes RGB) o cuando usamos múltiples kernels para su procesamiento.

Así que en la próxima lección veremos el primero de estos casos: la convolución en imágenes con múltiples canales de entrada (volúmenes).

Ver todas las lecciones de este curso