4 - ¿Qué es y para qué sirve el Análisis de Componentes Principales?

Diciembre 23, 2023 por Miguel Sotaquirá

Lección 4 del curso Probabilidad Nivel Avanzado.

En el módulo anterior vimos varios conceptos fundamentales de la Probabilidad que tienen un amplio rango de aplicación a diferentes problemas de la Ciencia de Datos y el Machine Learning: la covarianza, la correlación y la matriz de covarianza.

En este segundo módulo nos enfocaremos en una técnica muy usada al momento de abordar diferentes problemas de Ciencia de Datos y Machine Learning y que nos permite realizar algo que se conoce como la reducción de dimensionalidad de un set de datos. Así que veremos todos los detalles del Análisis de Componentes Principales (o PCA por sus siglas en Inglés: Principal Component Analysis).

Y en esta lección daremos una introducción general a esta técnica. Así que comenzaremos entendiendo precisamente el significado del concepto de reducción de dimensionalidad, los tipos de problemas en los cuáles resulta útil reducir las dimensiones de nuestro set de datos así como el principio básico de funcionamiento del Análisis de Componentes Principales.

Suscríbete para tener acceso al video con la explicación detallada de esta lección. Además podrás disfrutar de todos los cursos de la Academia Online

Bien, acabamos de ver la idea básica del concepto de reducción de dimensionalidad y su utilidad en diferentes problemas de Ciencia de Datos y Machine Learning.

Y partiendo de este concepto acabamos también de entender el principio básico de funcionamiento del algoritmo de Análisis de Componentes Principales así como el tipo de resultado que obtendremos tras aplicar este algoritmo a un set de datos.

Con estas ideas básicas ya estamos listos para entender todos los elementos matemáticos que conforman esta técnica, así que en la próxima lección veremos la explicación detallada del análisis de componentes principales.

Ver todas las lecciones de este curso