12 - Análisis explicativo

Lección 12 del curso Introducción a la Ciencia de Datos.

Introducción

En la lección anterior hablamos del análisis descriptivo y exploratorio, los dos tipos de análisis que usualmente tendremos que realizar en cualquier proyecto de Ciencia de Datos.

En estos tipos de análisis estamos intentando responder a la pregunta ¿qué? es decir ¿qué características tienen nuestros datos?

Pero existe un análisis que va un paso más allá y que intenta responder a la pregunta ¿por qué? Es decir ¿por qué los datos se comportan de la forma observada en los análisis descriptivo o exploratorio?

Este análisis se conoce como explicativo (o diagnóstico o causal) y es precisamente el tema de esta lección.

Contenido exclusivo suscriptores

Suscríbete para tener acceso al video con la explicación detallada de esta lección. Además podrás disfrutar de todos los cursos de la Academia Online

¿Qué es el análisis explicativo?

El análisis explicativo va un paso más allá de los análisis descriptivo y exploratorio y está enfocado en encontrar las razones o causas que explican el comportamiento de nuestros datos. Por este motivo a veces también se conoce como análisis diagnóstico o causal.

Para entender esta idea veamos varios ejemplos prácticos.

Accidentes de tránsito

En el primer ejemplo podemos observar el comportamiento de los niveles de accidentes de tránsito en alguna ciudad de algún lugar del mundo durante los últimos 5 años.

En este ejemplo observamos una reducción significativa alrededor del año 2020. El análisis exploratorio nos permitiría ver esta reducción pero el análisis explicativo nos permite entender los motivos de esta reducción. En este caso podemos explicar este comportamiento precisamente por el inicio de la pandemia, lo cual redujo la cantidad de vehículos que se encontraban en las calles y por tanto el nivel de accidentalidad.

Tendencias de búsqueda

Si ingresamos a Google Trends y analizamos las tendencias de búsqueda de los términos “Machine Learning” y “Python” vemos que ambas han tenido un crecimiento sostenido a partir del año 2010. Hasta este punto este sería el análisis exploratorio.

¿Pero a qué se debe este crecimiento? En esta parte del análisis explicativo podríamos decir que el crecimiento en la búsqueda del término “Machine Learning” está asociado a la explosión que ha tenido la disponibilidad de datos no estructurados y al avance en las capacidades computacionales, así como el desarrollo de técnicas más avanzadas (como el Deep Learning) para el procesamiento de estos datos.

Tasas de conversión

En este tercer ejemplo tenemos datos asociados a una campaña de marketing realizada por una entidad bancaria con el fin de ofrecer un certificado de depósito a término a sus clientes.

A partir de este set de datos se pueden calcular las tasas de conversión (es decir el porcentaje de personas que adquirieron el producto con respecto al total de personas contactadas) para los diferentes perfiles laborales. Hasta este punto tendríamos el análisis exploratorio.

Pero si observamos el comportamiento de estas tasas observamos que los grupos “estudiantes” y “pensionados” son los que presentan mayores tasas y que a su vez hay un incremento en dichas tasas a medida que se incrementa el saldo en la cuenta bancaria.

Y en este punto es donde entra el análisis explicativo, pues podemos deducir que los “estudiantes” y los “pensionados” tienen más holgura financiera pues no muy probablemente no han adquirido deudas y no tienen personas dependientes económicamente de ellos, así que tienen algo más de liquidez para poder realizar inversiones.

Contenido exclusivo suscriptores

Recuerda suscribirte para acceder al video con la explicación detallada de esta lección. Además podrás disfrutar de todos los cursos de la Academia Online

Conclusión

Bien, a través de estos ejemplos hemos visto cómo el análisis explicativo toma los resultados del análisis descriptivo y exploratorio para conectarlos con el entorno en el cual estamos desarrollando nuestro proyecto y así encontrar las razones que explican el comportamiento de los datos.

Y en este punto es importante resaltar algo que habíamos mencionado en una lección anterior: debemos tener conocimiento detallado del “negocio” para poder encontrar precisamente esas explicaciones.

En la próxima lección nos enfocaremos en el análisis predictivo que busca determinar el comportamiento de los datos a futuro a partir del análisis de su comportamiento histórico.

Ver todas las lecciones de este curso