1 - ¿Qué es el Álgebra Lineal?

Febrero 22, 2023 por Miguel Sotaquirá

Lección 1 del curso Álgebra Lineal para Ciencia de Datos y Machine Learning.

Tabla de contenido

Introducción

En esta primera lección vamos a entender de forma intuitiva, y a partir de un par de ejemplos, qué es el Álgebra Lineal y su importancia en la Ciencia de Datos y el Machine Learning.

Video

En el canal de YouTube puedes ver el video completo de esta primera lección:

Ejemplo 1: el precio de un inmueble

Asumamos un primer ejemplo sencillo: tenemos la información asociada al área y al número de habitaciones de dos inmuebles

Inmueble 1: 70m2, 3 habitaciones, U$75.000
Inmueble 2: 130 m2, 4 habitaciones, U$125.000

Y con esta información quisiéramos crear una ecuación que nos permita calcular fácilmente el precio del inmueble dadas su área y su número de habitaciones.

Esta ecuación contendrá dos variables o parámetros (a y b) los cuales podemos encontrar resolviendo lo que se conoce como un sistema de ecuaciones lineales.

Pués bien, el Álgebra Lineal permite precisamente, entre otras cosas, resolver este tipo de sistemas ecuaciones.

Ejemplo 2: construyendo un modelo

Supongamos que tenemos el mismo caso anterior pero que en lugar de 2 inmuebles tenemos la información de 2.000 inmuebles.

Y supongamos que lo que queremos es encontrar una ecuación que permita estimar el precio del inmueble dadas el área y el número de habitaciones. Algo como:

precio = a x área + b x número de habitaciones

donde a y b son, nuevamente, dos parámetros que debemos encontrar.

La ecuación anterior se conoce como un modelo: es una ecuación matemática que contiene unas características de entrada (área, nro. habitaciones) y que al combinarlas con unos parámetros (a, b) intenta predecir de forma lo más precisa posible la variable de interés (el precio).

Como hay tantos datos (2.000 inmuebles) en este caso lo más probable es que los valores de a,b que encontremos no se ajusten a la perfección a todos los datos. Es decir, independientemente de cómo sean calculados, a y b generarán buenas predicciones para unos datos y no tan buenas para otros.

Entonces, en la construcción de este modelo el objetivo es encontrar los valores de a y b que en promedio arrojen los menores errores posibles entre el valor real y la predicción.

Y para lograr lo anterior se usan algoritmos de optimización, la base de muchas técnicas de Machine Learning, que buscan encontrar los parámetros que minimicen este error.

Y en la mayoría de casos estos algoritmos de optimización hacen uso del Álgebra Lineal, que permite expresar los datos conocidos (áreas, número de habitaciones y precios de los inmuebles) usando representaciones conocidas como vectores y matrices y que permite realizar operaciones sobre estos tipos de datos para encontrar los parámetros el modelo.

Álgebra Lineal: definición

Teniendo en cuenta los dos ejemplos anteriores, ya podemos dar una definición más precisa de lo que es el Álgebra Lineal.

Esta definición es tomada del libro Mathematics for Machine Learning (Deisenroth, Faisal, Ong, 2021): “el Álgebra Lineal es el estudio de vectores y de reglas que permiten su manipulación”.

Aunque en realidad podemos complementar esta definición mencionando que el Álgebra Lineal permite estudiar no sólo vectores sino también matrices y que cuando hablamos de “reglas que permiten su manipulación” nos estamos refiriendo a los diferentes tipos de operaciones que podemos llevar a cabo sobre este tipo de datos.

Importancia del Álgebra Lineal en la Ciencia de Datos y el Machine Learning

Para finalizar esta lección vale la pena mencionar que la Ciencia de Datos y el Machine Learning están construidos sobre la base de las matemáticas y específicamente sobre tres campos que son sus pilares fundamentales: el Álgebra Lineal, el Cálculo (especialmente el Cálculo Diferencial) y la Probabilidad y la Estadística (de estos dos últimos hablaremos en los próximos cursos de la Academia).

En particular en este curso nos enfocaremos en uno de esos tres pilares, el Álgebra Lineal, que como lo definimos en la sección anterior, permite no sólo representar de forma adecuada los datos (como vectores, matrices o tensores) sino que nos permite entender todas las operaciones entre estos datos para extraer información relevante en nuestros proyectos.

Conclusión

Con lo visto en esta primera lección ya tenemos claro qué es el Álgebra Lineal y el papel que juega dentro de la Ciencia de Datos y el Machine Learning.

En la próxima lección veremos entonces ejemplos de aplicación del Álgebra Lineal en la Ciencia de Datos y el Machine Learning.

Ver todas las lecciones de este curso