Blog

Artículos que complementarán tu aprendizaje del Machine Learning y la Ciencia de Datos

¿Cómo codificar datos categóricos?

(Enero 22, 2024)

En este artículo veremos los métodos más usados en Ciencia de Datos y Machine Learning para codificar numéricamente los datos categóricos.

Tutorial: manejo de datos categóricos faltantes

(Septiembre 25, 2023)

En este tutorial vamos a ver las principales técnicas para realizar el manejo de datos faltantes cuando los datos que queremos completar son de tipo categórico.

Temperatura, top-k y top-p: generación de texto con Grandes Modelos de Lenguaje

(Septiembre 18, 2023)

En este artículo veremos cómo controlar la aleatoriedad del texto generado por los Grandes Modelos de Lenguaje usando la temperatura y los muestreos top-k y top-p.

¿Qué es la ventana de contexto de un Gran Modelo de Lenguaje?

(Septiembre 11, 2023)

En este artículo exploraremos el concepto de la ventana de contexto en los Grandes Modelos de Lenguaje, que determina la cantidad de texto que estos modelos pueden manejar.

¿Cómo seleccionar el mejor modelo en un problema de Machine Learning?

(Septiembre 4, 2023)

En este artículo veremos los pasos que se deberían llevar a cabo para seleccionar el modelo más adecuado al momento de resolver un problema de Machine Learning.

¿Qué son los 'embeddings'?

(Agosto 28, 2023)

En este artículo veremos qué son los embeddings y cómo se utilizan para desarrollar diferentes aplicaciones de procesamiento del lenguaje natural usando los Grandes Modelos de Lenguaje.

¿Qué es el ajuste de hiper-parámetros

(Agosto 21, 2023)

En este artículo vamos a entender en qué consiste el ajuste de hiper-parámetros y cómo funcionan sus dos principales métodos: la búsqueda exhaustiva y la búsqueda aleatoria.

¿Qué son los tokens?

(Agosto 8, 2023)

En este artículo veremos qué son los tokens y por qué son fundamentales al momento de implementar aplicaciones haciendo uso de Grandes Modelos de Lenguaje

Validación cruzada y k-fold cross-validation

(Julio 31, 2023)

En este artículo veremos en qué consiste la validación cruzada y el algoritmo k-fold cross-validation, uno de los métodos más usados para el entrenamiento y validación de modelos de Machine Learning.

Los sets de entrenamiento, validación y prueba

(Junio 16, 2023)

En este artículo veremos qué son los sets de entrenamiento, validación y prueba que convencionalmente debemos usar al entrenar un modelo de Machine Learning.

Grandes Modelos de Lenguaje (Large Language Models)

(Junio 9, 2023)

En este artículo vamos a entender qué son los Grandes Modelos de Lenguaje, los sistemas de Inteligencia Artificial que recientemente han revolucionado el procesamiento y generación de Lenguaje Natural.

Parámetros e hiperparámetros en el Machine Learning

(Junio 2, 2023)

En este artículo veremos qué son los parámetros y los hiperparámetros de un modelo, dos conceptos que resultan fundamentales en el Machine Learning.