18 - Introducción a las Expresiones Regulares en Python
Lección 18 del curso Python Nivel Intermedio.
Tabla de contenido
Introducción
En la lección anterior vimos varios métodos avanzados para el procesamiento de strings donde aprendimos diferentes maneras de manipularlos.
Pero, a pesar de que son herramientas útiles, en ocasiones necesitamos detectar patrones en el texto usando herramientas más sofisticadas.
En esta lección veremos entonces una introducción a las expresiones regulares en Python, que es precisamente esa herramienta que nos permitirá hacer la búsqueda de patrones complejos de caracteres en un string.
Suscríbete para tener acceso al video con la explicación detallada de esta lección. Además podrás disfrutar de todos los cursos de la Academia Online
Ejemplo de motivación: búsqueda de substrings
Como lo vimos en la lección anterior, con los métodos disponibles en los strings resulta posible buscar cadenas de caracteres (o substrings) de forma relativamente simple.
Por ejemplo, si tenemos el siguiente string:
texto = 'Claudia1992Ingeniera'
Si queremos extraer del mismo únicamente los caracteres numéricos (que en este caso corresponden a su año de nacimiento), podemos por ejemplo usar el método find
para encontrar el índice de inicio de este substring:
texto.find('1992')
Pero, ¿qué pasa si tenemos múltiples strings con la misma estructura del anterior, pero correspondientes a diferentes personas?
Por ejemplo, los strings 'Juan1987Médico'
, 'Laura2001Estudiante'
, 'Manuel1977Profesor'
tienen la misma estructura del anterior: nombre, año de nacimiento y profesión; pero los valores de estos campos son totalmente diferentes en cada caso.
Así que los métodos avanzados para el procesamiento de strings no resultan útiles en este caso, pues sólo permiten buscar coincidencias exactas de substrings dentro del texto original.
¿Qué son las Expresiones Regulares?
Las Expresiones Regulares son la alternativa a este problema. Así, si en los métodos convencionales de strings usamos un substring como punto de partida para realizar la búsqueda, en las expresiones regulares lo que usaremos será un patrón de búsqueda.
Así, por ejemplo en el caso de los cuatro strings anteriores en lugar de buscar el substring exacto usaremos expresiones regulares y el patrón de búsqueda serán secuencias de caracteres que contengan números.
Usos de las Expresiones Regulares
- Para validar datos, y así asegurarnos de que está en el formato correcto antes de realizar el procesamiento.
- Para extraer datos del texto, lo que se conoce como scraping.
- Para limpiar el texto y eliminar caracteres o secuencias de caracteres que no nos interesan
- Para transformar datos de un formato a otro, por ejemplo datos en formato tabular donde cada columna se encuentra separada por tabulaciones a una representación de datos separados por comas
Recuerda suscribirte para acceder al video con la explicación detallada de esta lección. Además podrás disfrutar de todos los cursos de la Academia Online
Conclusión
Muy bien, ya tenemos una idea general de lo que son las Expresiones Regulares, así que ya es momento de ver cómo las podemos usar desde Python. Entonces, en la próxima lección hablaremos del módulo “re” y de la función “fullmatch”.