Charlas - Renne Rocha: Querido Diario: Cómo Liberar Datos Oficiales de Ciudades Brasileñas con Py...
Description:
Descubre cómo el proyecto Querido Diario utiliza Python para hacer más accesibles los Diarios Oficiales de las ciudades brasileñas en esta charla de PyCon US. Explora el proceso completo de extracción de datos de las páginas municipales mediante web scraping con Scrapy, el almacenamiento y procesamiento de archivos PDF utilizando OCR para permitir búsquedas de contenido, y el desarrollo de una API abierta y una página de búsqueda centralizada. Aprende sobre los desafíos de trabajar con 5570 ciudades que publican información de manera no estandarizada y cómo este proyecto busca facilitar la consulta y análisis automatizado de datos oficiales, mejorando la comunicación entre la ciudadanía y el gobierno local en Brasil.
Querido Diario - Cómo Liberar Datos Oficiales de Ciudades Brasileñas con Py