Este proyecto se centra en la descarga, procesamiento y migración de datos del padrón reducido de RUC de SUNAT a una base de datos.
- Descarga del archivo ZIP del padrón reducido de RUC desde la página oficial de SUNAT. Este proceso se realiza en el archivo
data_processing.ipynb
. - Extracción del archivo ZIP descargado.
- Limpieza de los datos descargados y preparación para su migración. Este proceso también se realiza en
data_processing.ipynb
.
- Análisis de los datos: Actualmente, solo se ha completado un 30% del análisis de los datos. Se necesita realizar un análisis más profundo para entender mejor los datos y cómo se pueden utilizar de manera efectiva.
- Migración de los datos a la base de datos: Aún no se ha implementado la funcionalidad para migrar los datos procesados a la base de datos. Los detalles de la base de datos se encuentran en el archivo
config.yaml
. - Pruebas y validación: Una vez que se haya completado la migración de los datos, será necesario realizar pruebas para asegurarse de que los datos se han migrado correctamente.
Este proyecto está en desarrollo y cualquier contribución es bienvenida. Si tienes alguna sugerencia o mejora, no dudes en abrir un issue o un pull request.