Skip to main content

Librería para medir la calidad de los datos en conjuntos de datos estructurados

Project description

LEILA - Librería de calidad de datos

screenshot

PyPI version fury.io PyPI pyversions PyPI license Downloads GitHub forks

Descripción

La librería de calidad de datos tiene como objetivo principal ser una herramienta que facilite la verificación de contenido de bases de datos y dé métricas de calidad para que usuarios puedan decidir si sus bases de datos necesitan modificarse para ser utilizadas en los proyectos. La librería fue escrita en el lenguaje de programación de Python y puede analizar bases de datos estructurados que se conviertan en objetos tipo pandas.DataFrame. Contiene tres módulos principales, el módulo Calidad Datos para analizar cualquier base de datos, el módulo Datos gov para conectarse con los metadatos del Portal de Datos Abiertos de Colombia y utilizar sus bases de datos, y por último el módulo Reporte el cual permite generar un reporte de calidad utilizando los módulos anteriores.

La librería surge como resultado de un proyecto relacionado con realizar análisis descriptivos de la calidad de la información cargada al portal de Datos Abiertos de Colombia, durante el desarrollo del proyecto se identifica el interés por parte de diferentes actores en el proyecto al igual que el beneficio potencial de tener a la mano una librería que facilite describir la calidad de una base de datos, lo cual motivó a realizar la implementación de la librería.

Ejemplo

La librería permite generar un reporte de calidad de datos el cual contiene información descriptiva del dataframe analizado, a continuación se presenta el código requerido para generar un reporte a partir de un archivo en Excel en formato .xlsx.

from leila.reporte import generar_reporte

generar_reporte(datos='datosDeInteres.xlsx')

screenshot

Documentación

La librería cuenta con una documentación que detalla las funciones que la conforman, al igual que ejemplos de uso y demás información de interés relacionada con esta, para acceder a la documentación siga el siguiente link:

Documentación - LEILA - Librería de calidad de datos.

Instalación

Para la instalación de la librería se recomienda utilizar el gestor de paquetes pip, por buenas prácticas se sugiere antes de la instalación crear un entorno virtual que permita aislar las librerías y evitar conflictos de versiones con el entorno de desarrollo base del computador.

pip install leila

De manera alterna también puede utilizar el gestor de paquetes conda.

conda install -c ucd-dnp leila

Control de cambios

Para ver todos los cambios en las versiones de LEILA ver el archivo changelog

Contribuciones a LEILA

Todas las contribuciones, reportes de errores, corrección de errores, las mejoras de la documentación y las ideas son bienvenidas.

Puede encontrar una descripción detallada de cómo contribuir en la Wiki de LEILA

También lo invitamos a revisar el :calendar: Tablero TODO de LEILA, donde hay una serie de temas listados en los que el equipo UCD se encuentra trabajando.

Licencia MIT license

MIT License

La librería LEILA - Calidad de datos se encuentra publicada bajo la licencia MIT
Copyleft (c) 2020 - 2021 Departamento Nacional de Planeación - DNP Colombia

Para mayor información puede consultar el archivo de Licencia

Contacto

Para comunicarse con la Unidad de Científicos de Datos (UCD) de la Dirección de Desarrollo Digital (DDD) del DNP, lo puede hacer mediante el correo electrónico ucd@dnp.gov.co

Project details


Download files

Download the file for your platform. If you're not sure which to choose, learn more about installing packages.

Source Distribution

leila-0.2.tar.gz (33.2 kB view details)

Uploaded Source

Built Distribution

leila-0.2-py3-none-any.whl (32.5 kB view details)

Uploaded Python 3

File details

Details for the file leila-0.2.tar.gz.

File metadata

  • Download URL: leila-0.2.tar.gz
  • Upload date:
  • Size: 33.2 kB
  • Tags: Source
  • Uploaded using Trusted Publishing? No
  • Uploaded via: twine/3.7.1 importlib_metadata/4.8.2 pkginfo/1.8.1 requests/2.26.0 requests-toolbelt/0.9.1 tqdm/4.62.3 CPython/3.10.0

File hashes

Hashes for leila-0.2.tar.gz
Algorithm Hash digest
SHA256 6bdaabb964b0aee190a8e30b0f093e178797096df0ce8c34d8c7cb89033dfee2
MD5 ffbd79586c14cb3e57db9eb91f9fd01b
BLAKE2b-256 40e855be97775d2595562727743e327d9e0f3236f72ff7e92e9d6e07133d7ece

See more details on using hashes here.

File details

Details for the file leila-0.2-py3-none-any.whl.

File metadata

  • Download URL: leila-0.2-py3-none-any.whl
  • Upload date:
  • Size: 32.5 kB
  • Tags: Python 3
  • Uploaded using Trusted Publishing? No
  • Uploaded via: twine/3.7.1 importlib_metadata/4.8.2 pkginfo/1.8.1 requests/2.26.0 requests-toolbelt/0.9.1 tqdm/4.62.3 CPython/3.10.0

File hashes

Hashes for leila-0.2-py3-none-any.whl
Algorithm Hash digest
SHA256 4cf1c20ec4cda9f692db6e7d17dae44ad011231c83b6a71539b8c598bea827a9
MD5 1df674c89e0b8e934fb379a4645fbb87
BLAKE2b-256 e4a990c94b4875bc0bfc92f0844cdc7f40560093c65a6d7763f3c9fb5a051b3b

See more details on using hashes here.

Supported by

AWS AWS Cloud computing and Security Sponsor Datadog Datadog Monitoring Fastly Fastly CDN Google Google Download Analytics Microsoft Microsoft PSF Sponsor Pingdom Pingdom Monitoring Sentry Sentry Error logging StatusPage StatusPage Status page