Skip to main content

Genera consultas REDATAM en python.

Project description

Coverage Status Build Status PyPI Buy me a coffee

Genera consultas REDATAM en python.

Instalación

Desde pypi (lo más sencillo):

pip install pyredatam

Clonando el repositorio e instalando en developer mode:

virtualenv pyredatam  # Create new environment
source pyredatam/bin/activate  # Activate the environment
cd path_to_pyredatam_repository
pip install -e .  # Install in developer mode
pip install -r requirements.txt  # Install dependencies

Uso

import pyredatam

# para generar una consulta de lista por áreas
query = pyredatam.arealist_query("FRAC", "PERSONA.CONDACT",
                                 {"PROV": ["02", "03"]})
print query
"""
RUNDEF Job
        SELECTION INLINE,
         PROV 02, 03
    <BLANKLINE>
    TABLE TABLE1
        AS AREALIST
        OF FRAC, PERSONA.CONDACT
"""

# para hacer la consulta a la base REDATAM del Censo 2010 de Argentina
df = pyredatam.cpv2010arg.make_arealist_query(query)
# devuelve un pandas.DataFrame con el resultado

# para hacer otras consultas REDATAM que no sean de tipo lista por áreas
html = pyredatam.cpv2010arg.make_query(query)
# devuelve un html con el resultado, que debe ser parseado

# para construir el diccionario de entidades, variables y categorías
dicc, entidades_geo, entidades_data = pyredatam.cpv2010arg.scrape_dictionary()

Generar consultas REDATAM

Esta es una lista de los tipos de consultas que el sistema REDATAM permite, la idea es ir implementando todas ellas en este paquete. Si necesitás usar alguna que aún no ha sido implementada, bienvenidas todas las contribuciones!

  • Estadísticas (Falta implementar)

  • Frecuencias (Falta implementar)

  • Cruce de Variables (Falta implementar)

  • Promedio (Falta implementar)

  • Mediana (Falta implementar)

  • Conteo (Falta implementar)

  • Lista por Áreas (SOPORTADO!)

    • Una o más variables (variables cuyos datos se quiere obtener)

    • Nivel de Salida (nivel de agregación geográfico al cual se piden los datos)

    • Incluir Nombres del Área de Salida (incluir nombres además de los códigos de las áreas de salida - Falta implementar)

    • Título (título que tendrá la tabla con los resultados solicitados)

    • Selección de Área (restringir los resultados a un área geográfica en particular)

    • Filtro Universal (expresión de filtro en lenguaje REDATAM)

    • Peso (uso de ponderadores - Falta implementar)

Obtener resultados de consultas REDATAM

El paquete incluirá un módulo por base de datos REDATAM que permita hacer las consultas generadas a la base correspondiente al que se acceda como pyredatam.modulo_redatam_db. Por ahora sólo se provee un módulo con métodos para consultar y parsear el resultado de la base de datos REDATAM del Censo 2010 de Argentina (pyredatam.cpv2010arg). Todos los módulos que se agreguen deberían proveer, al menos, los siguientes métodos públicos:

  • make_query(query) - Devuelve un html (u otra cosa, si no es posible) con el resultado de la query realizada a la base de datos.

  • make_arealist_query(query) - Métodos específicos para cada tipo de consulta, que usen make_query() y luego parseen el resultado html (o del formato que sea) a un DataFrame de pandas.

Adicionalmente el módulo podría contener otros métodos útiles para utilizar eficazmente los resultados de consultas a la base REDATAM en cuestión. Como ejemplo, el módulo pyredatam.cpv2010arg incluye los siguientes:

  • scrape_dictionary() - Un método que devuelve un diccionario jerárquico ordenado (collections.OrderedDict) de entidades, sus variables y las categorías de las variables; una lista de las entidades que se utilizan para agregar geográficamente la información, y una lista de las entidades que contienen variables con data (no usadas para agregar la base de datos geográficamente, sino con la data que es realmente el objetivo de la encuesta o censo).

  • get_dictionary() - Un método que devuelve el mismo diccionario (sin las listas de entidades geográficas y no geográficas) pero, en lugar de scrapearlo, lo toma de un .json de la carpeta pyredatam/data.

  • get_ids() - Un método que devuelve un diccionario con los ids de dos entidades geográficas (“PROV” y “DPTO”) y su descripción, tomado también de un .json de la carpeta pyredatam/data.

Project details


Download files

Download the file for your platform. If you're not sure which to choose, learn more about installing packages.

Source Distribution

pyredatam-0.0.12.tar.gz (9.0 kB view details)

Uploaded Source

Built Distribution

pyredatam-0.0.12-py2.7.egg (13.7 kB view details)

Uploaded Source

File details

Details for the file pyredatam-0.0.12.tar.gz.

File metadata

  • Download URL: pyredatam-0.0.12.tar.gz
  • Upload date:
  • Size: 9.0 kB
  • Tags: Source
  • Uploaded using Trusted Publishing? No

File hashes

Hashes for pyredatam-0.0.12.tar.gz
Algorithm Hash digest
SHA256 137311c159d58f7aefeaa7e5204cbb59184142340bffefc2e6f3683d8281d952
MD5 e435fa2507a4df063437d452f0ec806d
BLAKE2b-256 06aa2cbd2ca3822a47ec7a119c4b66332d5f3fbecb53513611f9021c65b48f09

See more details on using hashes here.

File details

Details for the file pyredatam-0.0.12-py2.7.egg.

File metadata

File hashes

Hashes for pyredatam-0.0.12-py2.7.egg
Algorithm Hash digest
SHA256 204b7d5324d04bda010c269baba1d291339a21149a5538bed3c163f1e0ba81c5
MD5 22c6488eb5e333f3a7934bf0c726a237
BLAKE2b-256 ba7177595a3ceda96a827449628db69c7197e9dbc6e40657aac4c007c1bf7d24

See more details on using hashes here.

Supported by

AWS AWS Cloud computing and Security Sponsor Datadog Datadog Monitoring Fastly Fastly CDN Google Google Download Analytics Microsoft Microsoft PSF Sponsor Pingdom Pingdom Monitoring Sentry Sentry Error logging StatusPage StatusPage Status page