Skip to main content

Cliente Python para el censo argentino 2022 (INDEC)

Project description

censoargentino

PyPI version Python License: MIT

Cliente Python para consultar el Censo Nacional de Población, Hogares y Viviendas 2022 de Argentina (INDEC).

Usa DuckDB para hacer consultas directas sobre archivos Parquet remotos, descargando solo los datos que necesitás sin bajar el dataset completo (~137 MB).


Instalación

pip install censoargentino

Instalación con soporte MCP

Para usar el paquete como servidor MCP (compatible con Claude Desktop, Cursor, Cline y otros):

pip install "censoargentino[mcp]"

Configuración en cualquier cliente MCP:

{
  "mcpServers": {
    "censoargentino": {
      "command": "python",
      "args": ["-m", "censoargentino.mcp_server"]
    }
  }
}

Ver MCP.md para documentación completa del servidor.


Uso rápido

import censoargentino as censo

# Tabla resumida con N y % — una sola línea
censo.tabla("PERSONA_P02")
#           categoria         N     %
# Mujer / Femenino     23607906  51.8
# Varón / Masculino    22010881  48.2

# Filtrado por provincia
censo.tabla("HOGAR_NBI_TOT", provincia="Chaco")

# Filtrado por departamento — por nombre o código INDEC
censo.tabla("HOGAR_NBI_TOT", provincia="Buenos Aires", departamento="Lanús")
censo.tabla("HOGAR_NBI_TOT", provincia="Buenos Aires", departamento="490")  # equivalente

# Comparación entre provincias
censo.comparar("HOGAR_NBI_TOT")
#               Con NBI  Sin NBI    Total
# Formosa          26.0     74.0   173500
# Chaco            24.9     75.1   393500
# ...

# Datos crudos (formato largo por radio censal)
df = censo.query(variables="PERSONA_P02", provincia="Córdoba")

¿De dónde vienen los datos?

Los datos corresponden a la 1ª entrega definitiva del CPV 2022 (publicada por INDEC en diciembre de 2024).

Pipeline de procesamiento:

INDEC (base REDATAM .rxdb)
        ↓
  redatamx (R)  →  extracción de variables
        ↓
  formato largo Parquet  →  censo-2022-largo.parquet
  metadatos Parquet      →  censo-2022-metadatos.parquet
  radios censales        →  radios-2022.parquet  (fuente: CONICET)
        ↓
  Hugging Face Datasets  →  pedroorden/censoargentino
        ↓
  censoargentino (este paquete)  →  consultas eficientes vía DuckDB
Archivo Tamaño Contenido
censo-2022-largo.parquet 137 MB Variables × radios censales × conteos
censo-2022-metadatos.parquet 1 MB Catálogo de variables y categorías

Cobertura: Vivienda · Hogar · Persona — desagregación hasta radio censal.

La 2ª entrega (localidades y aglomerados) está prometida por INDEC sin fecha confirmada.


Estructura del resultado

query() devuelve formato largo pre-agregado: cada fila es una combinación de (radio censal × categoría × conteo).

id_geo     | codigo_variable | valor_categoria | etiqueta_categoria   | conteo | etiqueta_provincia | ...
460070101  | PERSONA_P02     | 1               | Mujer / Femenino     |    252 | La Rioja           | ...
460070101  | PERSONA_P02     | 2               | Varón / Masculino    |    231 | La Rioja           | ...

tabla() y comparar() hacen la agregación por vos.


Referencia de la API

Descubrimiento

Función Descripción
censo.variables() Lista todas las variables del censo
censo.variables(entidad="PERSONA") Filtra por entidad (PERSONA, HOGAR, VIVIENDA)
censo.variables(buscar="texto") Busca por palabra clave en código o descripción
censo.describe("VARIABLE") Muestra qué mide una variable y sus categorías
censo.provincias() Tabla de provincias con códigos INDEC
censo.departamentos("provincia") Tabla de departamentos de una provincia con códigos INDEC

Análisis

Función Descripción
censo.tabla(variable, provincia, departamento) Tabla con N y % en un paso. departamento acepta nombre o código INDEC
censo.comparar(variable, nivel, provincia) Pivot geográfico (provincia o departamento)
censo.agregar(df, por) Agrega un DataFrame de query() con N y %

Datos crudos

Función Descripción
censo.query(variables, provincia, departamento) Datos en formato largo por radio censal. departamento acepta nombre o código INDEC

Configuración

Variable de entorno Descripción
CENSO_VERBOSE=0 Silencia los mensajes de progreso (útil en pipelines y scripts)

Variables principales

Variable Descripción
PERSONA_P02 Sexo registrado al nacer
PERSONA_EDAD Edad exacta
PERSONA_EDADQUI Edad en grupos quinquenales
PERSONA_EDADGRU Edad en grandes grupos (0-14, 15-64, 65+)
PERSONA_MNI Máximo nivel de instrucción
PERSONA_CONDACT Condición de actividad económica
HOGAR_NBI_TOT Necesidades Básicas Insatisfechas
HOGAR_NBI_VIV / ESC / SAN / HAC / SUB Componentes del NBI
HOGAR_IPMH Índice de Privación Material del Hogar
HOGAR_H24A/B/C Acceso a internet, celular, computadora
VIVIENDA_TIPOVIVG Tipo de vivienda
VIVIENDA_URP Área urbano/rural
DPTO_NDPTO Nombres de departamentos

Explorá el catálogo completo con censo.variables().


Ejemplos de análisis

import censoargentino as censo

# NBI por provincia — tabla comparativa
censo.comparar("HOGAR_NBI_TOT")

# Nivel educativo en departamentos de Tucumán
censo.comparar("PERSONA_MNI", nivel="departamento", provincia="Tucumán")

# Distribución de sexo en CABA
censo.tabla("PERSONA_P02", provincia="02")

# Departamento por nombre
censo.tabla("VIVIENDA_TIPOVIVG", provincia="Buenos Aires", departamento="Lanús")

# Datos crudos + agregación manual
df = censo.query(variables="PERSONA_MNI", provincia="Santa Fe")
censo.agregar(df, por="departamento")

Créditos

La extracción de los datos desde la base REDATAM del INDEC fue realizada con R por Nissim Lebovits en el proyecto ciut-redatam, usando redatamx. censoargentino construye sobre esa base para ofrecer acceso desde Python.


Fuentes y documentación

Project details


Download files

Download the file for your platform. If you're not sure which to choose, learn more about installing packages.

Source Distribution

censoargentino-0.1.9.tar.gz (18.2 kB view details)

Uploaded Source

Built Distribution

If you're not sure about the file name format, learn more about wheel file names.

censoargentino-0.1.9-py3-none-any.whl (18.8 kB view details)

Uploaded Python 3

File details

Details for the file censoargentino-0.1.9.tar.gz.

File metadata

  • Download URL: censoargentino-0.1.9.tar.gz
  • Upload date:
  • Size: 18.2 kB
  • Tags: Source
  • Uploaded using Trusted Publishing? No
  • Uploaded via: twine/6.2.0 CPython/3.12.10

File hashes

Hashes for censoargentino-0.1.9.tar.gz
Algorithm Hash digest
SHA256 75e20620797955d33f18e4c6049c174fea529bfe0428f6430a64b795e1476319
MD5 0d865e77740c08f72da52ca984838df1
BLAKE2b-256 24475a2aeb8c0da4b2eac2ff134cb292ced54e479c8098fca7a40e5416fcf44f

See more details on using hashes here.

File details

Details for the file censoargentino-0.1.9-py3-none-any.whl.

File metadata

  • Download URL: censoargentino-0.1.9-py3-none-any.whl
  • Upload date:
  • Size: 18.8 kB
  • Tags: Python 3
  • Uploaded using Trusted Publishing? No
  • Uploaded via: twine/6.2.0 CPython/3.12.10

File hashes

Hashes for censoargentino-0.1.9-py3-none-any.whl
Algorithm Hash digest
SHA256 74f1a1505e13955fe09c90cabf7822a4188e28ae107f8500aa08795c6de0e88f
MD5 b515cde396a3e59fb77ca4ab6361a307
BLAKE2b-256 a8d29c44509f2499bf00548d6615ec18ba52d838103af3502fdb62b6273bc5e6

See more details on using hashes here.

Supported by

AWS Cloud computing and Security Sponsor Datadog Monitoring Depot Continuous Integration Fastly CDN Google Download Analytics Pingdom Monitoring Sentry Error logging StatusPage Status page