Cliente Python para el censo argentino 2022 (INDEC)
Project description
censoargentino
Cliente Python para consultar el Censo Nacional de Población, Hogares y Viviendas 2022 de Argentina (INDEC).
Usa DuckDB para hacer consultas directas sobre archivos Parquet remotos, descargando solo los datos que necesitás sin bajar el dataset completo (~137 MB).
Instalación
pip install censoargentino
# Con soporte de mapas (geopandas)
pip install "censoargentino[geo]"
Uso rápido
import censoargentino as censo
# Tabla resumida con N y % — una sola línea
censo.tabla("PERSONA_P02")
# categoria N %
# Mujer / Femenino 23607906 51.8
# Varón / Masculino 22010881 48.2
# Filtrado por provincia
censo.tabla("HOGAR_NBI_TOT", provincia="Chaco")
# Comparación entre provincias
censo.comparar("HOGAR_NBI_TOT")
# Con NBI Sin NBI Total
# Formosa 26.0 74.0 173500
# Chaco 24.9 75.1 393500
# ...
# Datos crudos (formato largo por radio censal)
df = censo.query(variables="PERSONA_P02", provincia="Córdoba")
# Con polígonos de radios censales
gdf = censo.query(variables="PERSONA_EDADGRU", provincia="Mendoza", geometry=True)
¿De dónde vienen los datos?
Los datos corresponden a la 1ª entrega definitiva del CPV 2022 (publicada por INDEC en diciembre de 2024).
Pipeline de procesamiento:
INDEC (base REDATAM .rxdb)
↓
redatamx (R) → extracción de variables
↓
formato largo Parquet → censo-2022-largo.parquet
metadatos Parquet → censo-2022-metadatos.parquet
radios censales → radios-2022.parquet (fuente: CONICET)
↓
Hugging Face Datasets → pedroorden/censoargentino
↓
censoargentino (este paquete) → consultas eficientes vía DuckDB
| Archivo | Tamaño | Contenido |
|---|---|---|
censo-2022-largo.parquet |
137 MB | Variables × radios censales × conteos |
radios-2022.parquet |
58 MB | Polígonos geográficos (WKB, EPSG:4326) |
censo-2022-metadatos.parquet |
1 MB | Catálogo de variables y categorías |
Cobertura: Vivienda · Hogar · Persona — desagregación hasta radio censal.
La 2ª entrega (localidades y aglomerados) está prometida por INDEC sin fecha confirmada.
Estructura del resultado
query() devuelve formato largo pre-agregado: cada fila es una combinación de (radio censal × categoría × conteo).
id_geo | codigo_variable | valor_categoria | etiqueta_categoria | conteo | etiqueta_provincia | ...
460070101 | PERSONA_P02 | 1 | Mujer / Femenino | 252 | La Rioja | ...
460070101 | PERSONA_P02 | 2 | Varón / Masculino | 231 | La Rioja | ...
tabla() y comparar() hacen la agregación por vos.
Referencia de la API
Descubrimiento
| Función | Descripción |
|---|---|
censo.variables() |
Lista todas las variables del censo |
censo.variables(entidad="PERSONA") |
Filtra por entidad (PERSONA, HOGAR, VIVIENDA) |
censo.variables(buscar="texto") |
Busca por palabra clave en código o descripción |
censo.describe("VARIABLE") |
Muestra qué mide una variable y sus categorías |
censo.provincias() |
Tabla de provincias con códigos INDEC |
Análisis
| Función | Descripción |
|---|---|
censo.tabla(variable, provincia, departamento) |
Tabla con N y % en un paso |
censo.comparar(variable, nivel, provincia) |
Pivot geográfico (provincia o departamento) |
censo.agregar(df, por) |
Agrega un DataFrame de query() con N y % |
Datos crudos
| Función | Descripción |
|---|---|
censo.query(variables, provincia, departamento, geometry) |
Datos en formato largo por radio censal |
Variables principales
| Variable | Descripción |
|---|---|
PERSONA_P02 |
Sexo registrado al nacer |
PERSONA_EDAD |
Edad exacta |
PERSONA_EDADQUI |
Edad en grupos quinquenales |
PERSONA_EDADGRU |
Edad en grandes grupos (0-14, 15-64, 65+) |
PERSONA_MNI |
Máximo nivel de instrucción |
PERSONA_CONDACT |
Condición de actividad económica |
HOGAR_NBI_TOT |
Necesidades Básicas Insatisfechas |
HOGAR_NBI_VIV / ESC / SAN / HAC / SUB |
Componentes del NBI |
HOGAR_IPMH |
Índice de Privación Material del Hogar |
HOGAR_H24A/B/C |
Acceso a internet, celular, computadora |
VIVIENDA_TIPOVIVG |
Tipo de vivienda |
VIVIENDA_URP |
Área urbano/rural |
DPTO_NDPTO |
Nombres de departamentos |
Explorá el catálogo completo con censo.variables().
Ejemplos de análisis
import censoargentino as censo
# NBI por provincia — tabla comparativa
censo.comparar("HOGAR_NBI_TOT")
# Nivel educativo en departamentos de Tucumán
censo.comparar("PERSONA_MNI", nivel="departamento", provincia="Tucumán")
# Distribución de sexo en CABA
censo.tabla("PERSONA_P02", provincia="02")
# Datos crudos + agregación manual
df = censo.query(variables="PERSONA_MNI", provincia="Santa Fe")
censo.agregar(df, por="departamento")
# Mapa de NBI en Buenos Aires
gdf = censo.query(variables="HOGAR_NBI_TOT", provincia="Buenos Aires", geometry=True)
gdf.plot(column="conteo", cmap="YlOrRd")
Fuentes y documentación
Project details
Release history Release notifications | RSS feed
Download files
Download the file for your platform. If you're not sure which to choose, learn more about installing packages.
Source Distribution
Built Distribution
Filter files by name, interpreter, ABI, and platform.
If you're not sure about the file name format, learn more about wheel file names.
Copy a direct link to the current filters
File details
Details for the file censoargentino-0.1.3.tar.gz.
File metadata
- Download URL: censoargentino-0.1.3.tar.gz
- Upload date:
- Size: 14.2 kB
- Tags: Source
- Uploaded using Trusted Publishing? No
- Uploaded via: twine/6.2.0 CPython/3.12.10
File hashes
| Algorithm | Hash digest | |
|---|---|---|
| SHA256 |
cf6c0cec1adac294c471edad608fd659abc65201a66abd5df963cdef9831a944
|
|
| MD5 |
834bc9f37d56af5054e6c724652b3527
|
|
| BLAKE2b-256 |
1d1542ae22ad65eb6ef5ad758bf82a60b1da7cead79122cdb0cbb331e9a8e03e
|
File details
Details for the file censoargentino-0.1.3-py3-none-any.whl.
File metadata
- Download URL: censoargentino-0.1.3-py3-none-any.whl
- Upload date:
- Size: 13.9 kB
- Tags: Python 3
- Uploaded using Trusted Publishing? No
- Uploaded via: twine/6.2.0 CPython/3.12.10
File hashes
| Algorithm | Hash digest | |
|---|---|---|
| SHA256 |
2008f0d1726e1d3ae44bb6deca6fa1d2e0175595ae28d39864d6addcc817b089
|
|
| MD5 |
27f5450ae76ace25ee8861774de934e6
|
|
| BLAKE2b-256 |
e48f11e7af57511dfc4732a67cf5d951ee500de9c11873a0245913ff25b37a01
|