Skip to main content

Standalone backend processing toolkit for 1CijferHO

Project description

Braille fonts

1CijferHO Tool

Maak 1cijferHO-data direct bruikbaar voor analyse en onderzoek

Windows macOS Linux GitHub Last Commit Contributors GitHub License Documentatie

Wat is het?

De 1CijferHO Tool automatiseert het verwerken van 1cijferHO-data, zoals:

  • ASCII-bestanden zonder duidelijke scheiding tussen velden.
  • Metadata-bestanden in ongestructureerde .txt-indeling.

Met deze tool kun je in enkele minuten grote hoeveelheden data verwerken, zonder risico op fouten of verlies van gegevens.

ℹ️ Benieuwd wat er op de planning staat? Bekijk de roadmap.

📑 Congrespresentatie(s)

Tijdens de DAIR-conferentie in 2025 hebben we de 1CijferHO Tool gepresenteerd. Bekijk de slides van de presentatie hieronder:

📂 Presentatie DAIR 2025

Waarom is dit belangrijk?

1cijferHO-data is essentieel voor beleidsvorming en onderzoek, maar het handmatig verwerken ervan kost veel tijd en brengt risico’s met zich mee. De 1CijferHO Tool biedt een oplossing die:

  • Tijd bespaart: Verwerk gigabytes aan data in enkele minuten.
  • Betrouwbaar is: Voorkomt fouten door automatische validatie.
  • Veilig werkt: Anonimiseert gevoelige gegevens, zoals BSN’s.
  • Gebruiksklaar: Levert schone CSV- of Parquet-bestanden voor directe analyse.

Hoe werkt het?

  1. Start de tool met één eenvoudige opdracht.
  2. Upload je bestanden (data en metadata).
  3. Bekijk de resultaten: Je krijgt direct schone, geoptimaliseerde bestanden.

Aan de slag

Stap 1: Vereisten

Zorg dat uv is geïnstalleerd.

Stap 2: Download de tool

git clone https://github.com/cedanl/1cijferho.git
cd 1cijferho

Of download het ZIP-bestand en pak het uit.

Stap 3: Installeer dependencies

uv sync --extra frontend

Stap 4: Start de applicatie

uv run streamlit run src/main.py

De applicatie opent automatisch in je browser.

Installeren als pakket

Gebruik je eencijferho als backend-bibliotheek in een bestaande Python-omgeving? Dan heb je de Streamlit-app niet nodig en kun je het pakket direct installeren:

# pip
pip install eencijferho

# poetry
poetry add eencijferho

Voor gebruik via de CLI na installatie:

# Volledige pipeline in één stap: van ruwe DUO-bestanden naar analyse-klare CSV/Parquet
eencijferho pipeline --input data/01-input --output data/02-output

# Of stap voor stap:

# Stap 1: Lees de .txt metadata-bestanden uit en sla ze op als JSON en Excel
eencijferho extract          --input data/01-input --output data/02-output

# Stap 2: Controleer of de metadata compleet is en of elk bestand een bijpassend metadata-bestand heeft
eencijferho validate         --input data/01-input --output data/02-output

# Stap 3: Converteer de fixed-width bestanden naar CSV/Parquet op basis van de gevalideerde metadata
eencijferho convert          --input data/01-input --output data/02-output

# Stap 3b: Decodeer outputbestanden met Dec_* opzoektabellen (draai na convert)
eencijferho decode           --input data/01-input --output data/02-output

# Stap 3c: Verrijk gedecodeerde bestanden met variable_metadata labels (draai na decode)
eencijferho enrich           --input data/01-input --output data/02-output

# Stap 4 (optioneel): Valideer de geconverteerde outputbestanden op kolomwaarden en DEC-codes
eencijferho validate-output  --input data/01-input --output data/02-output

🎬 Demo Video

Bekijk hieronder een korte demonstratie van hoe de 1CijferHO Tool werkt:

Demo

🫂 Bijdragers

Dank aan alle mensen die hebben bijgedragen aan de ontwikkeling van de 1CijferHO Tool:

Project details


Download files

Download the file for your platform. If you're not sure which to choose, learn more about installing packages.

Source Distribution

eencijferho-0.1.5.tar.gz (60.4 kB view details)

Uploaded Source

Built Distribution

If you're not sure about the file name format, learn more about wheel file names.

eencijferho-0.1.5-py3-none-any.whl (70.1 kB view details)

Uploaded Python 3

File details

Details for the file eencijferho-0.1.5.tar.gz.

File metadata

  • Download URL: eencijferho-0.1.5.tar.gz
  • Upload date:
  • Size: 60.4 kB
  • Tags: Source
  • Uploaded using Trusted Publishing? Yes
  • Uploaded via: twine/6.1.0 CPython/3.13.12

File hashes

Hashes for eencijferho-0.1.5.tar.gz
Algorithm Hash digest
SHA256 3c7699bb83675f885f013327ce7ed8b3b5e3d444487677567c0c693f39adf3bd
MD5 9853a3cadbc67a84fdf9d121e6e6cbf2
BLAKE2b-256 d4dfe90358bb26ad1468ec61610ba4c69811796efaa82ac92fa7eab329639001

See more details on using hashes here.

Provenance

The following attestation bundles were made for eencijferho-0.1.5.tar.gz:

Publisher: pypi-publish.yml on cedanl/1cijferho

Attestations: Values shown here reflect the state when the release was signed and may no longer be current.

File details

Details for the file eencijferho-0.1.5-py3-none-any.whl.

File metadata

  • Download URL: eencijferho-0.1.5-py3-none-any.whl
  • Upload date:
  • Size: 70.1 kB
  • Tags: Python 3
  • Uploaded using Trusted Publishing? Yes
  • Uploaded via: twine/6.1.0 CPython/3.13.12

File hashes

Hashes for eencijferho-0.1.5-py3-none-any.whl
Algorithm Hash digest
SHA256 98339916ce072ad5be47357320dca1a028a71a5a52d2a667c7c3c327d3d3ed23
MD5 88f7ce556edf517fb59d1bcbeffb0fc2
BLAKE2b-256 fe60bb39ce08313b23175f01aecf2778a17a9466153bf27e1c54abb8cb8b6ce3

See more details on using hashes here.

Provenance

The following attestation bundles were made for eencijferho-0.1.5-py3-none-any.whl:

Publisher: pypi-publish.yml on cedanl/1cijferho

Attestations: Values shown here reflect the state when the release was signed and may no longer be current.

Supported by

AWS Cloud computing and Security Sponsor Datadog Monitoring Depot Continuous Integration Fastly CDN Google Download Analytics Pingdom Monitoring Sentry Error logging StatusPage Status page