Skip to main content

Standalone backend processing toolkit for 1CijferHO

Project description

Braille fonts

1CijferHO Tool

Maak 1cijferHO-data direct bruikbaar voor analyse en onderzoek

Windows macOS Linux GitHub Last Commit Contributors GitHub License Documentatie

Wat is het?

De 1CijferHO Tool automatiseert het verwerken van 1cijferHO-data, zoals:

  • ASCII-bestanden zonder duidelijke scheiding tussen velden.
  • Metadata-bestanden in ongestructureerde .txt-indeling.

Met deze tool kun je in enkele minuten grote hoeveelheden data verwerken, zonder risico op fouten of verlies van gegevens.

ℹ️ Benieuwd wat er op de planning staat? Bekijk de roadmap.

📑 Congrespresentatie(s)

Tijdens de DAIR-conferentie in 2025 hebben we de 1CijferHO Tool gepresenteerd. Bekijk de slides van de presentatie hieronder:

📂 Presentatie DAIR 2025

Waarom is dit belangrijk?

1cijferHO-data is essentieel voor beleidsvorming en onderzoek, maar het handmatig verwerken ervan kost veel tijd en brengt risico’s met zich mee. De 1CijferHO Tool biedt een oplossing die:

  • Tijd bespaart: Verwerk gigabytes aan data in enkele minuten.
  • Betrouwbaar is: Voorkomt fouten door automatische validatie.
  • Veilig werkt: Anonimiseert gevoelige gegevens, zoals BSN’s.
  • Gebruiksklaar: Levert schone CSV- of Parquet-bestanden voor directe analyse.

Hoe werkt het?

  1. Start de tool met één eenvoudige opdracht.
  2. Upload je bestanden (data en metadata).
  3. Bekijk de resultaten: Je krijgt direct schone, geoptimaliseerde bestanden.

Aan de slag

Stap 1: Vereisten

Zorg dat uv is geïnstalleerd.

Stap 2: Download de tool

git clone https://github.com/cedanl/1cijferho.git
cd 1cijferho

Of download het ZIP-bestand en pak het uit.

Stap 3: Installeer dependencies

uv sync --extra frontend

Stap 4: Start de applicatie

uv run streamlit run src/main.py

De applicatie opent automatisch in je browser.

Installeren als pakket

Gebruik je eencijferho als backend-bibliotheek in een bestaande Python-omgeving? Dan heb je de Streamlit-app niet nodig en kun je het pakket direct installeren:

# pip
pip install eencijferho

# poetry
poetry add eencijferho

Voor gebruik via de CLI na installatie:

# Volledige pipeline in één stap: van ruwe DUO-bestanden naar analyse-klare CSV/Parquet
eencijferho pipeline --input data/01-input --output data/02-output

# Of stap voor stap:

# Stap 1: Lees de .txt metadata-bestanden uit en sla ze op als JSON en Excel
eencijferho extract          --input data/01-input --output data/02-output

# Stap 2: Controleer of de metadata compleet is en of elk bestand een bijpassend metadata-bestand heeft
eencijferho validate         --input data/01-input --output data/02-output

# Stap 3: Converteer de fixed-width bestanden naar CSV/Parquet op basis van de gevalideerde metadata
eencijferho convert          --input data/01-input --output data/02-output

# Stap 3b: Decodeer outputbestanden met Dec_* opzoektabellen (draai na convert)
eencijferho decode           --input data/01-input --output data/02-output

# Stap 3c: Verrijk gedecodeerde bestanden met variable_metadata labels (draai na decode)
eencijferho enrich           --input data/01-input --output data/02-output

# Stap 4 (optioneel): Valideer de geconverteerde outputbestanden op kolomwaarden en DEC-codes
eencijferho validate-output  --input data/01-input --output data/02-output

🎬 Demo Video

Bekijk hieronder een korte demonstratie van hoe de 1CijferHO Tool werkt:

Demo

🫂 Bijdragers

Dank aan alle mensen die hebben bijgedragen aan de ontwikkeling van de 1CijferHO Tool:

Project details


Download files

Download the file for your platform. If you're not sure which to choose, learn more about installing packages.

Source Distribution

eencijferho-0.1.4.tar.gz (60.6 kB view details)

Uploaded Source

Built Distribution

If you're not sure about the file name format, learn more about wheel file names.

eencijferho-0.1.4-py3-none-any.whl (70.4 kB view details)

Uploaded Python 3

File details

Details for the file eencijferho-0.1.4.tar.gz.

File metadata

  • Download URL: eencijferho-0.1.4.tar.gz
  • Upload date:
  • Size: 60.6 kB
  • Tags: Source
  • Uploaded using Trusted Publishing? Yes
  • Uploaded via: twine/6.1.0 CPython/3.13.12

File hashes

Hashes for eencijferho-0.1.4.tar.gz
Algorithm Hash digest
SHA256 d830e9afa62fe132df92a1888b96cbd969061390018a7f56a54683d28e156df9
MD5 747d3a76541507a2aea792952a70c958
BLAKE2b-256 9b580723a11adc371fa1bf3c06904a2358ff1564eb263291021cb548060e75e3

See more details on using hashes here.

Provenance

The following attestation bundles were made for eencijferho-0.1.4.tar.gz:

Publisher: pypi-publish.yml on cedanl/1cijferho

Attestations: Values shown here reflect the state when the release was signed and may no longer be current.

File details

Details for the file eencijferho-0.1.4-py3-none-any.whl.

File metadata

  • Download URL: eencijferho-0.1.4-py3-none-any.whl
  • Upload date:
  • Size: 70.4 kB
  • Tags: Python 3
  • Uploaded using Trusted Publishing? Yes
  • Uploaded via: twine/6.1.0 CPython/3.13.12

File hashes

Hashes for eencijferho-0.1.4-py3-none-any.whl
Algorithm Hash digest
SHA256 78b8d0d0d8f31f5651cf51e01d4bafca4ed6b3cc1c8916988a61dc66638be0e1
MD5 ec89c2006ba40f82cfc2732e05acfdaf
BLAKE2b-256 cc7ad63be152c09d74fb1ea03398123e70cb28fd2e201e3cfa2d77603b3703c8

See more details on using hashes here.

Provenance

The following attestation bundles were made for eencijferho-0.1.4-py3-none-any.whl:

Publisher: pypi-publish.yml on cedanl/1cijferho

Attestations: Values shown here reflect the state when the release was signed and may no longer be current.

Supported by

AWS Cloud computing and Security Sponsor Datadog Monitoring Depot Continuous Integration Fastly CDN Google Download Analytics Pingdom Monitoring Sentry Error logging StatusPage Status page