Skip to main content

Standalone backend processing toolkit for 1CijferHO

Project description

Braille fonts

1CijferHO Tool

Maak 1cijferHO-data direct bruikbaar voor analyse en onderzoek

Windows macOS Linux GitHub Last Commit Contributors GitHub License

Wat is het?

De 1CijferHO Tool automatiseert het verwerken van 1cijferHO-data, zoals:

  • ASCII-bestanden zonder duidelijke scheiding tussen velden.
  • Metadata-bestanden in ongestructureerde .txt-indeling.

Met deze tool kun je in enkele minuten grote hoeveelheden data verwerken, zonder risico op fouten of verlies van gegevens.

ℹ️ Benieuwd wat er op de planning staat? Bekijk de roadmap.

📑 Congrespresentatie(s)

Tijdens de DAIR-conferentie in 2025 hebben we de 1CijferHO Tool gepresenteerd. Bekijk de slides van de presentatie hieronder:

📂 Presentatie DAIR 2025

Waarom is dit belangrijk?

1cijferHO-data is essentieel voor beleidsvorming en onderzoek, maar het handmatig verwerken ervan kost veel tijd en brengt risico’s met zich mee. De 1CijferHO Tool biedt een oplossing die:

  • Tijd bespaart: Verwerk gigabytes aan data in enkele minuten.
  • Betrouwbaar is: Voorkomt fouten door automatische validatie.
  • Veilig werkt: Anonimiseert gevoelige gegevens, zoals BSN’s.
  • Gebruiksklaar: Levert schone CSV- of Parquet-bestanden voor directe analyse.

Hoe werkt het?

  1. Start de tool met één eenvoudige opdracht.
  2. Upload je bestanden (data en metadata).
  3. Bekijk de resultaten: Je krijgt direct schone, geoptimaliseerde bestanden.

Aan de slag

Stap 1: Download de tool

Je kunt de tool downloaden via GitHub:

Stap 2: Installeer de tool

Voor installatie-instructies, zie de Technische README.

Stap 3: Installeer frontend (Streamlit) benodigdheden

Om de Streamlit-app te kunnen draaien, synchroniseer eerst de frontend dependencies:

uv sync --extra frontend

Stap 4: Start de applicatie

Start daarna de app in je terminal:

uv run streamlit run src/main.py

De applicatie opent automatisch in je browser.

Installeren als pakket

Gebruik je eencijferho als backend-bibliotheek in een bestaande Python-omgeving? Dan heb je de Streamlit-app niet nodig en kun je het pakket direct installeren:

# pip
pip install eencijferho

# poetry
poetry add eencijferho

Voor gebruik via de CLI na installatie:

# Volledige pipeline in één stap: van ruwe DUO-bestanden naar analyse-klare CSV/Parquet
eencijferho pipeline --input data/01-input --output data/02-output

# Of stap voor stap:

# Stap 1: Lees de .txt metadata-bestanden uit en sla ze op als JSON en Excel
eencijferho extract  --input data/01-input --output data/02-output

# Stap 2: Controleer of de metadata compleet is en of elk .asc bestand een bijpassend metadata-bestand heeft
eencijferho validate --input data/01-input --output data/02-output

# Stap 3: Converteer de fixed-width .asc bestanden naar CSV/Parquet op basis van de gevalideerde metadata
eencijferho convert  --input data/01-input --output data/02-output

🎬 Demo Video

Bekijk hieronder een korte demonstratie van hoe de 1CijferHO Tool werkt:

Demo

🫂 Bijdragers

Dank aan alle mensen die hebben bijgedragen aan de ontwikkeling van de 1CijferHO Tool:

Project details


Download files

Download the file for your platform. If you're not sure which to choose, learn more about installing packages.

Source Distribution

eencijferho-0.1.2.tar.gz (48.5 kB view details)

Uploaded Source

Built Distribution

If you're not sure about the file name format, learn more about wheel file names.

eencijferho-0.1.2-py3-none-any.whl (54.3 kB view details)

Uploaded Python 3

File details

Details for the file eencijferho-0.1.2.tar.gz.

File metadata

  • Download URL: eencijferho-0.1.2.tar.gz
  • Upload date:
  • Size: 48.5 kB
  • Tags: Source
  • Uploaded using Trusted Publishing? Yes
  • Uploaded via: twine/6.1.0 CPython/3.13.7

File hashes

Hashes for eencijferho-0.1.2.tar.gz
Algorithm Hash digest
SHA256 c932c2e578c77d29de2581551a83b273b286f2ed790e2df2d062614352a8a8d1
MD5 b9c7c422771a01e3ad232398ced8769c
BLAKE2b-256 90c6fab5ec466874188e684b331cf63e18482c967e6733771a8690da0169c342

See more details on using hashes here.

Provenance

The following attestation bundles were made for eencijferho-0.1.2.tar.gz:

Publisher: pypi-publish.yml on cedanl/1cijferho

Attestations: Values shown here reflect the state when the release was signed and may no longer be current.

File details

Details for the file eencijferho-0.1.2-py3-none-any.whl.

File metadata

  • Download URL: eencijferho-0.1.2-py3-none-any.whl
  • Upload date:
  • Size: 54.3 kB
  • Tags: Python 3
  • Uploaded using Trusted Publishing? Yes
  • Uploaded via: twine/6.1.0 CPython/3.13.7

File hashes

Hashes for eencijferho-0.1.2-py3-none-any.whl
Algorithm Hash digest
SHA256 2291bfb31112b0bfc1107af7ddafb85f09dbf80c8b2fd0f9ed24b197734cf800
MD5 655c0de332b0264bca11efb91d70f2aa
BLAKE2b-256 3c35ab93720c60eb36ac0dea900a04c2046a6539022c2384c39a7d9bb0c4520d

See more details on using hashes here.

Provenance

The following attestation bundles were made for eencijferho-0.1.2-py3-none-any.whl:

Publisher: pypi-publish.yml on cedanl/1cijferho

Attestations: Values shown here reflect the state when the release was signed and may no longer be current.

Supported by

AWS Cloud computing and Security Sponsor Datadog Monitoring Depot Continuous Integration Fastly CDN Google Download Analytics Pingdom Monitoring Sentry Error logging StatusPage Status page