Skip to main content

Studentprognose tool voor het voorspellen van eerstejaars instroom in het hoger onderwijs

Project description

Studentprognose

Voorspel je studentinstroom maanden vooruit — met je eigen data, op je eigen machine.

Radboud Universiteit CEDA Contributors GitHub License PyPI
Python GitHub Last Commit Windows macOS Linux

[!NOTE] Dit model is oorspronkelijk ontwikkeld door Radboud Universiteit en vervolgens samen met CEDA open source gemaakt zodat andere instellingen er ook van kunnen profiteren. Lees meer in het VOX-artikel.


📦 Aan de slag

Vereisten: Python 3.12

Installeer met uv:

uv tool install studentprognose

Heb je uv nog niet? Eenmalig installeren met curl -LsSf https://astral.sh/uv/install.sh | sh (macOS/Linux) of powershell -ExecutionPolicy ByPass -c "irm https://astral.sh/uv/install.ps1 | iex" (Windows). Voor pip-instructies, zie de documentatie.

Na installatie:

studentprognose init        # mapstructuur + configuratie aanmaken
studentprognose -w 6 -y 2024

init maakt de benodigde mapstructuur aan en legt uit welke bestanden je moet aanleveren.

Voor geautomatiseerde runs (cron, taakplanner) — sla de interactieve prompt over:

studentprognose -w 6 -y 2024 --yes

[!NOTE] Heb je afwijkende kolomnamen in je Studielink-export? Voeg een "columns"-blok toe aan configuration/configuration.json. Zie Configuratie voor uitleg en voorbeelden.

Zie de documentatie voor een complete walkthrough met uitleg over Python-installatie, data klaarzetten en veelvoorkomende fouten.


Waarom dit model?

Dit model is gebouwd voor data-analisten bij Nederlandse onderwijsinstellingen die werken met Studielink-data. Je hebt geen machine learning-expertise nodig.

Bring Your Own Data Je levert je eigen data aan — er wordt niets extern gedeeld
Privacy-vriendelijk Draait volledig lokaal op je eigen machine
Open source Transparant, aanpasbaar en gratis te gebruiken
Demo data inbegrepen Direct uitproberen zonder eigen data — demobestanden zitten in data/input_raw/

📊 Presentatie

Een introductie tot Studentprognose (HOlink 2026): waarom instroomprognose lastig is, hoe het model werkt en hoe je ermee aan de slag gaat.


🛠️ Aan de slag voor ontwikkelaars

Via de broncode (met demodata):

# 1. Installeer uv (zie https://docs.astral.sh/uv/getting-started/installation/)
curl -LsSf https://astral.sh/uv/install.sh | sh

# 2. Clone de repository
git clone https://github.com/cedanl/studentprognose.git
cd studentprognose

# 3. Draai het model met demodata
uv run studentprognose -w 6 -y 2020

[!NOTE] Demodata is meegeleverd in data/input_raw/, zodat je direct kunt starten. Gebruik -y 2020 t/m -y 2024 en -w 1 t/m -w 52.


🗃️ Studielink Data

[!IMPORTANT] Dit model werkt met Studielink-telbestanden. Je hebt deze data nodig om voorspellingen te maken voor jouw instelling. Demodata is meegeleverd zodat je het model eerst kunt uitproberen.


✨ Gebruik

studentprognose -w 6 -y 2024                  # specifieke week en jaar
studentprognose -w 10 : 20 -y 2023            # weekbereik
studentprognose -d c                           # alleen cumulatief spoor
studentprognose -y 2023 2024 -w 10 : 20 -d b  # meerdere jaren, beide sporen
Vlag Beschrijving Opties
-w Voorspelweek(en) weeknummers of bereik, bijv. 10 : 20
-y Voorspeljaar(en) bijv. 2024 of 2023 2024
-d Dataset individual, cumulative, both (standaard)
--noetl Sla ETL over als je al verwerkte data in data/input/ hebt
--yes Sla interactieve prompts over voor CI/CD en cron

Zie de documentatie voor alle vlaggen, configuratie, validatie-instellingen en uitgebreide voorbeelden.


📁 Beschrijving van bestanden

Input

Bestand Beschrijving
individual Individuele (voor)aanmeldingen per student. Voedt het individueel model (XGBoost classifier + SARIMA) en levert de SARIMA_individual voorspelling.
cumulative Aantal aanmeldingen per opleiding, herkomst, jaar, week en herinschrijving. Wordt gebruikt voor de SARIMA_cumulative voorspelling. Verkregen via Studielink.
latest Per opleiding, herkomst, jaar en week: aanmeldingen, voorspellingen en foutwaarden (MAE/MAPE).
student_count_first-years Werkelijk aantal eerstejaars studenten per jaar, opleiding en herkomst.
student_volume Werkelijk totaal aantal ingeschreven studenten per jaar, opleiding en herkomst (alleen nodig bij -sy v).
weighted_ensemble Gewichten per model voor de ensemble-voorspelling.

Output

Bestand Beschrijving
output_prelim.xlsx Voorlopige output met alle voorspellingen van de huidige run.
output_first-years.xlsx Volledige output met voorspellingen voor eerstejaars studenten.
output_volume.xlsx Volledige output met volume-voorspellingen (totaal).

🏗️ Architectuur

Pipeline executievolgorde

Gedeelde stappen (alle modi):

Stap Fase Bestand
1 CLI parsing cli.py
2 Validatie ruwe data (skip met --noetl) data/validation
3 ETL (skip met --noetl) data/etl
4 Configuratie laden config.py
5 Data laden loaderpreprocessing/add_zero_weeks
6 CI subset (indien --ci) utils/ci_subset

Modus-specifieke stappen:

Stap Fase Individual (-d i) Cumulative (-d c) Both (-d b)
6 Preprocessing strategies/individual strategies/cumulative individual → cumulative
7 Filtering strategies/base strategies/base strategies/base
8 Classificatie xgboost_classifier xgboost_classifier
9 Transformatie transforms transforms
10 SARIMA sarima (individual) sarimatransforms sarima (both)
11 XGBoost regressor xgboost_regressor xgboost_regressor
12 Ratio model ratio ratio
13 Postprocessing + Opslaan postprocessor postprocessor postprocessor

Zie de Technische README voor meer details over de architectuur. Voor een end-to-end uitleg van het individueel spoor (inclusief Mermaid-flow), zie Individueel model in de methodologische documentatie.


🤝 Bijdragen

Dit project wordt actief onderhouden door CEDA. Wil je bijdragen of meedenken? Sluit je aan bij de werkgroep.

🆘 Ondersteuning

Voor vragen of problemen:


Gebouwd met ❤️ door de CEDANL community

Project details


Download files

Download the file for your platform. If you're not sure which to choose, learn more about installing packages.

Source Distribution

studentprognose-1.5.6.tar.gz (5.0 MB view details)

Uploaded Source

Built Distribution

If you're not sure about the file name format, learn more about wheel file names.

studentprognose-1.5.6-py3-none-any.whl (149.9 kB view details)

Uploaded Python 3

File details

Details for the file studentprognose-1.5.6.tar.gz.

File metadata

  • Download URL: studentprognose-1.5.6.tar.gz
  • Upload date:
  • Size: 5.0 MB
  • Tags: Source
  • Uploaded using Trusted Publishing? Yes
  • Uploaded via: twine/6.1.0 CPython/3.13.12

File hashes

Hashes for studentprognose-1.5.6.tar.gz
Algorithm Hash digest
SHA256 667e42a0bb6f91614f2c065755a630b301d772b714f6d667908e9ee71f2c95f5
MD5 e7d7740ae9c9a255bbb1437762d8d2af
BLAKE2b-256 be3efe924bfd526ab4de24475fd827d675ff614fdf11248f2034cbb15f8351bc

See more details on using hashes here.

Provenance

The following attestation bundles were made for studentprognose-1.5.6.tar.gz:

Publisher: pypi-publish.yml on cedanl/studentprognose

Attestations: Values shown here reflect the state when the release was signed and may no longer be current.

File details

Details for the file studentprognose-1.5.6-py3-none-any.whl.

File metadata

  • Download URL: studentprognose-1.5.6-py3-none-any.whl
  • Upload date:
  • Size: 149.9 kB
  • Tags: Python 3
  • Uploaded using Trusted Publishing? Yes
  • Uploaded via: twine/6.1.0 CPython/3.13.12

File hashes

Hashes for studentprognose-1.5.6-py3-none-any.whl
Algorithm Hash digest
SHA256 7499c2e27fcbf6e60c6cbc202769a96026225d1648912aac74d9f8730e860e5c
MD5 dc765d96a8cd9d4ac914e1d32762dc57
BLAKE2b-256 27ffe742ecff2b942057ab2f5d59b3bbf7ad422dcf5028150e6d7e75f492aa07

See more details on using hashes here.

Provenance

The following attestation bundles were made for studentprognose-1.5.6-py3-none-any.whl:

Publisher: pypi-publish.yml on cedanl/studentprognose

Attestations: Values shown here reflect the state when the release was signed and may no longer be current.

Supported by

AWS Cloud computing and Security Sponsor Datadog Monitoring Depot Continuous Integration Fastly CDN Google Download Analytics Pingdom Monitoring Sentry Error logging StatusPage Status page