Prepare data for LexImpact
Project description
Préparation des données pour LexImpact
Ce projet regroupe les scripts permettant de préparer les données des différents projets Leximpact.
Schéma complet de préparation et d’utilisation des données
Le pipeline prepare-data est donc le suivant :
Input: erfs_flat_2018.h5
01_db_reduce.ipynb
Objectif: Réduit le nombre de variables dans la base
Output: 01_erfs_reduced_2018.h5
02_db_enlarge.ipynb
Objectif: Ajoute des gens fictifs dans la base pour pouvoir calibrer
Output: 02_erfs_enlarged_2018.h5
03_db_add_rfr.ipynb
Input : CalibPote-2018-revkire.json
Objectifs: - Calculer le RFR dans OpenFisca - Calibrer le RFR ERFS_2018 sur POTE_2018
Output: 03_erfs_rfr_2018.h5
04_db_add_var
0403_db_add_var_copules.ipynb
0401_db_add_var_copules-algo_monte-carlo.ipynb
0402_db_add_var_copules-validate.ipynb
Input : ExportCopule-2018-variable.json
Objectif: Ajoute les variables issues de POTE 2018 dans la base ERFS 2018
Output: 04_erfs_var_copules_2018.h5
05_db_calib_var_copules.ipynb
Input : CalibPote-2019-variable.json
Objectifs: - Vieillit la base ERFS_2018 vers 2019 (nos données les plus récentes) : inflation économique et inflation des foyers - Calibre chacune des variables issues de POTE sur POTE 2019
Output: 05_erfs_calibrated_ff_2018_to_2019.h5
06_db_aging_final.ipynb
Objectifs:
- Vieillit la base ERFS_2019 vers 2021 (année voulue pour les calculs) : inflation économique et inflation des foyers
- Bruitage statistique de la base pour anonymisation
Output: 06_erfs_ff_2018_aged_2021.h5
How to contribute
Please see the contributing page.
Project details
Release history Release notifications | RSS feed
Download files
Download the file for your platform. If you're not sure which to choose, learn more about installing packages.
Source Distribution
Built Distribution
Hashes for leximpact_prepare_data-0.0.32.tar.gz
Algorithm | Hash digest | |
---|---|---|
SHA256 | 37c75adceb1fcbd573e1b1509b1154218a9bba9c262ac71c7c824b47b5746516 |
|
MD5 | b3e727e2e1ab41896f2873668a2455cd |
|
BLAKE2b-256 | 44d74b0df12992b56555dd401cfe94031bbfb2278815c3436d9f0f6eb2691501 |
Hashes for leximpact_prepare_data-0.0.32-py3-none-any.whl
Algorithm | Hash digest | |
---|---|---|
SHA256 | b68ff69a2254c8d650855abe3a45d0d0bb5fa1d6907abe66cc22a638ecc81425 |
|
MD5 | abce6421cbd0075ab5440a34c453c3ab |
|
BLAKE2b-256 | 4e6c7ffdd8063235d4ccc393f81f6c5699eb9cb4c99a9d74f7138450d7a09ab2 |