Skip to main content

Calculateur de qualité de service basé sur les données d'offre réalisées

Project description

Introduction

Le projet permet de calculer les statistiques de qualité de service basées sur les données de l'offre réalisée.

La documentation du code est disponible ici.

Utiliser le module

Structure du code

Le code est organisé selon l'architecture hexagonal.

  • Les fonctions "principales" sont rangées dans le sous-dossier usecases.
  • Les fonctions "secondaires", qui peuvent être appelées dans les "principales" sont rangées dans le sous-dossier entities.
  • Les variables sont définies dans les fichiers de configuration contenus dans le dossier config.
  • Et enfin les fonctions relatives à l'infrastructure sont rangées dans le dossier infrastructure.

|- sources
│      |- offre_realisee
│      │      |- config
│      │      |- domain
│      │      │      |- entities
│      │      │      |- port
│      │      │      |- usecases
│      │      |- infrastructure

Calculer les indicateurs de Qualité de Service

Installer le package Python

pip install idfm-qualite-de-service-calculateur

Executer le module sur des données locales

Structure des données

Placer vos données dans un dossier respectant la structure définie.

Le code a été implémenté en suivant une structure de répertoire définie. Les données d'entrée doivent être un fichier parquet nommé "input-file-name" partitionné par jour "JOUR=AAAA-MM-JJ" en fonction du jour des données ainsi qu'un fichier parquet nommé "calendrier-scolaire-file-name" contenant le référentiel du calendrier scolaire (ce fichier pouvant être téléchargé via le code). Le dossier "output" contiendra les données de sortie. La création de dossiers pour organiser les fichiers de sortie est automatique.

|- data-path
│      |- input
│      │      |- input-file-name
│      │      │      |- JOUR=AAAA-MM-JJ
│      │      |- calendrier-scolaire-file-name
│      |- output

Les valeurs suivantes peuvent être modifiées en fonction de la structure de votre répertoire :

  • data-path
  • input (Valeur par défaut: "input")
  • output (Valeur par défaut: "output")
  • input-file-name (Valeur par défaut: "offre_realisee.parquet")
  • calendrier-scolaire-file-namee (Valeur par défaut: "calendrier_scolaire.parquet")

Format des données

Certaines colonnes doivent être présente dans les fichiers d'entrée :

  • LIGNE : Identifiant unique de ligne (idéalement égale à l'identifiant dans le référentiel ILICO)
  • SENS : Sens du déplacement sur la ligne (0 ou 1)
  • ARRET : Identifiant unique de l'arrêt sur la ligne (idéalement égale à l'identifiant dans le referentiel ICAR)
  • HEURE_THEORIQUE : Heure de passage théorique
  • HEURE_REELLE : Heure de passage réalisée
  • IS_TERMINUS : Indique si l'arrêt correspond à un terminus ou non (Booléen)

Exemple d'execution

offre_realisee
    --telecharge-calendrier-scolaire
    --data-path=<dossier-racine-des-donnees>
    --start-date=YYYY-MM-DD
    --end-date=YYYY-MM-DD
    --input-path=<chemin-relatif-du-dossier-des-donnees-en-entree>
    --output-path=<chemin-relatif-du-dossier-des-donnees-en-sortie>
    --input-file-name=<nom-du-fichier-de-donnees-en-entree>
    --periode-ete 07_01 08_31
    --calendrier-scolaire-file-name=<nom-du-fichier-de-référentiel-du-calendrier-scolaire>
    --list-journees-exceptionnelles YYYY-MM-DD YYYY-MM-DD YYYY-MM-DD
    --n-thread=<nombre-de-thread-d'execution-parallèle>

Cette commande permet de calculer et d'agréger les statistiques de qualite de service entre la date de début (start-date) et la date de fin (end-date).

Des paramètres supplémentaires peuvent être ajoutés pour exécuter le script sur :

  • le téléchargment du calendrier scolaire
  • la mesure ou l’agrégation uniquement
  • la ponctualité ou la régularité uniquement

Par défaut la qualité de service est calculé par jour et agrégée par période pour la ponctualité et la régularité.

Plus de détails sur les paramètres d'execution du package

$ offre_realisee -h
usage: offre_realisee [-h] [--telecharge-calendrier-scolaire | --no-telecharge-calendrier-scolaire] [--mesure | --no-mesure]
                      [--aggregation | --no-aggregation] [--ponctualite | --no-ponctualite] [--regularite | --no-regularite]
                      --data-path DATA_PATH --start-date START_DATE --end-date END_DATE [--input-path INPUT_PATH]
                      [--output-path OUTPUT_PATH] [--input-file-name INPUT_FILE_NAME]
                      [--calendrier-scolaire-file-name CALENDRIER_SCOLAIRE_FILE_NAME] [--periode-ete PERIODE_ETE PERIODE_ETE]
                      [--list-journees-exceptionnelles [LIST_JOURNEES_EXCEPTIONNELLES ...]] [--n-thread N_THREAD]

Calcul de la qualite de service.
Compute qs

options:
  -h, --help            show this help message and exit
  --telecharge-calendrier-scolaire, --no-telecharge-calendrier-scolaire
                        Télécharge le calendrier scolaire.
                         (Valeur par défaut: False)
                        Download holidays. (default: False)
  --mesure, --no-mesure
                        Calcule la mesure par jour.
                         (Valeur par défaut: True)
                        Compute mesure by day. (default: True)
  --aggregation, --no-aggregation
                        Calcule l'agrégation des données journalières.
                         (Valeur par défaut: True)
                        Compute aggregation of daily mesures. (default: True)
  --ponctualite, --no-ponctualite
                        Calcule les statistiques (mesure ou aggregation) sur la ponctualité.
                         (Valeur par défaut: True)
                        Compute stats on ponctualite. (default: True)
  --regularite, --no-regularite
                        Calcule les statistiques (mesure ou aggregation) sur la régularité.
                         (Valeur par défaut: True)
                        Compute stats on regularite. (default: True)
  --data-path DATA_PATH
                        Chemin vers le dossier racine des données.
                        Path to the root folder of your data.
  --start-date START_DATE
                        Première date à traiter. Doit être au format : YYYY-MM-DD
                        First date to process. Must be in format: YYYY-MM-DD
  --end-date END_DATE   Dernière date à traiter. Doit être au format : YYYY-MM-DD
                        Last date to process. Must be in format: YYYY-MM-DD
  --input-path INPUT_PATH
                        Chemin relatif par rapport au 'data-path' vers le dossier d'entrée des données. (Valeur par défaut: input)
                        Relative path to input folder from data path. (default: input)
  --output-path OUTPUT_PATH
                        Chemin relatif par rapport au 'data-path' vers le dossier de sortie des données. (Valeur par défaut: output)
                        Relative path to output folder from data path. (default: output)
  --input-file-name INPUT_FILE_NAME
                        Nom du fichier de données d'entrée. (default: offre_realisee.parquet)
                        Input parquet file name. (default: offre_realisee.parquet)
  --calendrier-scolaire-file-name CALENDRIER_SCOLAIRE_FILE_NAME
                        Nom du fichier du referentiel du calendrier scolaire. (default: calendrier_scolaire.parquet)
                        School calendar parquet file name. (default: calendrier_scolaire.parquet)
  --periode-ete PERIODE_ETE PERIODE_ETE
                        Dates sous forme de string au format ['mois_jour', 'mois_jour'] definissant la période d'été. (default: ('07_01', '08_31'))
                        Summer period between two dates. (default: ('07_01', '08_31'))
  --list-journees-exceptionnelles [LIST_JOURNEES_EXCEPTIONNELLES ...]
                        Liste des dates des journées exceptionnelles à exclure des calculs agrégés. (Valeur par défaut: None)
                        Datetime list of exceptionnal days to exclude. (default: None)
  --n-thread N_THREAD   Nombre de threads en parallèle dans le calcul des mesures. (Valeur par défaut: 1)
                        Number of parallel threads. (default: 1)

Project details


Download files

Download the file for your platform. If you're not sure which to choose, learn more about installing packages.

Source Distribution

idfm_qualite_de_service_calculateur-1.6.4.tar.gz (63.6 kB view details)

Uploaded Source

Built Distribution

If you're not sure about the file name format, learn more about wheel file names.

File details

Details for the file idfm_qualite_de_service_calculateur-1.6.4.tar.gz.

File metadata

File hashes

Hashes for idfm_qualite_de_service_calculateur-1.6.4.tar.gz
Algorithm Hash digest
SHA256 b96c3ee89aef6fb0aea4e5213aaa0052a34a6dd1d5221f32ce4a1387a0ffc593
MD5 1e76a8f316661c98cda9205ec1b4bd07
BLAKE2b-256 418b55751d77a7c9c2ba0b7dd75440b2ceeb874940078e6d1a57b80a4fef0aa4

See more details on using hashes here.

File details

Details for the file idfm_qualite_de_service_calculateur-1.6.4-py3-none-any.whl.

File metadata

File hashes

Hashes for idfm_qualite_de_service_calculateur-1.6.4-py3-none-any.whl
Algorithm Hash digest
SHA256 319e477d57ca3c525259e7efb7da7d9aff8997e7e015d23409c731f9d5390750
MD5 05644e30caee8e213cc33892eacaf1d9
BLAKE2b-256 0cd47019fb7cf84deebb44589d0b69371dc48adb7734a3f805926038514062e5

See more details on using hashes here.

Supported by

AWS Cloud computing and Security Sponsor Datadog Monitoring Depot Continuous Integration Fastly CDN Google Download Analytics Pingdom Monitoring Sentry Error logging StatusPage Status page