Outils de lecture/écriture des flux

These details have not been verified by PyPI

Project links

Project description

Electriflux

Electriflux est une bibliothèque Python conçue pour la lecture et l'écriture des flux de données Enedis.

Fonctionnalités principales

Téléchargement sécurisé des fichiers via SFTP
Décryptage des fichiers chiffrés
Extraction des données XML en DataFrame pandas
Configuration flexible des flux via des fichiers YAML

Installation

pip install electriflux

Utilisation

Il y a deux phases :

Récupération et décryptage des fichiers depuis le sFTP :

Assuré par la fonction download_decrypt_extract_new_files de electriflux.utils. Elle prend notamment en entrée un dictionnaire de configuration, qui doit contenir les clés suivantes :

'FTP_ADDRESS',
'FTP_USER',
'FTP_PASSWORD'
'AES_KEY'
'AES_IV'

A l'issue de cette opération, le dossier local choisi contient les fichiers XML des flux déchiffrés.

Extraction des données XML en DataFrame pandas :

Cette extraction des données est assurée par process_flux de electriflux.simple_reader. Son principe est simple, un fichier de configuration en YAML permet de définir, pour chaque flux, des couples clé-valeur, la clé représentant le nom de la colonne à remplir, et la valeur le chemin XPATH vers la donnée à extraire. (C'est un poil plus complexe en réalité, mais c'est l'idée). Par défaut, le fichier simple_flux.yaml est utilisé, mais il est possible d'en utiliser un autre en passant son chemin en argument de process_flux.

Exemple type pour récupérer les données du flux C15 sous forme de csv :

   df = process_flux('C15', Path('~/data/flux_enedis_v2/C15').expanduser())
   df.to_csv('C15.csv', index=False)

Modifier les données à extraire : Configuration YAML

La fonction xml_to_dataframe permet de transformer une structure XML en DataFrame de manière entièrement configurable à partir d'un fichier YAML. Cette configuration permet de spécifier différents niveaux d'extraction des données à partir d'un flux XML.

Voici une documentation détaillée sur la manière de personnaliser le fichier YAML pour adapter la transformation à vos besoins.

Structure du Fichier YAML

Le fichier YAML est organisé en plusieurs sections. Chaque section représente une configuration spécifique pour un type de flux. Voici les sections disponibles :

Nom_du_Flux:
  row_level: <xpath>
  metadata_fields: <dictionnaire de métadonnées>
  data_fields: <dictionnaire de données>
  nested_fields: <liste de configurations imbriquées>

Détails des Champs

row_level (obligatoire)
Définit le niveau de l'arbre XML à partir duquel chaque ligne du DataFrame sera générée.
- Type : str
- Valeur : XPath indiquant le niveau de ligne dans le XML.
Exemple :
```
row_level: './/PRM'
```

metadata_fields (facultatif)
Spécifie les champs à extraire depuis la racine du XML. Ces champs seront recopiés dans chaque ligne générée.
- Type : dict
- Clé : Nom de la colonne dans le DataFrame.
- Valeur : XPath exprimé à partir de la racine du document XML.
Exemple :
```
metadata_fields:
  Num_Depannage: 'Num_Depannage'
  Date_Fichier: 'Date_Fichier'
```

data_fields (obligatoire)
Définit les champs à extraire relativement à chaque row_level.
- Type : dict
- Clé : Nom de la colonne dans le DataFrame.
- Valeur : XPath exprimé relativement au row_level.
Exemple :
```
data_fields:
  pdl: 'Id_PRM'
  Etat_Contractuel: 'Situation_Contractuelle/Etat_Contractuel'
```

nested_fields (facultatif)
Permet d'extraire des données contenues dans des structures imbriquées sous forme de colonnes linéarisées. Cette section prend en charge plusieurs conditions sous forme d'une liste de paires clé-valeur.
- Type : list
- Clés disponibles :
  - prefix : Préfixe facultatif ajouté au nom de la colonne.
  - child_path : XPath relatif au row_level pour trouver les nœuds enfants.
  - id_field : Nom de l'élément clé.
  - value_field : Nom de l'élément contenant la valeur à extraire.
  - conditions : Liste de conditions sous forme de paires clé-valeur à respecter pour extraire les données.
Exemple :
```
nested_fields:
  - prefix: 'CT_'
    child_path: 'Evenement_Declencheur/Releves/Donnees_Releve/Classe_Temporelle_Distributeur'
    id_field: 'Id_Classe_Temporelle'
    value_field: 'Valeur'
    conditions:
      - xpath: '../Code_Qualification'
        value: '2'
      - xpath: 'Classe_Mesure'
        value: '1'
```

Dans cet exemple :

Les données sont extraites uniquement lorsque les conditions suivantes sont remplies :
- L'élément parent Code_Qualification est égal à 2.
- Le champ Classe_Mesure est égal à 1.

Les valeurs seront linéarisées avec le préfixe CT_ suivi de l'ID de la classe temporelle.

Exemple Complet

Voici un exemple complet de configuration YAML pour un flux nommé C15 :

C15:
  row_level: './/PRM'
  metadata_fields:
    Num_Depannage: 'Num_Depannage'
    Date_Fichier: 'Date_Fichier'
  data_fields:
    pdl: 'Id_PRM'
    Etat_Contractuel: 'Situation_Contractuelle/Etat_Contractuel'
    Date_Evenement: 'Evenement_Declencheur/Date_Evenement'
  nested_fields:
    - prefix: ''
      child_path: 'Evenement_Declencheur/Releves/Donnees_Releve/Classe_Temporelle_Distributeur'
      id_field: 'Id_Classe_Temporelle'
      value_field: 'Valeur'
      conditions:
        - xpath: '../Code_Qualification'
          value: '2'
        - xpath: 'Classe_Mesure'
          value: '1'

Explications :

Chaque PRM dans le flux génère une ligne dans le DataFrame.
Les colonnes Num_Depannage et Date_Fichier sont extraites depuis la racine et ajoutées à chaque ligne.
Les champs pdl, Etat_Contractuel et Date_Evenement sont extraits relativement à chaque nœud PRM.
Les valeurs de Classe_Temporelle_Distributeur sont extraites uniquement si les conditions spécifiées sont remplies.

Project details

These details have not been verified by PyPI

Project links

Release history Release notifications | RSS feed

1.3.0

Sep 5, 2025

1.2.0

Aug 27, 2025

1.1.0

Aug 5, 2025

1.0.5

Jun 13, 2025

1.0.3

Mar 14, 2025

1.0.2

Mar 14, 2025

1.0.1

Mar 14, 2025

1.0.0

Mar 14, 2025

0.5.8

Mar 5, 2025

0.5.7

Mar 5, 2025

0.5.6

Mar 5, 2025

0.5.5

Mar 5, 2025

This version

0.5.4

Mar 4, 2025

0.5.3

Mar 4, 2025

0.5.2

Feb 28, 2025

0.5.1

Feb 28, 2025

0.5.0

Feb 28, 2025

0.4.1

Feb 26, 2025

0.4.0

Feb 26, 2025

0.3.2

Feb 26, 2025

0.3.1

Feb 21, 2025

0.3.0

Feb 19, 2025

0.2.0

Feb 8, 2025

0.1.10

Jan 22, 2025

0.1.9

Nov 5, 2024

0.1.8

Nov 5, 2024

0.1.7

Oct 30, 2024

0.1.6

Oct 23, 2024

0.1.5

Oct 21, 2024

0.1.4

Oct 21, 2024

0.1.3

Oct 21, 2024

0.1.2

Oct 18, 2024

0.1.1

Oct 14, 2024

0.1.0

Oct 14, 2024

Download files

Download the file for your platform. If you're not sure which to choose, learn more about installing packages.

Source Distribution

electriflux-0.5.4.tar.gz (22.6 kB view details)

Uploaded Mar 4, 2025 Source

Built Distribution

If you're not sure about the file name format, learn more about wheel file names.

The dropdown lists show the available interpreters, ABIs, and platforms. Enable javascript to be able to filter the list of wheel files.

electriflux-0.5.4-py3-none-any.whl (23.5 kB view details)

Uploaded Mar 4, 2025 Python 3

File details

Details for the file electriflux-0.5.4.tar.gz.

File metadata

Download URL: electriflux-0.5.4.tar.gz
Upload date: Mar 4, 2025
Size: 22.6 kB
Tags: Source
Uploaded using Trusted Publishing? No
Uploaded via: poetry/2.0.1 CPython/3.12.3 Linux/5.15.167.4-microsoft-standard-WSL2

File hashes

Hashes for electriflux-0.5.4.tar.gz
Algorithm	Hash digest
SHA256	`1993ea4d4430f8a0f9b990c9cc8cf114a374d02835f17bfd6dd3cfbf3a87bc32`
MD5	`c1e00b863f235f7beee17c5964938f6f`
BLAKE2b-256	`c9e43d31c9de53555373077bbd4fbc49ce1ef9839b66b7ed9abdb53ddc209351`

See more details on using hashes here.

File details

Details for the file electriflux-0.5.4-py3-none-any.whl.

File metadata

Download URL: electriflux-0.5.4-py3-none-any.whl
Upload date: Mar 4, 2025
Size: 23.5 kB
Tags: Python 3
Uploaded using Trusted Publishing? No
Uploaded via: poetry/2.0.1 CPython/3.12.3 Linux/5.15.167.4-microsoft-standard-WSL2

File hashes

Hashes for electriflux-0.5.4-py3-none-any.whl
Algorithm	Hash digest
SHA256	`fd079da93202c97bd6a03f9b7d0c4a07a52e814c3dc1c66ba980da1bb4c97807`
MD5	`1c59c8c11253f7ad223a7dd63f89cef3`
BLAKE2b-256	`56148c36ef299a20234da7572c27489777fba5ffd1bcc485a319482d117c338a`

See more details on using hashes here.

electriflux 0.5.4

Navigation

Verified details

Maintainers

Unverified details

Project links

Meta

Classifiers

Project description

Electriflux

Fonctionnalités principales

Installation

Utilisation

Modifier les données à extraire : Configuration YAML

Structure du Fichier YAML

Détails des Champs

Exemple Complet

Explications :

Project details

Verified details

Maintainers

Unverified details

Project links

Meta

Classifiers

Release history Release notifications | RSS feed

Download files

Source Distribution

Built Distribution

File details

File metadata

File hashes

File details

File metadata

File hashes