Generate PPI sheets from Excel templates
Project description
Générateur de Fiches PPI
Générateur de fiches PPI (Phrases Préfabriquées des Interactions) à partir de grilles d'analyse de PPI pré-remplies.
📋 Description
Cet outil permet de générer automatiquement des fiches d'analyse PPI à partir de paires de grilles Excel (oral/écrit) pré-remplies. Les fiches produites suivent la grille d'analyse développée dans le cadre du projet ANR PREFAB et résument certaines informations pour faciliter la saisie des fiches finales.
Les fonctionnalités principales :
- Mode simple : génération d'une fiche à partir d'une paire de fichiers (oral + écrit)
- Mode batch : génération de plusieurs fiches à partir d'un dossier contenant des paires de fichiers
*_Or.xlsx/*_Ph.xlsx - Interface graphique intuitive (Tkinter)
- Formatage automatique des cellules (gras, couleurs, tags XML)
🚀 Installation
Depuis PyPI (recommandé)
pip install fiche-ppi
Depuis les sources
git clone https://github.com/yourusername/fiche-ppi.git
cd fiche-ppi
pip install -e .
Dépendances
- Python ≥ 3.8
- pandas ≥ 1.5.0
- numpy ≥ 1.24.0
- requests ≥ 2.28.0
- beautifulsoup4 ≥ 4.12.0
- ppi_analyser (dépendance interne)
Note : Sur Linux, tkinter peut nécessiter l'installation d'un paquet système :
sudo apt-get install python3-tk # Debian/Ubuntu
sudo dnf install python3-tkinter # Fedora
💻 Utilisation
Interface graphique
Lancez l'interface graphique :
fiche-ppi-gui
Mode graphique - Onglet Simple
- Sélectionnez le fichier oral (
*_Or.xlsx) - Sélectionnez le fichier écrit (
*_Ph.xlsx) - Le chemin de sortie est automatiquement généré (modifiable)
- Cliquez sur "⚡ Générer la fiche"
Mode graphique - Onglet Batch
- Sélectionnez un dossier contenant des paires de fichiers
- Les paires
*_Or.xlsx/*_Ph.xlsxsont automatiquement détectées - Cliquez sur "⚡ Générer toutes les fiches"
Ligne de commande
fiche-ppi [-h] [-o OUTPUT] [--batch DOSSIER] [file_oral] [file_ecrit]
Génère une fiche PPI consolidée à partir de deux fichiers Excel.
positional arguments:
file_oral Fichier Excel oral (.xlsx)
file_ecrit Fichier Excel écrit (.xlsx)
options:
-h, --help show this help message and exit
-o OUTPUT, --output OUTPUT
Fichier de sortie (mode simple ; défaut : <stem>_fiche.xlsx).
--batch DOSSIER Traite toutes les paires *_Or.xlsx / *_Ph.xlsx du dossier.
📁 Structure des fichiers d'entrée
Les fichiers Excel doivent contenir les colonnes suivantes :
Lemme,Forme PPI,Acception,Type de phraseModalité d'énonciation,Expansion,ModifieursCooccurrents,Fonction globale,Fonctions spécifiquesmilieu,secteur,Remarques,node
Génération des colonnes de la fiche PPI
| Propriété | Comment c'est généré |
|---|---|
| Fe_1a PPI | Prend la valeur de la colonne Forme PPI du premier enregistrement du DataFrame combiné (oral + écrit) |
| Fe_1b Acception | Joint les valeurs uniques non-vides de la colonne Acception (triées, séparées par ", ") |
| Fe_1c Variantes formelles | Calcule les variantes formelles pour l'oral et l'écrit séparément : - Extrait les modifieurs de la colonne Modifieurs- Nettoie les tokens de modifieurs - Applique remove_modifier() pour retirer les modifieurs de la colonne node- Formate : \n- Oral : var1, var2\n- Écrit : var3, var4 |
| Fe_1e Prononciation | Pour le lemme (premier Lemme du DataFrame oral) :Scrape la page Wiktionary du lemme pour extraire les URLs des fichiers audio MP3 - Extrait les URLs des fichiers MP3- Retourne une liste d'URLs séparées par des sauts de ligne |
| Fe_2a Statut syntaxique phrase | Joint les valeurs uniques de la colonne Type de phrase |
| Fe_2c Modalité de phrase | Joint les valeurs uniques de la colonne Modalité d'énonciation |
| Fe_2e Expansion éventuelle | Joint les valeurs uniques de la colonne Expansion |
| Fe_3a Fonction globale | Joint les valeurs uniques de la colonne Fonction globale |
| Fe_3b Fonctions spécifiques | Joint les valeurs uniques de la colonne Fonctions spécifiques |
| Fe_3c Codes Fonction globale | Joint les valeurs uniques de la colonne Fonction globale (identique à Fe_3a) |
| Fe_3d Codes Fonctions spécifiques | Joint les valeurs uniques de la colonne Fonctions spécifiques (identique à Fe_3b) |
| Fe_3f Structure interactionnelle | Pour l'oral, l'écrit et le combiné : - Calcule les fréquences des colonnes Déclenchement, Portée, Position- Formate : Oral :\n\t- Déclenchement : val1 (n), val2 (n)\n\t- Portée : ... |
| Fe_3g Contexte spécifique | Joint les valeurs uniques de la colonne milieu |
| Fe_3h Modalité écrite et orale | Joint les valeurs uniques de la colonne secteur |
| Fe_4a Cooccurrents privilégiés | Pour l'oral, l'écrit et le combiné : - Parse la colonne Cooccurrents- Sépare les éléments antéposés (a) et postposés (p) - Compte les fréquences avec Counter()- Calcule les pourcentages d'antéposés/postposés - Formate : Oral :\n\t- Cooccurrents antéposés (X%) : ...\n\t- Cooccurrents postposés (Y%) : ... |
| Fe_4b Modifieurs de la PPI | Joint les valeurs uniques de la colonne Modifieurs |
| Fe_9a Remarques | Joint les valeurs uniques de la colonne Remarques |
Normalisation des données d'entrée
L'outil procède à une normalisation de certaines valeurs afin d'obtenir des calculs corrects, ex. ante:mais--> mais (a); post:mais --> mais (p) Un minimum de normalisation est toutefois attendu.
Contrôle d'intégrité
L'outil affiche des avertissements lorsque des lignes vides sont détectées: ex. [warn] [Oral] Portée (33) ≠ Position (34) — ligne(s) incomplète(s) [warn] [Écrit] Portée (44) ≠ Position (43) — ligne(s) incomplète(s)
LIDILEM · ANR PREFAB
Project details
Download files
Download the file for your platform. If you're not sure which to choose, learn more about installing packages.
Source Distribution
Built Distribution
Filter files by name, interpreter, ABI, and platform.
If you're not sure about the file name format, learn more about wheel file names.
Copy a direct link to the current filters
File details
Details for the file fiche_ppi-0.1.3.tar.gz.
File metadata
- Download URL: fiche_ppi-0.1.3.tar.gz
- Upload date:
- Size: 20.8 kB
- Tags: Source
- Uploaded using Trusted Publishing? No
- Uploaded via: twine/6.2.0 CPython/3.11.2
File hashes
| Algorithm | Hash digest | |
|---|---|---|
| SHA256 |
cf2d162300e52e86a8df5f1420fe698890f84082a9ac8610b62c330906050d0e
|
|
| MD5 |
dc59d7a508bb7b1108832fd1082e851b
|
|
| BLAKE2b-256 |
3de94cf0860495a5498aae0b33ecbe041d5be4c14e6523814705584d41da92eb
|
File details
Details for the file fiche_ppi-0.1.3-py3-none-any.whl.
File metadata
- Download URL: fiche_ppi-0.1.3-py3-none-any.whl
- Upload date:
- Size: 19.8 kB
- Tags: Python 3
- Uploaded using Trusted Publishing? No
- Uploaded via: twine/6.2.0 CPython/3.11.2
File hashes
| Algorithm | Hash digest | |
|---|---|---|
| SHA256 |
b6d9a4216df8cea9e90b854b7d2cebcf680f2a9f6c3dba57a4d947da5d6c6644
|
|
| MD5 |
a2e7cfe66c3210e73696616ac29c1aa8
|
|
| BLAKE2b-256 |
415d2108d3c3ff81b30734ed73198e3853bdf9f0375395f23d420323a0c60cc0
|