Correcteur orthographique et grammatical du francais — regles, homophones, accords, conjugaison, participes passes
Project description
Lectura Correcteur
Correcteur orthographique et grammatical du francais. Pipeline a base de regles linguistiques avec support optionnel de modeles statistiques (BiLSTM, n-gram).
Installation
pip install lectura-correcteur
Dependance : lectura-lexique (installe automatiquement).
Utilisation rapide
from lectura_lexique import Lexique
from lectura_correcteur import Correcteur, CorrecteurConfig
lex = Lexique("lexique.db")
correcteur = Correcteur(lex)
result = correcteur.corriger("Les enfant mange des pomme.")
print(result.phrase_corrigee) # "Les enfants mangent des pommes."
for c in result.corrections:
print(f" {c.original} -> {c.corrige} ({c.type_correction.value})")
Types de corrections
| Type | Exemples |
|---|---|
| Orthographe | Mots hors lexique, distance d'edition 1-2, fautes AZERTY |
| Accords | Determinant-nom, adjectif-nom (genre et nombre) |
| Conjugaison | Accord sujet-verbe, terminaisons verbales |
| Homophones | a/a, est/et, son/sont, ou/ou, ce/se, ces/ses... |
| Participes passes | Accord avec avoir/etre, COD anteposes |
| Resegmentation | Apostrophes SMS (jai → j'ai), agglutinations |
Configuration
config = CorrecteurConfig(
activer_orthographe=True, # Verification lexicale (OOV)
activer_grammaire=True, # Accords, conjugaison, homophones
activer_resegmentation=True, # Apostrophes et agglutinations
activer_azerty=True, # Corrections specifiques clavier AZERTY
max_suggestions=5, # Nombre max de suggestions par mot
activer_editeur_homophones=True, # BiLSTM (si modele present)
activer_lm=True, # Modele de langue n-gram (si present)
)
correcteur = Correcteur(lex, config=config)
Mode sans modeles
Le correcteur fonctionne sans fichiers de modeles (mode regles uniquement). Les modeles optionnels (BiLSTM, n-gram) ameliorent la precision sur les homophones mais ne sont pas necessaires. Si les fichiers sont absents, le correcteur se rabat automatiquement sur les regles linguistiques.
Dependances
lectura-lexique: acces au lexique francais (formes, frequences, POS, morphologie)
Licence
Ce module est distribue sous licence AGPL-3.0 (non commerciale) — voir LICENCE.txt.
Pour un usage commercial, contacter contact@lec-tu-ra.com.
Project details
Release history Release notifications | RSS feed
Download files
Download the file for your platform. If you're not sure which to choose, learn more about installing packages.
Source Distributions
Built Distribution
Filter files by name, interpreter, ABI, and platform.
If you're not sure about the file name format, learn more about wheel file names.
Copy a direct link to the current filters
File details
Details for the file lectura_correcteur-1.0.0-py3-none-any.whl.
File metadata
- Download URL: lectura_correcteur-1.0.0-py3-none-any.whl
- Upload date:
- Size: 925.9 kB
- Tags: Python 3
- Uploaded using Trusted Publishing? No
- Uploaded via: twine/6.2.0 CPython/3.11.9
File hashes
| Algorithm | Hash digest | |
|---|---|---|
| SHA256 |
2ec0796167b2a015436acd271247eac2794c16008e894447f4200bd64d5a51b1
|
|
| MD5 |
72609147451fec21ba41bb2477d26f00
|
|
| BLAKE2b-256 |
b6735522515c1fa7ebe360a8fe0001c5d5951e7260c47fc425c4b6a48d87afda
|