Skip to main content

Correcteur orthographique et grammatical du francais — regles, homophones, accords, conjugaison, participes passes

Project description

Lectura Correcteur

Correcteur orthographique et grammatical du francais. Pipeline a base de regles linguistiques avec support optionnel de modeles statistiques (BiLSTM, n-gram).

Installation

pip install lectura-correcteur

Dependance : lectura-lexique (installe automatiquement).

Utilisation rapide

from lectura_lexique import Lexique
from lectura_correcteur import Correcteur, CorrecteurConfig

lex = Lexique("lexique.db")
correcteur = Correcteur(lex)

result = correcteur.corriger("Les enfant mange des pomme.")
print(result.phrase_corrigee)  # "Les enfants mangent des pommes."

for c in result.corrections:
    print(f"  {c.original} -> {c.corrige} ({c.type_correction.value})")

Types de corrections

Type Exemples
Orthographe Mots hors lexique, distance d'edition 1-2, fautes AZERTY
Accords Determinant-nom, adjectif-nom (genre et nombre)
Conjugaison Accord sujet-verbe, terminaisons verbales
Homophones a/a, est/et, son/sont, ou/ou, ce/se, ces/ses...
Participes passes Accord avec avoir/etre, COD anteposes
Resegmentation Apostrophes SMS (jai → j'ai), agglutinations

Configuration

config = CorrecteurConfig(
    activer_orthographe=True,     # Verification lexicale (OOV)
    activer_grammaire=True,       # Accords, conjugaison, homophones
    activer_resegmentation=True,  # Apostrophes et agglutinations
    activer_azerty=True,          # Corrections specifiques clavier AZERTY
    max_suggestions=5,            # Nombre max de suggestions par mot
    activer_editeur_homophones=True,  # BiLSTM (si modele present)
    activer_lm=True,              # Modele de langue n-gram (si present)
)

correcteur = Correcteur(lex, config=config)

Mode sans modeles

Le correcteur fonctionne sans fichiers de modeles (mode regles uniquement). Les modeles optionnels (BiLSTM, n-gram) ameliorent la precision sur les homophones mais ne sont pas necessaires. Si les fichiers sont absents, le correcteur se rabat automatiquement sur les regles linguistiques.

Dependances

  • lectura-lexique : acces au lexique francais (formes, frequences, POS, morphologie)

Licence

Ce module est distribue sous licence AGPL-3.0 (non commerciale) — voir LICENCE.txt.

Pour un usage commercial, contacter contact@lec-tu-ra.com.

Project details


Download files

Download the file for your platform. If you're not sure which to choose, learn more about installing packages.

Source Distributions

No source distribution files available for this release.See tutorial on generating distribution archives.

Built Distribution

If you're not sure about the file name format, learn more about wheel file names.

lectura_correcteur-1.0.0-py3-none-any.whl (925.9 kB view details)

Uploaded Python 3

File details

Details for the file lectura_correcteur-1.0.0-py3-none-any.whl.

File metadata

File hashes

Hashes for lectura_correcteur-1.0.0-py3-none-any.whl
Algorithm Hash digest
SHA256 2ec0796167b2a015436acd271247eac2794c16008e894447f4200bd64d5a51b1
MD5 72609147451fec21ba41bb2477d26f00
BLAKE2b-256 b6735522515c1fa7ebe360a8fe0001c5d5951e7260c47fc425c4b6a48d87afda

See more details on using hashes here.

Supported by

AWS Cloud computing and Security Sponsor Datadog Monitoring Depot Continuous Integration Fastly CDN Google Download Analytics Pingdom Monitoring Sentry Error logging StatusPage Status page