Ce package highlight les entités dans un pdf
Project description
NER-API
Ce package permet le traitemnt du texte , l'extraction des entités(inclus code swift et code imo), ainsi que le highlighting des ces entités présente dans un fichier pdf
Installation
pip install nerforpdf
Usage/Exemples
import nerforpdf as nfp
nerforpdf.text_preprocessing.text_preprocessing(text,accented=True,stopw=True,punctuation=True,lowercase=True,lemmatize=True,spelling=True,expand_contraction=True,urls=True)
cette fonction permet de traiter le text en utilisant les foltres présents comme argument
import nerforpdf as nfp
nerforpdf.text_preprocessing.spacy_preprocessing(text,lowercase=True,stopw=True,punctuation=True,alphabetic=True,lemmatize=True,)
Permet de faire du traitement du texte à l'aide de spacy
import nerforpdf as nfp
nerforpdf.highlight_pdf.output(input_file)
cette fonction prend en argument le chemin vers un fichier pdf , extrait les entités(code swift et imo inclus),les highlight , et enregistre le pdf highlighté dans le dossier courant sous le nom "output.pdf"
API Reference
get_entities(text)
Prend un texte(String) et retourne ses entités
highlight_pdf(pdf)
Prend le pdf encodé en base64 et retourne le pdf highlighté encodé en base64 ainsi que les entités détectées
Screenshots
highlited pdf original
Project details
Release history Release notifications | RSS feed
Download files
Download the file for your platform. If you're not sure which to choose, learn more about installing packages.
Source Distribution
Built Distribution
Hashes for nerforpdf-0.0.3-py3-none-any.whl
Algorithm | Hash digest | |
---|---|---|
SHA256 | 9a30fb5b8749730269986a2f7d010a409cd5d26fcced37d6d07028fa9f23a986 |
|
MD5 | cd1ff9256794b88361b07d5fd29a8372 |
|
BLAKE2b-256 | 8aaadc24dbee9f2dd06b921e2ed5bfc8ef0ec45cc0513c7289f0c02d2f75bb62 |