Skip to main content

Библиотека для аугментации текстовых данных на нескольких уровнях

Project description

nlp_augmentation

Библиотека для аугментации текстовых данных на нескольких уровнях — от символов и слов до синтаксиса и генеративных моделей.


Возможности

  • CharAugmentor — аугментация на уровне символов: удаление, вставка, замена, перестановка, изменение регистра.
  • WordAugmentor — аугментация на уровне слов: удаление, вставка, синонимы, контекстная замена, морфологические преобразования, аббревиатуры, преобразование чисел.
  • TextAugmentor — синтаксическая аугментация: перестановка предложений, удаление поддеревьев, парафраз, суммаризация, обратный перевод, crossover.
  • Generator — генеративные методы на базе предобученных моделей Hugging Face.

Установка

pip install https://github.com/explosion/spacy-models/releases/download/en_core_web_md-3.8.0/en_core_web_md-3.8.0-py3-none-any.whl
pip install https://github.com/explosion/spacy-models/releases/download/en_core_web_sm-3.8.0/en_core_web_sm-3.8.0-py3-none-any.whl
pip install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu121
nltk.download("stopwords")
nltk.download('wordnet')
nltk.download('punkt_tab')
pip install nlp_augmentation

Project details


Download files

Download the file for your platform. If you're not sure which to choose, learn more about installing packages.

Source Distribution

nlp_augmentation-1.1.1.tar.gz (48.8 kB view details)

Uploaded Source

Built Distribution

If you're not sure about the file name format, learn more about wheel file names.

nlp_augmentation-1.1.1-py3-none-any.whl (49.7 kB view details)

Uploaded Python 3

File details

Details for the file nlp_augmentation-1.1.1.tar.gz.

File metadata

  • Download URL: nlp_augmentation-1.1.1.tar.gz
  • Upload date:
  • Size: 48.8 kB
  • Tags: Source
  • Uploaded using Trusted Publishing? No
  • Uploaded via: twine/6.1.0 CPython/3.10.0

File hashes

Hashes for nlp_augmentation-1.1.1.tar.gz
Algorithm Hash digest
SHA256 2a0f0daf3e7f824599f9474f6da1b620ef04c0272842e170909cf920e1d2cfd3
MD5 945c2af2e04315dcfba4885cabc6cd02
BLAKE2b-256 4fe27fbd3d32150c616fdd39463ca55173ee82b23ef0226c05594fa95b86dc25

See more details on using hashes here.

File details

Details for the file nlp_augmentation-1.1.1-py3-none-any.whl.

File metadata

File hashes

Hashes for nlp_augmentation-1.1.1-py3-none-any.whl
Algorithm Hash digest
SHA256 16d3dce31847ed7aace63bcf45ea024d99304f63cb3bdadbbd7ef5e709c62881
MD5 d0e1a822e343f966b090d60007b7677e
BLAKE2b-256 1ee0fa29cfd04de2d758a986a5463644c549830efc4ff8b62cd7f586529983e8

See more details on using hashes here.

Supported by

AWS Cloud computing and Security Sponsor Datadog Monitoring Depot Continuous Integration Fastly CDN Google Download Analytics Pingdom Monitoring Sentry Error logging StatusPage Status page