Skip to main content

Multi-level text augmentation library for NLP tasks

Project description

nlp_augmentation_library

nlp_augmentation_library — это современная библиотека для аугментации текстовых данных на нескольких уровнях: символном, словесном, синтаксическом и генеративном. Она предназначена для повышения качества моделей обработки естественного языка (NLP) путем расширения объема и разнообразия обучающих данных.


Возможности

  • CharAugmentor — аугментация на уровне символов: удаление, вставка, замена, перестановка, изменение регистра.
  • WordAugmentor — аугментация на уровне слов: удаление, вставка, синонимы, контекстная замена, морфологические преобразования, аббревиатуры, преобразование чисел.
  • TextAugmentor — синтаксическая аугментация: перестановка предложений, удаление поддеревьев, парафраз, суммаризация, обратный перевод, crossover.
  • Generator — генеративные методы на базе предобученных моделей Hugging Face.

Установка

Рекомендуется использовать Python версии 3.7 и выше.

pip install nlp_augmentation_library

pip install git+https://github.com/PrithivirajDamodaran/Parrot_Paraphraser.git
pip install https://github.com/explosion/spacy-models/releases/download/en_core_web_md-3.8.0/en_core_web_md-3.8.0-py3-none-any.whl
pip install https://github.com/explosion/spacy-models/releases/download/en_core_web_sm-3.8.0/en_core_web_sm-3.8.0-py3-none-any.whl
pip install torch==2.5.1+cu121 torchvision==0.20.1+cu121 --extra-index-url https://download.pytorch.org/whl/cu121

Project details


Download files

Download the file for your platform. If you're not sure which to choose, learn more about installing packages.

Source Distribution

nlp_augmentation-1.0.2.tar.gz (3.3 kB view details)

Uploaded Source

Built Distribution

If you're not sure about the file name format, learn more about wheel file names.

nlp_augmentation-1.0.2-py3-none-any.whl (2.5 kB view details)

Uploaded Python 3

File details

Details for the file nlp_augmentation-1.0.2.tar.gz.

File metadata

  • Download URL: nlp_augmentation-1.0.2.tar.gz
  • Upload date:
  • Size: 3.3 kB
  • Tags: Source
  • Uploaded using Trusted Publishing? No
  • Uploaded via: twine/6.1.0 CPython/3.10.0

File hashes

Hashes for nlp_augmentation-1.0.2.tar.gz
Algorithm Hash digest
SHA256 213703c5f15faa0c28277d1361f4755b58393aed1caad06804c683414c31468b
MD5 0a7f0ecfe5f65eb2d811b6fe8d522d29
BLAKE2b-256 73ebe6c04cc8f4dd2e2e3bff3eeac56deaa3b79307bb2ea1736c87eb647c086c

See more details on using hashes here.

File details

Details for the file nlp_augmentation-1.0.2-py3-none-any.whl.

File metadata

File hashes

Hashes for nlp_augmentation-1.0.2-py3-none-any.whl
Algorithm Hash digest
SHA256 9ed602c29476bbecb374c28e76097ab9c8f50ef6d1c126eb8269621707077286
MD5 e73fc03b34a84d8967d8b471466d0c10
BLAKE2b-256 1ec245bcdfccbc3f2bbaf929b039763d80f439983c67cb42d2d8e26156062d38

See more details on using hashes here.

Supported by

AWS Cloud computing and Security Sponsor Datadog Monitoring Depot Continuous Integration Fastly CDN Google Download Analytics Pingdom Monitoring Sentry Error logging StatusPage Status page