Библиотека для аугментации текстовых данных на нескольких уровнях
Project description
nlp_augmentation
Библиотека для аугментации текстовых данных на нескольких уровнях — от символов и слов до синтаксиса и генеративных моделей.
Возможности
- CharAugmentor — аугментация на уровне символов: удаление, вставка, замена, перестановка, изменение регистра.
- WordAugmentor — аугментация на уровне слов: удаление, вставка, синонимы, контекстная замена, морфологические преобразования, аббревиатуры, преобразование чисел.
- TextAugmentor — синтаксическая аугментация: перестановка предложений, удаление поддеревьев, парафраз, суммаризация, обратный перевод, crossover.
- Generator — генеративные методы на базе предобученных моделей Hugging Face.
Установка
pip install https://github.com/explosion/spacy-models/releases/download/en_core_web_md-3.8.0/en_core_web_md-3.8.0-py3-none-any.whl
pip install https://github.com/explosion/spacy-models/releases/download/en_core_web_sm-3.8.0/en_core_web_sm-3.8.0-py3-none-any.whl
pip install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu121
nltk.download("stopwords")
nltk.download('wordnet')
nltk.download('punkt_tab')
pip install nlp_augmentation
Project details
Release history Release notifications | RSS feed
Download files
Download the file for your platform. If you're not sure which to choose, learn more about installing packages.
Source Distribution
nlp_augmentation-1.1.1.tar.gz
(48.8 kB
view details)
Built Distribution
Filter files by name, interpreter, ABI, and platform.
If you're not sure about the file name format, learn more about wheel file names.
Copy a direct link to the current filters
File details
Details for the file nlp_augmentation-1.1.1.tar.gz.
File metadata
- Download URL: nlp_augmentation-1.1.1.tar.gz
- Upload date:
- Size: 48.8 kB
- Tags: Source
- Uploaded using Trusted Publishing? No
- Uploaded via: twine/6.1.0 CPython/3.10.0
File hashes
| Algorithm | Hash digest | |
|---|---|---|
| SHA256 |
2a0f0daf3e7f824599f9474f6da1b620ef04c0272842e170909cf920e1d2cfd3
|
|
| MD5 |
945c2af2e04315dcfba4885cabc6cd02
|
|
| BLAKE2b-256 |
4fe27fbd3d32150c616fdd39463ca55173ee82b23ef0226c05594fa95b86dc25
|
File details
Details for the file nlp_augmentation-1.1.1-py3-none-any.whl.
File metadata
- Download URL: nlp_augmentation-1.1.1-py3-none-any.whl
- Upload date:
- Size: 49.7 kB
- Tags: Python 3
- Uploaded using Trusted Publishing? No
- Uploaded via: twine/6.1.0 CPython/3.10.0
File hashes
| Algorithm | Hash digest | |
|---|---|---|
| SHA256 |
16d3dce31847ed7aace63bcf45ea024d99304f63cb3bdadbbd7ef5e709c62881
|
|
| MD5 |
d0e1a822e343f966b090d60007b7677e
|
|
| BLAKE2b-256 |
1ee0fa29cfd04de2d758a986a5463644c549830efc4ff8b62cd7f586529983e8
|