Russian accentizer
Project description
RUAccent
RUAccent - это библиотека для автоматической расстановки ударений на русском языке.
По вопросам коммерческого использования пишите на telegram аккаунт
Установка
С помощью pip
pip install ruaccent
С помощью GIT
pip install git+https://github.com/Den4ikAI/ruaccent.git
Параметры работы
load(omograph_model_size='turbo2', use_dictionary=True, custom_dict={}, device="CPU", workdir=None)
-
На данный момент доступно 6 моделей - tiny, tiny2, tiny2.1, turbo2, turbo3, turbo3.1, turbo, big_poetry.
-
Переменная use_dictionary отвечает за загрузку всего словаря (требуется больше ОЗУ), иначе все ударения расставляет нейросеть.
-
Функция custom_dict отвечает за добавление своих вариантов ударений в словарь. Формат такой:
{'слово': 'сл+ово с удар+ением'}
-
Выбор устройства CPU или CUDA. Для работы с CUDA требуется установить onnxruntime-gpu и CUDA.
-
workdir - принимает строку. Является путём, куда скачиваются модели.
-
tiny_mode - принимает True или False. При True отключает руловый пайплайн и часть моделей. Также не загружается словарь ударений.
Для стабильной работы требуется минимум 512 мегабайт ОЗУ (модель омографов - tiny)
Пример использования
from ruaccent import RUAccent
accentizer = RUAccent()
accentizer.load(omograph_model_size='turbo3.1', use_dictionary=True, tiny_mode=False)
text = 'на двери висит замок.'
print(accentizer.process_all(text))
Файлы моделей и словарей располагаются по ссылке. Мы будем признательны фидбеку на telegram аккаунт
Донат
Вы можете поддержать проект деньгами. Это поможет быстрее разрабатывать более качественные новые версии. CloudTips: https://pay.cloudtips.ru/p/b9d86686
Project details
Release history Release notifications | RSS feed
Download files
Download the file for your platform. If you're not sure which to choose, learn more about installing packages.
Source Distribution
Built Distribution
File details
Details for the file ruaccent-1.5.8.2.tar.gz
.
File metadata
- Download URL: ruaccent-1.5.8.2.tar.gz
- Upload date:
- Size: 19.1 kB
- Tags: Source
- Uploaded using Trusted Publishing? No
- Uploaded via: python-requests/2.31.0
File hashes
Algorithm | Hash digest | |
---|---|---|
SHA256 | 09f0ad14dfe3b8ffefebc808afc18039f3df7191cec2d3349376f96742388654 |
|
MD5 | 8c843484ec30c566c03559e7d33f88fd |
|
BLAKE2b-256 | ba0c0d898246c3fae11ff5e38ebbb38450b5ca566233ac4d59713b82e5a9598b |
File details
Details for the file ruaccent-1.5.8.2-py2.py3-none-any.whl
.
File metadata
- Download URL: ruaccent-1.5.8.2-py2.py3-none-any.whl
- Upload date:
- Size: 22.2 kB
- Tags: Python 2, Python 3
- Uploaded using Trusted Publishing? No
- Uploaded via: python-requests/2.31.0
File hashes
Algorithm | Hash digest | |
---|---|---|
SHA256 | 79282493454fd9c18ff44018092d728d7314dbf9aac3470af39e5e9306bd2fcc |
|
MD5 | 19c4ef5fd8d896d02f87a9f66d6220f0 |
|
BLAKE2b-256 | 20b06e8ccca36c47230435b7f731a7f7dd248db6eb408ae79c44477c74902c0a |