Skip to main content

Russian accentizer

Project description

RUAccent

RUAccent - это библиотека для автоматической расстановки ударений на русском языке.

По вопросам коммерческого использования пишите на telegram аккаунт

Установка

С помощью pip

pip install ruaccent

С помощью GIT

pip install git+https://github.com/Den4ikAI/ruaccent.git

Параметры работы

load(omograph_model_size='turbo2', use_dictionary=True, custom_dict={}, device="CPU", workdir=None)
  • На данный момент доступно 6 моделей - tiny, tiny2, tiny2.1, turbo2, turbo3, turbo3.1, turbo, big_poetry.

  • Переменная use_dictionary отвечает за загрузку всего словаря (требуется больше ОЗУ), иначе все ударения расставляет нейросеть.

  • Функция custom_dict отвечает за добавление своих вариантов ударений в словарь. Формат такой: {'слово': 'сл+ово с удар+ением'}

  • Выбор устройства CPU или CUDA. Для работы с CUDA требуется установить onnxruntime-gpu и CUDA.

  • workdir - принимает строку. Является путём, куда скачиваются модели.

  • tiny_mode - принимает True или False. При True отключает руловый пайплайн и часть моделей. Также не загружается словарь ударений.

    Для стабильной работы требуется минимум 512 мегабайт ОЗУ (модель омографов - tiny)

Пример использования

from ruaccent import RUAccent

accentizer = RUAccent()
accentizer.load(omograph_model_size='turbo3.1', use_dictionary=True, tiny_mode=False)

text = 'на двери висит замок.'
print(accentizer.process_all(text))

Файлы моделей и словарей располагаются по ссылке. Мы будем признательны фидбеку на telegram аккаунт

Донат

Вы можете поддержать проект деньгами. Это поможет быстрее разрабатывать более качественные новые версии. CloudTips: https://pay.cloudtips.ru/p/b9d86686

Project details


Download files

Download the file for your platform. If you're not sure which to choose, learn more about installing packages.

Source Distribution

ruaccent-1.5.8.3.tar.gz (19.2 kB view details)

Uploaded Source

Built Distribution

ruaccent-1.5.8.3-py2.py3-none-any.whl (22.3 kB view details)

Uploaded Python 2 Python 3

File details

Details for the file ruaccent-1.5.8.3.tar.gz.

File metadata

  • Download URL: ruaccent-1.5.8.3.tar.gz
  • Upload date:
  • Size: 19.2 kB
  • Tags: Source
  • Uploaded using Trusted Publishing? No
  • Uploaded via: python-requests/2.31.0

File hashes

Hashes for ruaccent-1.5.8.3.tar.gz
Algorithm Hash digest
SHA256 13434d89497917572ca65be1f8b4dfbed3f4621657fd3bcfa1c844f3af25d5fe
MD5 99b9b7654e6c96da341a449d23eb8258
BLAKE2b-256 8838ba7b9caf3a6875f403eb7ac9674dc3ac0ea3769de641a0e6080e8b2638b9

See more details on using hashes here.

File details

Details for the file ruaccent-1.5.8.3-py2.py3-none-any.whl.

File metadata

File hashes

Hashes for ruaccent-1.5.8.3-py2.py3-none-any.whl
Algorithm Hash digest
SHA256 35c220a07aa9c3c11574a6be7eb5a4dbe4c5f60be58cafb80e9c6d0796eb05b1
MD5 75dc4bdac71b932dd659560c74e5339a
BLAKE2b-256 0fbad0033444205367e6eaeacc6a141013dab67ee483edaa0e0278ac0389a8ce

See more details on using hashes here.

Supported by

AWS AWS Cloud computing and Security Sponsor Datadog Datadog Monitoring Fastly Fastly CDN Google Google Download Analytics Microsoft Microsoft PSF Sponsor Pingdom Pingdom Monitoring Sentry Sentry Error logging StatusPage StatusPage Status page