Skip to main content

Russian accentizer

Project description

RUAccent

RUAccent - это библиотека для автоматической расстановки ударений на русском языке.

Установка

С помощью pip

pip install ruaccent

С помощью GIT

pip install git+https://github.com/Den4ikAI/ruaccent.git

Методы

RUAccent предоставляет следующие методы:

  • load(omograph_model_size='medium', dict_load_startup=False), disable_accent_dict=False: Загрузка моделей и словарей. На данные момент доступны две модели: medium (рекомендуется к использованию) и small. Переменная dict_load_startup отвечает за загрузку всего словаря (требуется больше ОЗУ), либо во время работы для необходимых слов (экономит ОЗУ, но требует быстрыq ЖД и работает медленее). Переменная disable_accent_dict отключает использование словаря (все ударения расставляет нейросеть). Данная функция экономит ОЗУ, по скорости работы сопоставима со всем словарём в ОЗУ.

  • process_all(text): Обрабатывает текст всем сразу (ёфикация, расстановка ударений и расстановка ударений в словах-омографах)

  • process_omographs(text): Расстановка ударений только в омографах.

  • process_yo(text): Ёфикация текста.

Пример использования

from ruaccent import RUAccent

accentizer = RUAccent()
accentizer.load(omograph_model_size='medium', dict_load_startup=False, disable_accent_dict=False)

text = 'на двери висит замок'
print(text_processor.process_all(text))

text = 'ежик нашел в лесу ягоды'
print(text_processor.process_yo(text))

Файлы моделей и словарей располагаются по ссылке. Датасеты будут скоро опубликованы. Мы будем признательны, если вы будете расширять словари и загружать их в репозиторий. Это поможет улучшать данный проект.

Project details


Download files

Download the file for your platform. If you're not sure which to choose, learn more about installing packages.

Source Distribution

ruaccent-1.2.2.tar.gz (8.6 kB view details)

Uploaded Source

Built Distribution

ruaccent-1.2.2-py2.py3-none-any.whl (9.3 kB view details)

Uploaded Python 2 Python 3

File details

Details for the file ruaccent-1.2.2.tar.gz.

File metadata

  • Download URL: ruaccent-1.2.2.tar.gz
  • Upload date:
  • Size: 8.6 kB
  • Tags: Source
  • Uploaded using Trusted Publishing? No
  • Uploaded via: python-requests/2.30.0

File hashes

Hashes for ruaccent-1.2.2.tar.gz
Algorithm Hash digest
SHA256 3a3619a9c46ceffe89309d5a9f42e58639b943998df4698ff655a2e946432be2
MD5 1840b3864b9b1873ace075f897a9dba8
BLAKE2b-256 593d00f427af0dc6d839dbb616087a9be7ebf3cfee7c6f65c2d579ad1b954560

See more details on using hashes here.

File details

Details for the file ruaccent-1.2.2-py2.py3-none-any.whl.

File metadata

  • Download URL: ruaccent-1.2.2-py2.py3-none-any.whl
  • Upload date:
  • Size: 9.3 kB
  • Tags: Python 2, Python 3
  • Uploaded using Trusted Publishing? No
  • Uploaded via: python-requests/2.30.0

File hashes

Hashes for ruaccent-1.2.2-py2.py3-none-any.whl
Algorithm Hash digest
SHA256 83315ba82cd502d72bc09fb6d034bc1619cc3cb3be76598625d4b74395f90db6
MD5 a7b23f2f202994b8f3b2806da4287418
BLAKE2b-256 96f3250d720eba147f95f752be30002dd5a621746015e46a959131a61346edca

See more details on using hashes here.

Supported by

AWS AWS Cloud computing and Security Sponsor Datadog Datadog Monitoring Fastly Fastly CDN Google Google Download Analytics Microsoft Microsoft PSF Sponsor Pingdom Pingdom Monitoring Sentry Sentry Error logging StatusPage StatusPage Status page