Skip to main content

Russian accentizer

Project description

RUAccent

RUAccent - это библиотека для автоматической расстановки ударений на русском языке.

Установка

Требуется установленный GIT

pip install git+https://github.com/Den4ikAI/ruaccent.git

Методы

RUAccent предоставляет следующие методы:

  • load(omograph_model_size='medium', dict_load_startup=False), disable_accent_dict=False: Загрузка моделей и словарей. На данные момент доступны две модели: medium (рекомендуется к использованию) и small. Переменная dict_load_startup отвечает за загрузку всего словаря (требуется больше ОЗУ), либо во время работы для необходимых слов (экономит ОЗУ, но требует быстрыq ЖД и работает медленее). Переменная disable_accent_dict отключает использование словаря (все ударения расставляет нейросеть). Данная функция экономит ОЗУ, по скорости работы сопоставима со всем словарём в ОЗУ.

  • process_all(text): Обрабатывает текст всем сразу (ёфикация, расстановка ударений и расстановка ударений в словах-омографах)

  • process_omographs(text): Расстановка ударений только в омографах.

  • process_yo(text): Ёфикация текста.

Пример использования

from ruaccent import RUAccent

accentizer = RUAccent()
accentizer.load(omograph_model_size='medium', dict_load_startup=False, disable_accent_dict=False)

text = 'на двери висит замок'
print(text_processor.process_all(text))

text = 'ежик нашел в лесу ягоды'
print(text_processor.process_yo(text))

Файлы моделей и словарей располагаются по ссылке. Датасеты будут скоро опубликованы. Мы будем признательны, если вы будете расширять словари и загружать их в репозиторий. Это поможет улучшать данный проект.

Project details


Download files

Download the file for your platform. If you're not sure which to choose, learn more about installing packages.

Source Distribution

ruaccent-1.2.0.tar.gz (5.9 kB view details)

Uploaded Source

Built Distribution

ruaccent-1.2.0-py2.py3-none-any.whl (7.3 kB view details)

Uploaded Python 2 Python 3

File details

Details for the file ruaccent-1.2.0.tar.gz.

File metadata

  • Download URL: ruaccent-1.2.0.tar.gz
  • Upload date:
  • Size: 5.9 kB
  • Tags: Source
  • Uploaded using Trusted Publishing? No
  • Uploaded via: python-requests/2.30.0

File hashes

Hashes for ruaccent-1.2.0.tar.gz
Algorithm Hash digest
SHA256 dc3fdb802c92f4ea5f1d82086c425c3f04d9bd5e03ed679fe58af7e0bd26304a
MD5 b5e2a189ce466ddb5ec0dcf0a6e56006
BLAKE2b-256 ae216486fbbf25e5ce06ad51022dddae5a1921cfb0140c231c54b0084d1cee35

See more details on using hashes here.

File details

Details for the file ruaccent-1.2.0-py2.py3-none-any.whl.

File metadata

  • Download URL: ruaccent-1.2.0-py2.py3-none-any.whl
  • Upload date:
  • Size: 7.3 kB
  • Tags: Python 2, Python 3
  • Uploaded using Trusted Publishing? No
  • Uploaded via: python-requests/2.30.0

File hashes

Hashes for ruaccent-1.2.0-py2.py3-none-any.whl
Algorithm Hash digest
SHA256 f2a737e15487ab01f2bce89fb186fb6705f94a2b100a9b06e7b771aa45532aa2
MD5 9948f2ab9c1546bdd8250b9df86da134
BLAKE2b-256 a7ff612f5cac8bc8c58f35321d39f6892f807f3a8d76d297bf3b1057aabdaa8a

See more details on using hashes here.

Supported by

AWS AWS Cloud computing and Security Sponsor Datadog Datadog Monitoring Fastly Fastly CDN Google Google Download Analytics Microsoft Microsoft PSF Sponsor Pingdom Pingdom Monitoring Sentry Sentry Error logging StatusPage StatusPage Status page