Skip to main content

Russian accentizer

Project description

RUAccent

RUAccent - это библиотека для автоматической расстановки ударений на русском языке.

Установка

С помощью pip

pip install ruaccent

С помощью GIT

pip install git+https://github.com/Den4ikAI/ruaccent.git

Параметры работы

load(omograph_model_size='big_poetry', use_dictionary=True, custom_dict={})
  • На данный момент доступно 6 моделей. big (рекомендуется к использованию), medium и small. Рекомендуются к использованию модели версии poetry. Их названия big_poetry, medium_poetry, small_poetry.

  • Модель big имеет 178 миллионов параметров, medium 85 миллионов, а small 12 миллионов

  • Переменная use_dictionary отвечает за загрузку всего словаря (требуется больше ОЗУ), иначе все ударения расставляет нейросеть.

  • Функция custom_dict отвечает за добавление своих вариантов ударений в словарь. Формат такой: {'слово': 'сл+ово с удар+ением'}

    Для работы требуется 5 гигабайт ОЗУ

Пример использования

from ruaccent import RUAccent

accentizer = RUAccent()
accentizer.load(omograph_model_size='big_poetry', use_dictionary=True)

text = 'на двери висит замок.'
print(accentizer.process_all(text))

text = 'ежик нашел в лесу ягоды.'
print(accentizer.process_yo(text))

Датасеты

  • Датасет собранный с НКРЯ
  • Датасет использовавшийся для обучения моделей акцентуатора (версия только с прозой)
  • Датасет использовавшийся для обучения моделей акцентуатора (версия проза + поэзия)

Файлы моделей и словарей располагаются по ссылке. Мы будем признательны фидбеку на telegram аккаунт

Project details


Download files

Download the file for your platform. If you're not sure which to choose, learn more about installing packages.

Source Distribution

ruaccent-1.5.5.2.tar.gz (23.0 kB view details)

Uploaded Source

Built Distribution

ruaccent-1.5.5.2-py2.py3-none-any.whl (40.4 kB view details)

Uploaded Python 2 Python 3

File details

Details for the file ruaccent-1.5.5.2.tar.gz.

File metadata

  • Download URL: ruaccent-1.5.5.2.tar.gz
  • Upload date:
  • Size: 23.0 kB
  • Tags: Source
  • Uploaded using Trusted Publishing? No
  • Uploaded via: python-requests/2.30.0

File hashes

Hashes for ruaccent-1.5.5.2.tar.gz
Algorithm Hash digest
SHA256 45458fadb633589a7a840b2525e70118c2a42cb61f5f7e34ada807c078212e33
MD5 f1b978061714e0ad543a4eee667b24c8
BLAKE2b-256 184a7571047244cd6e64ebef0500a9000b943c09c560031897086de416485a00

See more details on using hashes here.

File details

Details for the file ruaccent-1.5.5.2-py2.py3-none-any.whl.

File metadata

File hashes

Hashes for ruaccent-1.5.5.2-py2.py3-none-any.whl
Algorithm Hash digest
SHA256 324b6dc4e008716030fd909f241d8619c6d51c03d0fe2504972a71d5497ff308
MD5 666fcaa9657d9ebe362a07fad654c270
BLAKE2b-256 d57160b0d4ae626d917f07b259c74b798538583fc41844e41efea76d78575dbb

See more details on using hashes here.

Supported by

AWS AWS Cloud computing and Security Sponsor Datadog Datadog Monitoring Fastly Fastly CDN Google Google Download Analytics Microsoft Microsoft PSF Sponsor Pingdom Pingdom Monitoring Sentry Sentry Error logging StatusPage StatusPage Status page