Skip to main content

Russian accentizer

Project description

RUAccent

RUAccent - это библиотека для автоматической расстановки ударений на русском языке.

Установка

С помощью pip

pip install ruaccent

С помощью GIT

pip install git+https://github.com/Den4ikAI/ruaccent.git

Параметры работы

load(omograph_model_size='big_poetry', use_dictionary=True, custom_dict={})
  • На данный момент доступно 6 моделей. big (рекомендуется к использованию), medium и small. Рекомендуются к использованию модели версии poetry. Их названия big_poetry, medium_poetry, small_poetry.

  • Модель big имеет 178 миллионов параметров, medium 85 миллионов, а small 12 миллионов

  • Переменная use_dictionary отвечает за загрузку всего словаря (требуется больше ОЗУ), иначе все ударения расставляет нейросеть.

  • Функция custom_dict отвечает за добавление своих вариантов ударений в словарь. Формат такой: {'слово': 'сл+ово с удар+ением'}

    Для работы требуется 5 гигабайт ОЗУ

Пример использования

from ruaccent import RUAccent

accentizer = RUAccent()
accentizer.load(omograph_model_size='big_poetry', use_dictionary=True)

text = 'на двери висит замок.'
print(accentizer.process_all(text))

text = 'ежик нашел в лесу ягоды.'
print(accentizer.process_yo(text))

Датасеты

  • Датасет собранный с НКРЯ
  • Датасет использовавшийся для обучения моделей акцентуатора (версия только с прозой)
  • Датасет использовавшийся для обучения моделей акцентуатора (версия проза + поэзия)

Файлы моделей и словарей располагаются по ссылке. Мы будем признательны фидбеку на telegram аккаунт

Project details


Download files

Download the file for your platform. If you're not sure which to choose, learn more about installing packages.

Source Distribution

ruaccent-1.5.5.1.tar.gz (23.0 kB view details)

Uploaded Source

Built Distribution

ruaccent-1.5.5.1-py2.py3-none-any.whl (40.4 kB view details)

Uploaded Python 2 Python 3

File details

Details for the file ruaccent-1.5.5.1.tar.gz.

File metadata

  • Download URL: ruaccent-1.5.5.1.tar.gz
  • Upload date:
  • Size: 23.0 kB
  • Tags: Source
  • Uploaded using Trusted Publishing? No
  • Uploaded via: python-requests/2.30.0

File hashes

Hashes for ruaccent-1.5.5.1.tar.gz
Algorithm Hash digest
SHA256 07d9307366ea7797ee02e0dfefd9712d6439ba3b324d7ad951137bd5ce2304a5
MD5 e783d1ba8082d996759eb883a71d8e23
BLAKE2b-256 60151dfa752fd2b135a8b36c0b6aef272e2fce7250909ac8c079c7133a7bd355

See more details on using hashes here.

File details

Details for the file ruaccent-1.5.5.1-py2.py3-none-any.whl.

File metadata

File hashes

Hashes for ruaccent-1.5.5.1-py2.py3-none-any.whl
Algorithm Hash digest
SHA256 54a1f74a9d7c8126c1e2d0c6fbddf7ec288525a0521cc04cfbaa3a2f33539684
MD5 55ca30cf3665c3a83c02d09e18c5ab57
BLAKE2b-256 1412725f8f02c0e93c6e4eb0cf6a01fb0fc3be5486208fa7f451fde867403f97

See more details on using hashes here.

Supported by

AWS AWS Cloud computing and Security Sponsor Datadog Datadog Monitoring Fastly Fastly CDN Google Google Download Analytics Microsoft Microsoft PSF Sponsor Pingdom Pingdom Monitoring Sentry Sentry Error logging StatusPage StatusPage Status page