Skip to main content

Russian accentizer

Project description

RUAccent

RUAccent - это библиотека для автоматической расстановки ударений на русском языке.

Установка

С помощью pip

pip install ruaccent

С помощью GIT

pip install git+https://github.com/Den4ikAI/ruaccent.git

Параметры работы

load(omograph_model_size='big', use_dictionary=False, custom_dict={}, custom_homographs={}
  • На данный момент доступны две модели: big (рекомендуется к использованию) и small.
  • Модель big имеет 178 миллионов параметров, а small 10 миллионов
  • Переменная use_dict отвечает за загрузку всего словаря (требуется больше ОЗУ), иначе все ударения расставляет нейросеть.
  • Переменная custom_homographs отвечает за добавление своих омографов. Формат такой: {'слово-омограф': ['вариант ударения 1', 'вариант ударения 2']}.
  • Функция custom_dict отвечает за добавление своих вариантов ударений в словарь. Формат такой: {'слово': 'сл+ово с удар+ением'}

Пример использования

from ruaccent import RUAccent

accentizer = RUAccent()
accentizer.load(omograph_model_size='big', use_dictionary=False)

text = 'на двери висит замок.'
print(accentizer.process_all(text))

text = 'ежик нашел в лесу ягоды.'
print(accentizer.process_yo(text))

Датасеты

  • Датасет собранный с НКРЯ Warning!!! Много поэзии!
  • Датасет словосочетаний и предложений собранных со всего интернета
  • Датасет использовавшийся для обучения моделей акцентуатора

Файлы моделей и словарей располагаются по ссылке. Мы будем признательны фидбеку на telegram аккаунт

Project details


Download files

Download the file for your platform. If you're not sure which to choose, learn more about installing packages.

Source Distribution

ruaccent-1.5.1.tar.gz (8.3 kB view details)

Uploaded Source

Built Distribution

ruaccent-1.5.1-py2.py3-none-any.whl (9.0 kB view details)

Uploaded Python 2 Python 3

File details

Details for the file ruaccent-1.5.1.tar.gz.

File metadata

  • Download URL: ruaccent-1.5.1.tar.gz
  • Upload date:
  • Size: 8.3 kB
  • Tags: Source
  • Uploaded using Trusted Publishing? No
  • Uploaded via: python-requests/2.30.0

File hashes

Hashes for ruaccent-1.5.1.tar.gz
Algorithm Hash digest
SHA256 fefc0b106e4e0d26d97caf0936aaa27eaf70a71ae393d60f8442de5ed8bd1450
MD5 2257577caa99591ab1230f16b52a4dce
BLAKE2b-256 b080cee424c53e8eeade0ff0140844ec8127baef285c28570e63082994ae2b91

See more details on using hashes here.

File details

Details for the file ruaccent-1.5.1-py2.py3-none-any.whl.

File metadata

  • Download URL: ruaccent-1.5.1-py2.py3-none-any.whl
  • Upload date:
  • Size: 9.0 kB
  • Tags: Python 2, Python 3
  • Uploaded using Trusted Publishing? No
  • Uploaded via: python-requests/2.30.0

File hashes

Hashes for ruaccent-1.5.1-py2.py3-none-any.whl
Algorithm Hash digest
SHA256 486b766ab680ba23b41e1f5a4421387aa96219ee434dc8348314b0b7fe4f2a31
MD5 d9f9bbe5aaf9b78cd12fc178588893ce
BLAKE2b-256 b613c5295530fbd86a9fc9231ac2f50c014859c40ea5ed150b909d831fac8b86

See more details on using hashes here.

Supported by

AWS AWS Cloud computing and Security Sponsor Datadog Datadog Monitoring Fastly Fastly CDN Google Google Download Analytics Microsoft Microsoft PSF Sponsor Pingdom Pingdom Monitoring Sentry Sentry Error logging StatusPage StatusPage Status page