Skip to main content

Russian accentizer

Project description

RUAccent

RUAccent - это библиотека для автоматической расстановки ударений на русском языке.

Установка

С помощью pip

pip install ruaccent

С помощью GIT

pip install git+https://github.com/Den4ikAI/ruaccent.git

Параметры работы

load(omograph_model_size='big', use_dictionary=False, custom_dict={}, custom_homographs={}
  • На данный момент доступны две модели: big (рекомендуется к использованию) и small.
  • Модель big имеет 178 миллионов параметров, а small 10 миллионов
  • Переменная use_dict отвечает за загрузку всего словаря (требуется больше ОЗУ), иначе все ударения расставляет нейросеть.
  • Переменная custom_homographs отвечает за добавление своих омографов. Формат такой: {'слово-омограф': ['вариант ударения 1', 'вариант ударения 2']}.
  • Функция custom_dict отвечает за добавление своих вариантов ударений в словарь. Формат такой: {'слово': 'сл+ово с удар+ением'}

Пример использования

from ruaccent import RUAccent

accentizer = RUAccent()
accentizer.load(omograph_model_size='big', dict_load_startup=False, disable_accent_dict=False)

text = 'на двери висит замок.'
print(text_processor.process_all(text))

text = 'ежик нашел в лесу ягоды.'
print(text_processor.process_yo(text))

Датасеты

  • Датасет собранный с НКРЯ Warning!!! Много поэзии!
  • Датасет словосочетаний и предложений собранных со всего интернета
  • Датасет использовавшийся для обучения моделей акцентуатора

Файлы моделей и словарей располагаются по ссылке. Мы будем признательны фидбеку на telegram аккаунт

Project details


Download files

Download the file for your platform. If you're not sure which to choose, learn more about installing packages.

Source Distribution

ruaccent-1.5.0.tar.gz (8.4 kB view details)

Uploaded Source

Built Distribution

ruaccent-1.5.0-py2.py3-none-any.whl (9.1 kB view details)

Uploaded Python 2 Python 3

File details

Details for the file ruaccent-1.5.0.tar.gz.

File metadata

  • Download URL: ruaccent-1.5.0.tar.gz
  • Upload date:
  • Size: 8.4 kB
  • Tags: Source
  • Uploaded using Trusted Publishing? No
  • Uploaded via: python-requests/2.30.0

File hashes

Hashes for ruaccent-1.5.0.tar.gz
Algorithm Hash digest
SHA256 c617b480347e389694d4775035c3d5699293dc5b8baa3cc388d9561554d66137
MD5 dfc1411a49849c1ff550c7c12c0d1772
BLAKE2b-256 8d3950fe7357b78ef87eb968c32ede47836f5debbd1d0e144bb053fe51acb632

See more details on using hashes here.

File details

Details for the file ruaccent-1.5.0-py2.py3-none-any.whl.

File metadata

  • Download URL: ruaccent-1.5.0-py2.py3-none-any.whl
  • Upload date:
  • Size: 9.1 kB
  • Tags: Python 2, Python 3
  • Uploaded using Trusted Publishing? No
  • Uploaded via: python-requests/2.30.0

File hashes

Hashes for ruaccent-1.5.0-py2.py3-none-any.whl
Algorithm Hash digest
SHA256 219e3c098a2b883b876313b4f70e14456392ed2f368b02772b1f2395ce943d96
MD5 06dfa6156a27622ac3490cfc3ad6a186
BLAKE2b-256 62dc209b2e7f9593a2b5779999fbde91ad75c2d838113f125489ff133ccdbfca

See more details on using hashes here.

Supported by

AWS AWS Cloud computing and Security Sponsor Datadog Datadog Monitoring Fastly Fastly CDN Google Google Download Analytics Microsoft Microsoft PSF Sponsor Pingdom Pingdom Monitoring Sentry Sentry Error logging StatusPage StatusPage Status page