Russian accentizer
Project description
RUAccent
RUAccent - это библиотека для автоматической расстановки ударений на русском языке.
Установка
Требуется установленный GIT
pip install git+https://github.com/Den4ikAI/ruaccent.git
Методы
RUAccent предоставляет следующие методы:
-
load(omograph_model_size='medium', dict_load_startup=False), disable_accent_dict=False
: Загрузка моделей и словарей. На данные момент доступны две модели: medium (рекомендуется к использованию) и small. Переменная dict_load_startup отвечает за загрузку всего словаря (требуется больше ОЗУ), либо во время работы для необходимых слов (экономит ОЗУ, но требует быстрыq ЖД и работает медленее). Переменная disable_accent_dict отключает использование словаря (все ударения расставляет нейросеть). Данная функция экономит ОЗУ, по скорости работы сопоставима со всем словарём в ОЗУ. -
process_all(text)
: Обрабатывает текст всем сразу (ёфикация, расстановка ударений и расстановка ударений в словах-омографах) -
process_omographs(text)
: Расстановка ударений только в омографах. -
process_yo(text)
: Ёфикация текста.
Пример использования
from ruaccent import RUAccent
accentizer = RUAccent()
accentizer.load(omograph_model_size='medium', dict_load_startup=False, disable_accent_dict=False)
text = 'на двери висит замок'
print(text_processor.process_all(text))
text = 'ежик нашел в лесу ягоды'
print(text_processor.process_yo(text))
Файлы моделей и словарей располагаются по ссылке. Датасеты будут скоро опубликованы. Мы будем признательны, если вы будете расширять словари и загружать их в репозиторий. Это поможет улучшать данный проект.
Project details
Release history Release notifications | RSS feed
Download files
Download the file for your platform. If you're not sure which to choose, learn more about installing packages.
Source Distribution
Built Distribution
File details
Details for the file ruaccent-1.2.0.tar.gz
.
File metadata
- Download URL: ruaccent-1.2.0.tar.gz
- Upload date:
- Size: 5.9 kB
- Tags: Source
- Uploaded using Trusted Publishing? No
- Uploaded via: python-requests/2.30.0
File hashes
Algorithm | Hash digest | |
---|---|---|
SHA256 | dc3fdb802c92f4ea5f1d82086c425c3f04d9bd5e03ed679fe58af7e0bd26304a |
|
MD5 | b5e2a189ce466ddb5ec0dcf0a6e56006 |
|
BLAKE2b-256 | ae216486fbbf25e5ce06ad51022dddae5a1921cfb0140c231c54b0084d1cee35 |
File details
Details for the file ruaccent-1.2.0-py2.py3-none-any.whl
.
File metadata
- Download URL: ruaccent-1.2.0-py2.py3-none-any.whl
- Upload date:
- Size: 7.3 kB
- Tags: Python 2, Python 3
- Uploaded using Trusted Publishing? No
- Uploaded via: python-requests/2.30.0
File hashes
Algorithm | Hash digest | |
---|---|---|
SHA256 | f2a737e15487ab01f2bce89fb186fb6705f94a2b100a9b06e7b771aa45532aa2 |
|
MD5 | 9948f2ab9c1546bdd8250b9df86da134 |
|
BLAKE2b-256 | a7ff612f5cac8bc8c58f35321d39f6892f807f3a8d76d297bf3b1057aabdaa8a |