Russian phonemizer
Project description
RUPhon
RUPhon - это библиотека для фонемизации русского текста, использующая передовые модели RUAccent-encoder.
Особенности
RUPhon - библиотека, позволяющая фонемизировать текст с учетом ударений. Модель поддерживает два языка - английский и русский.
Фонемсет следующий:
k|l|s:|ʒ|t~ɕ|j|'ɐ|iː|fʲ:|ɹ|'ʉ|v|'ɵ|ə+r|d͡ʒ|ʊ|ɫ|ɪ|oː|jɵ|ɔː|ɚ|j:|dʲ:|ʔ|sʲ|ɛː|u|nʲ:|ʃ|d~zʲ|'je|t~s|ɑː|mʲ|ɵ|ɡʲ|jə|d:|jʊ|ɛ|k:|vʲ:|x|nʲ|n|jɪ|zʲ|ɐ|æː|n:|pʲ:|v:|r|l̩|t~ɕ:|'ju|xʲ|'jæ|'ɪ|ɕ|b|aː|o|kʲ:|'ə|ɕ:|dʲ|rʲ|d~ʐ|'ji|tʲ:|w|bʲ|p:|r:|ɝ|eː|ə|t|'ja|'ʊ|b:|mʲ:|'jʉ|'u|z|ju|t~sʲ|ɣ|z:|jæ|ð|je|ʐ|ʂ:|ɜː|ʐ:|ʑ:|lʲ|ɡ:|ɨ|ji|pʲ|ɒ|ɪː|zʲ:|ɔ|θ|ɫ:|fʲ|p|vʲ|i|t~ʂ|'i|'a|ŋ|ɜ|ʊ̯|ɪ̯|n̩|kʲ|'o|uː|f|jʉ|'ɛ|s+_|ɡ|'æ|ʉ|m|s|a|'e|æ|tʲ|h|ɪ+rʲ|m:|ɑ|e|'jɵ|d|sʲ:|ʌ|d~z|lʲ:|t~s+_|m̩|ʂ|ja|t~s:|ɝː|'ɨ|ʍ|t:|t͡ʃ|'jɪ|rʲ:
Установка
pip install ruphon
или
pip install git+https://github.com/Den4ikAI/ruphon.git
Основные функции
Phonemizer.load(model_type, workdir, device)
Загружает модель фонемизатора.
model_type: "small" или "big". small - 14 миллионов параметров, big - 28 миллионовworkdir: директория для сохранения моделей (по умолчанию - директория библиотеки)device: "CPU" или "CUDA" (для использования GPU) (Требуется установить onnxruntime-gpu)
phonemizer.phonemize(text, put_stress, stress_symbol)
Фонемизирует входной текст.
text: входной текст для фонемизацииput_stress: добавлять ли ударения (по умолчанию True)stress_symbol: символ для обозначения ударения (по умолчанию "'")
Использование
from ruphon import RUPhon
phonemizer = RUPhon()
phonemizer = phonemizer.load("small", workdir="./models", device="CPU")
input_text = "+я программ+ирую н+а python."
result = phonemizer.phonemize(input_text, put_stress=True, stress_symbol="'")
print(f"Input: {input_text}")
print(f"Phonemized: {result}")
Использование с автоматической расстановкой ударений
from ruphon import RUPhon
from ruaccent import RUAccent
phonemizer = RUPhon()
phonemizer = phonemizer.load("small", workdir="./models", device="CPU")
accentizer = RUAccent()
accentizer.load(omograph_model_size='turbo3', use_dictionary=True, tiny_mode=False)
input_text = "я программирую на python."
accented_text = accentizer.process_all(input_text)
print(f"Input: {input_text}")
print(f"Accented: {accented_text}")
result = phonemizer.phonemize(accented_text, put_stress=True, stress_symbol="'")
print(f"Phonemized: {result}")
Донат
Вы можете поддержать проект деньгами. Это поможет быстрее разрабатывать более качественные новые версии. CloudTips: https://pay.cloudtips.ru/p/b9d86686
Project details
Release history Release notifications | RSS feed
Download files
Download the file for your platform. If you're not sure which to choose, learn more about installing packages.
Source Distribution
Built Distribution
Filter files by name, interpreter, ABI, and platform.
If you're not sure about the file name format, learn more about wheel file names.
Copy a direct link to the current filters
File details
Details for the file ruphon-1.3.tar.gz.
File metadata
- Download URL: ruphon-1.3.tar.gz
- Upload date:
- Size: 14.1 kB
- Tags: Source
- Uploaded using Trusted Publishing? No
- Uploaded via: python-requests/2.31.0
File hashes
| Algorithm | Hash digest | |
|---|---|---|
| SHA256 |
ca8cf4c1d166cf85a08d03343d703ece25cf29bcfeae79785faebbf88f95db1d
|
|
| MD5 |
93ae8800ad23aa55c4ea0c6d9134a11f
|
|
| BLAKE2b-256 |
6a899e72630ee1d3bdd8f92955c8292fd4a607efd47c4d1b64671308a0e600cb
|
File details
Details for the file ruphon-1.3-py2.py3-none-any.whl.
File metadata
- Download URL: ruphon-1.3-py2.py3-none-any.whl
- Upload date:
- Size: 18.7 kB
- Tags: Python 2, Python 3
- Uploaded using Trusted Publishing? No
- Uploaded via: python-requests/2.31.0
File hashes
| Algorithm | Hash digest | |
|---|---|---|
| SHA256 |
11aec5e4423aff92154ea66c4644ee1e98880bad1c38f3d4b324d525cca164d1
|
|
| MD5 |
8444532d589c10b3eee5a301f37495c9
|
|
| BLAKE2b-256 |
5750cfb682e46e2a482b810d5f1bb05e7065a423a34dcaeb783b5bc248f4ba8f
|