russian text to speech
Project description
Russian TTS inference
Установка
1)Установка пакета:
a) скачать из pypi: pip install RUTTS
b) из гита (нужен установленный гит) pip install -e git+https://github.com/Tera2Space/RUTTS#egg=RUTTS
Ошибки
1)Если на винде у вас ошибка при установке,нужно просто скачать Visual Studio здесь и при установке выбрать галочку около Разработка классических приложений на С++
2)Если после установки не работает что-то, убедитесь что модуль скачан последней версии(удалить и скачать) и так же что названия моделей есть на https://huggingface.co/TeraTTS
Использование
from RUTTS import TTS
#! Cоздать модель по имени
# P.S все модели https://huggingface.co/TeraTTS P.S там есть модель для GLADOS
tts = TTS("TeraTTS/natasha-g2p-vits") # Можно передать параметр add_time_to_end (по умолчанию = 0.8) это кол-во добавленных секунд в аудио для хорошего звучания
text = "Привет мир!"
print(f"Текст: {text}")
#! Предобработка текста (это по желанию, но сильно улучшает качество!) для этого вам нужно будет `pip install transformers torch==1.13.1`
from RUTTS.ruaccent import RUAccent #https://github.com/Den4ikAI/ruaccent
accentizer = RUAccent(workdir="./model")#allow_cuda=False что бы отключить использование видеокарты
# load(omograph_model_size='medium', dict_load_startup=False):
# Загрузка моделей и словарей. На данные момент доступны две модели: medium (рекомендуется к использованию) и small.
# Переменная dict_load_startup отвечает за загрузку всего словаря (требуется больше ОЗУ),
# либо во время работы для необходимых слов (экономит ОЗУ, но требует быстрые ЖД и работает медленее)
accentizer.load(omograph_model_size='medium', dict_load_startup=False)
text = accentizer.process_all(text)
print(f"Текст с ударениями и ё: {text}")
#! Синтез
#lenght_scale - замедлить аудио для хорошего звучания, параметр по умолчанию передается как 1.2, указан для примера
audio = tts(text, lenght_scale=1.2) # Создать аудио. Можно ставить ударения используя +
tts.play_audio(audio) # Проиграть созданное аудио
tts.save_wav(audio, "./test.wav") # Сохранить аудио
tts(text, play=True, lenght_scale=1.2) # Создать аудио и сразу проиграть его
Project details
Download files
Download the file for your platform. If you're not sure which to choose, learn more about installing packages.
Source Distribution
RUTTS-0.1.10.tar.gz
(11.5 kB
view details)
Built Distribution
RUTTS-0.1.10-py3-none-any.whl
(12.2 kB
view details)
File details
Details for the file RUTTS-0.1.10.tar.gz
.
File metadata
- Download URL: RUTTS-0.1.10.tar.gz
- Upload date:
- Size: 11.5 kB
- Tags: Source
- Uploaded using Trusted Publishing? No
- Uploaded via: twine/4.0.2 CPython/3.10.6
File hashes
Algorithm | Hash digest | |
---|---|---|
SHA256 | a40f8e88b3565aa8a83b014e587980962d6e20ba218c8063d457893533805122 |
|
MD5 | 7485656d99dd320486a72efbdad9df92 |
|
BLAKE2b-256 | a55f7919d2c57dac68f5de1f807c684b4a6cadcf635d8423181a4e5ce06a8977 |
File details
Details for the file RUTTS-0.1.10-py3-none-any.whl
.
File metadata
- Download URL: RUTTS-0.1.10-py3-none-any.whl
- Upload date:
- Size: 12.2 kB
- Tags: Python 3
- Uploaded using Trusted Publishing? No
- Uploaded via: twine/4.0.2 CPython/3.10.6
File hashes
Algorithm | Hash digest | |
---|---|---|
SHA256 | 17f3eb8a5811e15f0439b127f6a955708aeb26188e9e234b365e8954ffd13207 |
|
MD5 | 7899622e53a53ee147a01cd10c61b7e5 |
|
BLAKE2b-256 | 8aebbf1b0b50c73caf8975b66361767e5fb3696e77db1de46fcbbe9caf289f14 |