russian text to speech
Project description
Russian TTS inference
Установка
Вы можете установить пакет с помощью pip:
pip install RUTTS
Также вы можете установить используя Git:
pip install -e git+https://github.com/Tera2Space/RUTTS#egg=RUTTS
Ошибки
1)Если на Windows у вас ошибка при установке,нужно просто скачать Visual Studio здесь и при установке выбрать галочку около Разработка классических приложений на С++
2)Если после установки не работает что-то, убедитесь что модуль скачан последней версии(удалить и скачать) и так же что названия моделей есть на https://huggingface.co/TeraTTS
3)Если ничего не помогло обратитесь за помощью в https://t.me/teraspace_chat
Использование
from RUTTS import TTS
# Создание модели TTS с указанным именем
# Примечание: Вы можете найти все модели по адресу https://huggingface.co/TeraTTS, включая модель GLADOS
tts = TTS("TeraTTS/natasha-g2p-vits", add_time_to_end=0.8) # Вы можете настроить 'add_time_to_end' для продолжительности аудио
text = "Привет, мир!"
# Опционально: Предобработка текста (улучшает качество)
from ruaccent import RUAccent
accentizer = RUAccent(workdir="./model")
# Загрузка моделей акцентуации и словарей
# Доступны две модели: 'medium' (рекомендуется) и 'small'.
# Переменная 'dict_load_startup' управляет загрузкой словаря при запуске (больше памяти) или загрузкой его по мере необходимости во время выполнения (экономия памяти, но медленнее).
# Переменная disable_accent_dict отключает использование словаря (все ударения расставляет нейросеть). Данная функция экономит ОЗУ, по скорости работы сопоставима со всем словарём в ОЗУ.
accentizer.load(omograph_model_size='medium', dict_load_startup=False)
# Обработка текста с учетом ударений и буквы ё
text = accentizer.process_all(text)
print(f"Текст с ударениями и ё: {text}")
# Синтез речи
# 'length_scale' можно использовать для замедления аудио для лучшего звучания (по умолчанию 1.2, указано здесь для примера)
audio = tts(text, length_scale=1.2) # Создать аудио. Можно добавить ударения, используя '+'
tts.play_audio(audio) # Воспроизвести созданное аудио
tts.save_wav(audio, "./test.wav") # Сохранить аудио в файл
# Создать аудио и сразу его воспроизвести
tts(text, play=True, length_scale=1.2)
Project details
Download files
Download the file for your platform. If you're not sure which to choose, learn more about installing packages.
Source Distribution
RUTTS-0.1.12.tar.gz
(8.6 kB
view details)
Built Distribution
File details
Details for the file RUTTS-0.1.12.tar.gz
.
File metadata
- Download URL: RUTTS-0.1.12.tar.gz
- Upload date:
- Size: 8.6 kB
- Tags: Source
- Uploaded using Trusted Publishing? No
- Uploaded via: twine/4.0.2 CPython/3.10.12
File hashes
Algorithm | Hash digest | |
---|---|---|
SHA256 | e51aa8f32e379ea7d8c4a6d39d92a2d4805b8465feb22f2d4effe5f4797d0088 |
|
MD5 | fd2dac81728d0aa38557f5821b4b35c7 |
|
BLAKE2b-256 | 5638bc18d68b97513e058b21130bbe505acc578c202fb5fd74c61d0a9b087421 |
File details
Details for the file RUTTS-0.1.12-py3-none-any.whl
.
File metadata
- Download URL: RUTTS-0.1.12-py3-none-any.whl
- Upload date:
- Size: 7.9 kB
- Tags: Python 3
- Uploaded using Trusted Publishing? No
- Uploaded via: twine/4.0.2 CPython/3.10.12
File hashes
Algorithm | Hash digest | |
---|---|---|
SHA256 | 4a32ca79a5347ab601476a03e3d37a8f6769fa07b67133ff461ea512a0fad2b8 |
|
MD5 | be7652e369302f5ddb38f6eaa032f4b9 |
|
BLAKE2b-256 | 210ef686fd36a41ef30121d7e28f7a8863695d1039bdac2fb4d6fd7e72322db6 |