russian text to speech
Project description
Russian TTS inference
Установка
Вы можете установить пакет с помощью pip:
pip install TeraTTS
Также вы можете установить используя Git:
pip install -e git+https://github.com/Tera2Space/RUTTS#egg=TeraTTS
Ошибки
1)Если на Windows у вас ошибка при установке,нужно просто скачать Visual Studio здесь и при установке выбрать галочку около Разработка классических приложений на С++
2)Если после установки не работает что-то, убедитесь что модуль скачан последней версии(удалить и скачать) и так же что названия моделей есть на https://huggingface.co/TeraTTS
3)Если ничего не помогло обратитесь за помощью в https://t.me/teraspace_chat
Использование
text = "Привет, мир!"
from TeraTTS import TTS
# Опционально: Предобработка текста (улучшает качество)
from ruaccent import RUAccent
accentizer = RUAccent(workdir="./model")
# Загрузка моделей акцентуации и словарей
# Доступны две модели: 'medium' (рекомендуется) и 'small'.
# Переменная 'dict_load_startup' управляет загрузкой словаря при запуске (больше памяти) или загрузкой его по мере необходимости во время выполнения (экономия памяти, но медленнее).
# Переменная disable_accent_dict отключает использование словаря (все ударения расставляет нейросеть). Данная функция экономит ОЗУ, по скорости работы сопоставима со всем словарём в ОЗУ.
accentizer.load(omograph_model_size='big_poetry', use_dictionary=True)
# Обработка текста с учетом ударений и буквы ё
text = accentizer.process_all(text)
print(f"Текст с ударениями и ё: {text}")
# Примечание: Вы можете найти все модели по адресу https://huggingface.co/TeraTTS, включая модель GLADOS
tts = TTS("TeraTTS/natasha-g2p-vits", add_time_to_end=1.0, tokenizer_load_dict=True) # Вы можете настроить 'add_time_to_end' для продолжительности аудио, 'tokenizer_load_dict' можно отключить если используете RUAccent
# 'length_scale' можно использовать для замедления аудио для лучшего звучания (по умолчанию 1.1, указано здесь для примера)
audio = tts(text, lenght_scale=1.1) # Создать аудио. Можно добавить ударения, используя '+'
tts.play_audio(audio) # Воспроизвести созданное аудио
tts.save_wav(audio, "./test.wav") # Сохранить аудио в файл
# Создать аудио и сразу его воспроизвести
tts(text, play=True, lenght_scale=1.1)
Project details
Release history Release notifications | RSS feed
Download files
Download the file for your platform. If you're not sure which to choose, learn more about installing packages.
Source Distribution
TeraTTS-1.0.tar.gz
(6.8 kB
view details)
Built Distribution
TeraTTS-1.0-py3-none-any.whl
(7.3 kB
view details)
File details
Details for the file TeraTTS-1.0.tar.gz
.
File metadata
- Download URL: TeraTTS-1.0.tar.gz
- Upload date:
- Size: 6.8 kB
- Tags: Source
- Uploaded using Trusted Publishing? No
- Uploaded via: twine/4.0.2 CPython/3.10.12
File hashes
Algorithm | Hash digest | |
---|---|---|
SHA256 | 26f38bb2a087a953f90c3d0b7d664f7ea10833f0c3a9264108fdddfe4f9468f0 |
|
MD5 | 56d040417bfea113136cebce57b29b6d |
|
BLAKE2b-256 | 29e66ef8830ed4d6174e3bd32b10eecc5e9114a9242db25c6206192161fc54d3 |
File details
Details for the file TeraTTS-1.0-py3-none-any.whl
.
File metadata
- Download URL: TeraTTS-1.0-py3-none-any.whl
- Upload date:
- Size: 7.3 kB
- Tags: Python 3
- Uploaded using Trusted Publishing? No
- Uploaded via: twine/4.0.2 CPython/3.10.12
File hashes
Algorithm | Hash digest | |
---|---|---|
SHA256 | 12abe5b18ce633cb02574673024d8bb0f05441b4d3671f10746580ef84d92e16 |
|
MD5 | 32cbf798e00527e34e04f416ed082713 |
|
BLAKE2b-256 | 1d2805c0694b773fc5b48cfd87fef4cc570a7b44e6831d90ddfccb5ffd4cb38a |