russian text to speech
Project description
Russian TTS inference
Установка
Вы можете установить пакет с помощью pip:
pip install RUTTS
Также вы можете установить используя Git:
pip install -e git+https://github.com/Tera2Space/RUTTS#egg=RUTTS
Ошибки
1)Если на Windows у вас ошибка при установке,нужно просто скачать Visual Studio здесь и при установке выбрать галочку около Разработка классических приложений на С++
2)Если после установки не работает что-то, убедитесь что модуль скачан последней версии(удалить и скачать) и так же что названия моделей есть на https://huggingface.co/TeraTTS
3)Если ничего не помогло обратитесь за помощью в https://t.me/teraspace_chat
Использование
from RUTTS import TTS
# Создание модели TTS с указанным именем
# Примечание: Вы можете найти все модели по адресу https://huggingface.co/TeraTTS, включая модель GLADOS
tts = TTS("TeraTTS/natasha-g2p-vits", add_time_to_end=0.8) # Вы можете настроить 'add_time_to_end' для продолжительности аудио
text = "Привет, мир!"
# Опционально: Предобработка текста (улучшает качество)
from ruaccent import RUAccent
accentizer = RUAccent(workdir="./model")
# Загрузка моделей акцентуации и словарей
# Доступны две модели: 'medium' (рекомендуется) и 'small'.
# Переменная 'dict_load_startup' управляет загрузкой словаря при запуске (больше памяти) или загрузкой его по мере необходимости во время выполнения (экономия памяти, но медленнее).
# Переменная disable_accent_dict отключает использование словаря (все ударения расставляет нейросеть). Данная функция экономит ОЗУ, по скорости работы сопоставима со всем словарём в ОЗУ.
accentizer.load(omograph_model_size='big_poetry', use_dictionary=True)
# Обработка текста с учетом ударений и буквы ё
text = accentizer.process_all(text)
print(f"Текст с ударениями и ё: {text}")
# Синтез речи
# 'length_scale' можно использовать для замедления аудио для лучшего звучания (по умолчанию 1.2, указано здесь для примера)
audio = tts(text, lenght_scale=1.2) # Создать аудио. Можно добавить ударения, используя '+'
tts.play_audio(audio) # Воспроизвести созданное аудио
tts.save_wav(audio, "./test.wav") # Сохранить аудио в файл
# Создать аудио и сразу его воспроизвести
tts(text, play=True, lenght_scale=1.2)
```# Russian TTS inference
# Установка
Вы можете установить пакет с помощью pip:
pip install RUTTS
Также вы можете установить используя Git:
pip install -e git+https://github.com/Tera2Space/RUTTS#egg=RUTTS
# Ошибки
1)Если на Windows у вас **ошибка при установке**,нужно просто **скачать Visual Studio [здесь](https://visualstudio.microsoft.com/ru/thank-you-downloading-visual-studio/?sku=Community&channel=Release&version=VS2022&source=VSLandingPage&cid=2030&passive=false)** и при установке выбрать галочку около **Разработка классических приложений на С++**
2)Если **после установки не работает** что-то, **убедитесь что модуль скачан последней версии**(удалить и скачать) и **так же что названия моделей есть на** https://huggingface.co/TeraTTS
3)Если ничего не помогло **обратитесь за помощью в https://t.me/teraspace_chat**
# Использование
```python
from RUTTS import TTS
# Создание модели TTS с указанным именем
# Примечание: Вы можете найти все модели по адресу https://huggingface.co/TeraTTS, включая модель GLADOS
tts = TTS("TeraTTS/natasha-g2p-vits", add_time_to_end=0.8) # Вы можете настроить 'add_time_to_end' для продолжительности аудио
text = "Привет, мир!"
# Опционально: Предобработка текста (улучшает качество)
from ruaccent import RUAccent
accentizer = RUAccent(workdir="./model")
# Загрузка моделей акцентуации и словарей
# Доступны две модели: 'medium' (рекомендуется) и 'small'.
# Переменная 'dict_load_startup' управляет загрузкой словаря при запуске (больше памяти) или загрузкой его по мере необходимости во время выполнения (экономия памяти, но медленнее).
# Переменная disable_accent_dict отключает использование словаря (все ударения расставляет нейросеть). Данная функция экономит ОЗУ, по скорости работы сопоставима со всем словарём в ОЗУ.
accentizer.load(omograph_model_size='big_poetry', use_dictionary=True)
# Обработка текста с учетом ударений и буквы ё
text = accentizer.process_all(text)
print(f"Текст с ударениями и ё: {text}")
# Синтез речи
# 'length_scale' можно использовать для замедления аудио для лучшего звучания (по умолчанию 1.2, указано здесь для примера)
audio = tts(text, lenght_scale=1.2) # Создать аудио. Можно добавить ударения, используя '+'
tts.play_audio(audio) # Воспроизвести созданное аудио
tts.save_wav(audio, "./test.wav") # Сохранить аудио в файл
# Создать аудио и сразу его воспроизвести
tts(text, play=True, lenght_scale=1.2)
Project details
Download files
Download the file for your platform. If you're not sure which to choose, learn more about installing packages.
Source Distribution
Built Distribution
File details
Details for the file RUTTS-0.1.13.tar.gz
.
File metadata
- Download URL: RUTTS-0.1.13.tar.gz
- Upload date:
- Size: 8.9 kB
- Tags: Source
- Uploaded using Trusted Publishing? No
- Uploaded via: twine/4.0.2 CPython/3.10.12
File hashes
Algorithm | Hash digest | |
---|---|---|
SHA256 | 2b347ce4013e94eb7d63b91a84ee80ac838cb1e12a12de5fdc5b5b05bf37f25a |
|
MD5 | ce44040f7372e6e1464f9fa59386086d |
|
BLAKE2b-256 | 869b644ba5c7c8a47cfa39f438bc0c438398058fb2de8ef64830ae21e08445c2 |
File details
Details for the file RUTTS-0.1.13-py3-none-any.whl
.
File metadata
- Download URL: RUTTS-0.1.13-py3-none-any.whl
- Upload date:
- Size: 8.2 kB
- Tags: Python 3
- Uploaded using Trusted Publishing? No
- Uploaded via: twine/4.0.2 CPython/3.10.12
File hashes
Algorithm | Hash digest | |
---|---|---|
SHA256 | 59386393dd0f9bda5ee5e335f36f96561d6f44dbba2353a71a525a61c76f1aa3 |
|
MD5 | 4ac3ad5d46906b99dccc47695ae469b1 |
|
BLAKE2b-256 | 7977c66e17829221c945cf26bb8dc840061b422f431d219e92477e86ce7ae5cd |