Skip to main content

russian text to speech

Project description

Russian TTS inference

Установка

Вы можете установить пакет с помощью pip:

pip install RUTTS

Также вы можете установить используя Git:

pip install -e git+https://github.com/Tera2Space/RUTTS#egg=RUTTS

Ошибки

1)Если на Windows у вас ошибка при установке,нужно просто скачать Visual Studio здесь и при установке выбрать галочку около Разработка классических приложений на С++

2)Если после установки не работает что-то, убедитесь что модуль скачан последней версии(удалить и скачать) и так же что названия моделей есть на https://huggingface.co/TeraTTS

3)Если ничего не помогло обратитесь за помощью в https://t.me/teraspace_chat

Использование

from RUTTS import TTS

# Создание модели TTS с указанным именем
# Примечание: Вы можете найти все модели по адресу https://huggingface.co/TeraTTS, включая модель GLADOS
tts = TTS("TeraTTS/natasha-g2p-vits", add_time_to_end=0.8)  # Вы можете настроить 'add_time_to_end' для продолжительности аудио

text = "Привет, мир!"
# Опционально: Предобработка текста (улучшает качество)
from ruaccent import RUAccent
accentizer = RUAccent(workdir="./model")

# Загрузка моделей акцентуации и словарей
# Доступны две модели: 'medium' (рекомендуется) и 'small'.
# Переменная 'dict_load_startup' управляет загрузкой словаря при запуске (больше памяти) или загрузкой его по мере необходимости во время выполнения (экономия памяти, но медленнее).
# Переменная disable_accent_dict отключает использование словаря (все ударения расставляет нейросеть). Данная функция экономит ОЗУ, по скорости работы сопоставима со всем словарём в ОЗУ.
accentizer.load(omograph_model_size='medium', dict_load_startup=False)

# Обработка текста с учетом ударений и буквы ё
text = accentizer.process_all(text)
print(f"Текст с ударениями и ё: {text}")

# Синтез речи
# 'length_scale' можно использовать для замедления аудио для лучшего звучания (по умолчанию 1.2, указано здесь для примера)
audio = tts(text, length_scale=1.2)  # Создать аудио. Можно добавить ударения, используя '+'
tts.play_audio(audio)  # Воспроизвести созданное аудио
tts.save_wav(audio, "./test.wav")  # Сохранить аудио в файл

# Создать аудио и сразу его воспроизвести
tts(text, play=True, length_scale=1.2)

Project details


Download files

Download the file for your platform. If you're not sure which to choose, learn more about installing packages.

Source Distribution

RUTTS-0.1.12.tar.gz (8.6 kB view details)

Uploaded Source

Built Distribution

RUTTS-0.1.12-py3-none-any.whl (7.9 kB view details)

Uploaded Python 3

File details

Details for the file RUTTS-0.1.12.tar.gz.

File metadata

  • Download URL: RUTTS-0.1.12.tar.gz
  • Upload date:
  • Size: 8.6 kB
  • Tags: Source
  • Uploaded using Trusted Publishing? No
  • Uploaded via: twine/4.0.2 CPython/3.10.12

File hashes

Hashes for RUTTS-0.1.12.tar.gz
Algorithm Hash digest
SHA256 e51aa8f32e379ea7d8c4a6d39d92a2d4805b8465feb22f2d4effe5f4797d0088
MD5 fd2dac81728d0aa38557f5821b4b35c7
BLAKE2b-256 5638bc18d68b97513e058b21130bbe505acc578c202fb5fd74c61d0a9b087421

See more details on using hashes here.

File details

Details for the file RUTTS-0.1.12-py3-none-any.whl.

File metadata

  • Download URL: RUTTS-0.1.12-py3-none-any.whl
  • Upload date:
  • Size: 7.9 kB
  • Tags: Python 3
  • Uploaded using Trusted Publishing? No
  • Uploaded via: twine/4.0.2 CPython/3.10.12

File hashes

Hashes for RUTTS-0.1.12-py3-none-any.whl
Algorithm Hash digest
SHA256 4a32ca79a5347ab601476a03e3d37a8f6769fa07b67133ff461ea512a0fad2b8
MD5 be7652e369302f5ddb38f6eaa032f4b9
BLAKE2b-256 210ef686fd36a41ef30121d7e28f7a8863695d1039bdac2fb4d6fd7e72322db6

See more details on using hashes here.

Supported by

AWS AWS Cloud computing and Security Sponsor Datadog Datadog Monitoring Fastly Fastly CDN Google Google Download Analytics Microsoft Microsoft PSF Sponsor Pingdom Pingdom Monitoring Sentry Sentry Error logging StatusPage StatusPage Status page