Skip to main content

russian text to speech

Project description

Russian TTS inference

Установка

1)Установка пакета:

a) скачать из pypi: pip install RUTTS

b) из гита (нужен установленный гит) pip install -e git+https://github.com/Tera2Space/RUTTS#egg=RUTTS

Ошибки

1)Если на винде у вас ошибка при установке,нужно просто скачать Visual Studio здесь и при установке выбрать галочку около Разработка классических приложений на С++

2)Если после установки не работает что-то, убедитесь что модуль скачан последней версии(удалить и скачать) и так же что названия моделей есть на https://huggingface.co/TeraTTS

Использование

  from RUTTS import TTS

  #! Cоздать модель по имени
  # P.S все модели https://huggingface.co/TeraTTS P.S там есть модель для GLADOS
  tts = TTS("TeraTTS/natasha-g2p-vits") # Можно передать параметр add_time_to_end (по умолчанию = 0.8) это кол-во добавленных секунд в аудио для хорошего звучания

  text = "Привет мир!"
  print(f"Текст: {text}")

  #! Предобработка текста (это по желанию, но сильно улучшает качество!) для этого вам нужно будет `pip install transformers torch==1.13.1`
  from RUTTS.ruaccent import RUAccent #https://github.com/Den4ikAI/ruaccent
  accentizer = RUAccent(workdir="./model")#allow_cuda=False что бы отключить использование видеокарты
  # load(omograph_model_size='medium', dict_load_startup=False): 
  # Загрузка моделей и словарей. На данные момент доступны две модели: medium (рекомендуется к использованию) и small. 
  # Переменная dict_load_startup отвечает за загрузку всего словаря (требуется больше ОЗУ), 
  # либо во время работы для необходимых слов (экономит ОЗУ, но требует быстрые ЖД и работает медленее)
  accentizer.load(omograph_model_size='medium', dict_load_startup=False)
  text = accentizer.process_all(text)
  print(f"Текст с ударениями и ё: {text}")

  #! Синтез
  #lenght_scale - замедлить аудио для хорошего звучания, параметр по умолчанию передается как 1.2, указан для примера
  audio = tts(text, lenght_scale=1.2) # Создать аудио. Можно ставить ударения используя +
  tts.play_audio(audio) # Проиграть созданное аудио
  tts.save_wav(audio, "./test.wav") # Сохранить аудио

  tts(text, play=True, lenght_scale=1.2) # Создать аудио и сразу проиграть его

Project details


Download files

Download the file for your platform. If you're not sure which to choose, learn more about installing packages.

Source Distribution

RUTTS-0.1.10.tar.gz (11.5 kB view details)

Uploaded Source

Built Distribution

RUTTS-0.1.10-py3-none-any.whl (12.2 kB view details)

Uploaded Python 3

File details

Details for the file RUTTS-0.1.10.tar.gz.

File metadata

  • Download URL: RUTTS-0.1.10.tar.gz
  • Upload date:
  • Size: 11.5 kB
  • Tags: Source
  • Uploaded using Trusted Publishing? No
  • Uploaded via: twine/4.0.2 CPython/3.10.6

File hashes

Hashes for RUTTS-0.1.10.tar.gz
Algorithm Hash digest
SHA256 a40f8e88b3565aa8a83b014e587980962d6e20ba218c8063d457893533805122
MD5 7485656d99dd320486a72efbdad9df92
BLAKE2b-256 a55f7919d2c57dac68f5de1f807c684b4a6cadcf635d8423181a4e5ce06a8977

See more details on using hashes here.

File details

Details for the file RUTTS-0.1.10-py3-none-any.whl.

File metadata

  • Download URL: RUTTS-0.1.10-py3-none-any.whl
  • Upload date:
  • Size: 12.2 kB
  • Tags: Python 3
  • Uploaded using Trusted Publishing? No
  • Uploaded via: twine/4.0.2 CPython/3.10.6

File hashes

Hashes for RUTTS-0.1.10-py3-none-any.whl
Algorithm Hash digest
SHA256 17f3eb8a5811e15f0439b127f6a955708aeb26188e9e234b365e8954ffd13207
MD5 7899622e53a53ee147a01cd10c61b7e5
BLAKE2b-256 8aebbf1b0b50c73caf8975b66361767e5fb3696e77db1de46fcbbe9caf289f14

See more details on using hashes here.

Supported by

AWS AWS Cloud computing and Security Sponsor Datadog Datadog Monitoring Fastly Fastly CDN Google Google Download Analytics Microsoft Microsoft PSF Sponsor Pingdom Pingdom Monitoring Sentry Sentry Error logging StatusPage StatusPage Status page