Skip to main content

text2speech for vietnamese voice

Project description

Vietvoice

Text to speech for Vietnam

Chuyển đổi văn bản thành giọng nói sử dụng tacotron2. Đối với Tiếng Việt, input của mô hình là các phoneme.

Thư viện được tạo ra với mục đích là đơn giản để sử dụng. Các bạn có thể sử dụng pretrained model đã được huấn luyện sẵn cho các ứng dụng khác.

Cài đặt

Thư viện yêu cầu:

pytorch >= 1.10

Cài đặt Vietvoice

pip install vietvoice

Dữ liệu

Tiền xử lý text

Các bạn lưu ý rằng text đầu vào được chuyển thành phoneme sau đó mới được input vào model. Việc tiền xử lý text để đảm bảo rằng các từ đều có thể chuyển được thành phoneme là cực kì quan trọng. Việc tiền xử lý phụ thuộc vào dữ liệu của các bạn như thế nào, nên phần xử lý này các bạn cần phải tự xử lý cho phù hợp với dữ liệu của mình.

Train & Inference

Các bạn tham khảo notebook này.

Synthesis speech

Chất lượng giọng nói theo nhận xét của mình là rất tốt.

Problem

Nếu có vấn đề gì vui lòng tạo issue hoặc liên hệ mình tại pbcquoc@gmail.com

Project details


Download files

Download the file for your platform. If you're not sure which to choose, learn more about installing packages.

Source Distribution

vietvoice-0.1.2.tar.gz (15.9 kB view details)

Uploaded Source

Built Distribution

vietvoice-0.1.2-py3-none-any.whl (19.1 kB view details)

Uploaded Python 3

File details

Details for the file vietvoice-0.1.2.tar.gz.

File metadata

  • Download URL: vietvoice-0.1.2.tar.gz
  • Upload date:
  • Size: 15.9 kB
  • Tags: Source
  • Uploaded using Trusted Publishing? No
  • Uploaded via: twine/3.4.2 importlib_metadata/4.0.1 pkginfo/1.6.1 requests/2.24.0 requests-toolbelt/0.9.1 tqdm/4.50.2 CPython/3.8.5

File hashes

Hashes for vietvoice-0.1.2.tar.gz
Algorithm Hash digest
SHA256 471e40350902ba93d5f491165ca23433aab370135d285f1ff0ce6ebe0dd1028c
MD5 37f2cd6fb6ce701a9ed688a2e887e1f1
BLAKE2b-256 1dfbbc6daa2cdf086eae929ad05781e3a5ecc9aab6ce137e745638bd40100773

See more details on using hashes here.

File details

Details for the file vietvoice-0.1.2-py3-none-any.whl.

File metadata

  • Download URL: vietvoice-0.1.2-py3-none-any.whl
  • Upload date:
  • Size: 19.1 kB
  • Tags: Python 3
  • Uploaded using Trusted Publishing? No
  • Uploaded via: twine/3.4.2 importlib_metadata/4.0.1 pkginfo/1.6.1 requests/2.24.0 requests-toolbelt/0.9.1 tqdm/4.50.2 CPython/3.8.5

File hashes

Hashes for vietvoice-0.1.2-py3-none-any.whl
Algorithm Hash digest
SHA256 f8fb7ad65176ef3eec650e0df8f401bb307b10317b33f2876b2f713799657f17
MD5 df74fd2afa9805df3db9198d57626517
BLAKE2b-256 af53576dfbf81782517701e5d891ed3d94ba77dc5f2839620c43f5e72a21557c

See more details on using hashes here.

Supported by

AWS AWS Cloud computing and Security Sponsor Datadog Datadog Monitoring Fastly Fastly CDN Google Google Download Analytics Microsoft Microsoft PSF Sponsor Pingdom Pingdom Monitoring Sentry Sentry Error logging StatusPage StatusPage Status page