Project description

Easy VC

簡単、軽量を目的とした音声変換(Voice Conversion)です。

このリポジトリは開発用のリポジトリです。

Description

Usage

トレーニング

noF0

ファイルをraw_data/に展開しておく。

poetry run download weights
# ↓ valid_numが全体のデータセットの数を超えないように。
poetry run preprocess --project_name amitaro --wav_dir raw_data/amitaro --valid_num 10 --test_dir raw_data/test_data --sample_rate 16000 --jobs 4
poetry run extract_feature --project_name amitaro --version 1 --device_id 0
poetry run generate_filelist --project_name amitaro --version 1 --useF0 no --sid 0
poetry run train --project_name amitaro --config_path configs/16k_v2.json --sample_rate 16000 --use_f0 False --total_epoch 10 --batch_size 10 --device_id 0 --log_step_interval 10 --val_step_interval 10 --test_step_interval 10 --save_model_epoch_interval 2 --cache_gpu False --freeze_vocoder True


poetry run train --project_name amitaro --config_path configs/16k_v2.json --sample_rate 16000 --use_f0 False --total_epoch 10 --batch_size 10 --device_id 0 --log_step_interval 10 --val_step_interval 10 --test_step_interval 10 --save_model_epoch_interval 2 --cache_gpu False --freeze_vocoder True

poetry run train --project_name amitaro --config_path configs/16k_v2.json --sample_rate 16000 --use_f0 False --total_epoch 1000 --batch_size 10 --device_id 0 --log_step_interval 100 --val_step_interval 100 --test_step_interval 100 --save_model_epoch_interval 50 --cache_gpu False --freeze_vocoder True

# レジューム
poetry run train --project_name amitaro --config_path configs/16k_v2.json --sample_rate 16000 --use_f0 False --total_epoch 10 --batch_size 10 --device_id 0 --log_step_interval 10 --val_step_interval 10 --test_step_interval 10 --save_model_epoch_interval 2 --cache_gpu False --freeze_vocoder True --checkpoint_path trainer/amitaro/logs/model-e4-s432.pt

Export

poetry run export_onnx --torch_path trainer/sangoku/logs/model-e150-s91050-gen.pt --output_path trainer/sangoku/sangoku.onnx
poetry run export_onnx --torch_path trainer/sangoku/logs/model-nof0-e201-s122007-gen.pt --output_path trainer/sangoku/sangoku.onnx
poetry run infer_with_onnx --onnx_path trainer/sangoku/sangoku.onnx --wav_path raw_data/test_data/queens.wav

pyinstaller

コマンドを１ファイルにする

poetry run easy_vc preprocess --project_name amitaro --wav_dir raw_data/amitaro --valid_num 10 --test_dir raw_data/test_data --sample_rate 16000 --jobs 4
poetry run easy_vc extract_feats --project_name amitaro --version 1 --device_id 0
poetry run easy_vc generate_filelist --project_name amitaro --version 1 --useF0 no --sid 0
poetry run easy_vc train --project_name amitaro --config_path configs/16k_v2.json --sample_rate 16000 --use_f0 False --total_epoch 10 --batch_size 10 --device_id 0 --log_step_interval 10 --val_step_interval 10 --test_step_interval 10 --save_model_epoch_interval 2 --cache_gpu False --freeze_vocoder True

.venv/bin/pyinstaller  easy_vc_dev/cli.py --onefile  --add-data easy_vc_dev/utils/whisper/assets/*:easy_vc_dev/utils/whisper/assets/

cli preprocess --project_name tsukuyomi --wav_dir raw_data/tsukuyomi --valid_num 10 --test_dir raw_data/test_data --sample_rate 16000 --jobs 4
cli extract_feats --project_name tsukuyomi --version 1 --device_id 0
cli generate_filelist --project_name tsukuyomi --version 1 --useF0 no --sid 0

音声変換

リアルタイム音声変換

Reference

このソフトウェアは次のリポジトリの実装を参考にしています。

Retrieval-based-Voice-Conversion-WebUI hifi-gan

trainの種類

	ckpt	finetune	vocoder_ckpt	discriminator_ckpt
事前学習モデル			レ		事前学習をするとき
モデル作成	レ				事前学習など既存モデルからの学習
モデル作成 Finetune	レ	レ			既存モデルからのfinetune(learning rateなどの復帰)
モデル作成 vocoder ckpt	レ	レ(opt)	レ	レ(opt)	Vocoderを上書き
モデル作成 discriminator ckpt	レ	レ(opt)	レ(opt)	レ	Discriminatorの上書き(NOT IMPLEMENTED)

Project details

These details have not been verified by PyPI

View statistics for this project via Libraries.io, or by using our public dataset on Google BigQuery

Release history Release notifications | RSS feed

This version

0.1.1

Feb 20, 2024

Download files

Download the file for your platform. If you're not sure which to choose, learn more about installing packages.

Source Distribution

easy_vc_dev-0.1.1.tar.gz (514.9 kB view hashes)

Uploaded Feb 20, 2024 Source

Built Distribution

easy_vc_dev-0.1.1-py3-none-any.whl (540.4 kB view hashes)

Uploaded Feb 20, 2024 Python 3

Hashes for easy_vc_dev-0.1.1.tar.gz

Hashes for easy_vc_dev-0.1.1.tar.gz
Algorithm	Hash digest
SHA256	`cf46ffba4a9a53e4cce4f3e3b5f607fe243547f1c65cf228c8e7973120147d98`
MD5	`731c26d56c3a1be99667f164d029cc65`
BLAKE2b-256	`71cfcb2535fe225bcec76edd7013831319742dc43ff20fb9a64880412de5a9a6`

Hashes for easy_vc_dev-0.1.1-py3-none-any.whl

Hashes for easy_vc_dev-0.1.1-py3-none-any.whl
Algorithm	Hash digest
SHA256	`9bd97393fc90d497aa0b09286f4c01468abe07702634c4cb9e73508a66eaadd0`
MD5	`20f69eb4d2c1642e1451b28ae9fa269d`
BLAKE2b-256	`6973548e47190938c14197631152d60f07e6a0a49077be6ab087c680755e38fe`