No project description provided
Project description
Easy VC
簡単、軽量を目的とした音声変換(Voice Conversion)です。
このリポジトリは開発用のリポジトリです。
Description
Usage
トレーニング
noF0
ファイルをraw_data/
に展開しておく。
poetry run download weights
# ↓ valid_numが全体のデータセットの数を超えないように。
poetry run preprocess --project_name amitaro --wav_dir raw_data/amitaro --valid_num 10 --test_dir raw_data/test_data --sample_rate 16000 --jobs 4
poetry run extract_feature --project_name amitaro --version 1 --device_id 0
poetry run generate_filelist --project_name amitaro --version 1 --useF0 no --sid 0
poetry run train --project_name amitaro --config_path configs/16k_v2.json --sample_rate 16000 --use_f0 False --total_epoch 10 --batch_size 10 --device_id 0 --log_step_interval 10 --val_step_interval 10 --test_step_interval 10 --save_model_epoch_interval 2 --cache_gpu False --freeze_vocoder True
poetry run train --project_name amitaro --config_path configs/16k_v2.json --sample_rate 16000 --use_f0 False --total_epoch 10 --batch_size 10 --device_id 0 --log_step_interval 10 --val_step_interval 10 --test_step_interval 10 --save_model_epoch_interval 2 --cache_gpu False --freeze_vocoder True
poetry run train --project_name amitaro --config_path configs/16k_v2.json --sample_rate 16000 --use_f0 False --total_epoch 1000 --batch_size 10 --device_id 0 --log_step_interval 100 --val_step_interval 100 --test_step_interval 100 --save_model_epoch_interval 50 --cache_gpu False --freeze_vocoder True
# レジューム
poetry run train --project_name amitaro --config_path configs/16k_v2.json --sample_rate 16000 --use_f0 False --total_epoch 10 --batch_size 10 --device_id 0 --log_step_interval 10 --val_step_interval 10 --test_step_interval 10 --save_model_epoch_interval 2 --cache_gpu False --freeze_vocoder True --checkpoint_path trainer/amitaro/logs/model-e4-s432.pt
Export
poetry run export_onnx --torch_path trainer/sangoku/logs/model-e150-s91050-gen.pt --output_path trainer/sangoku/sangoku.onnx
poetry run export_onnx --torch_path trainer/sangoku/logs/model-nof0-e201-s122007-gen.pt --output_path trainer/sangoku/sangoku.onnx
poetry run infer_with_onnx --onnx_path trainer/sangoku/sangoku.onnx --wav_path raw_data/test_data/queens.wav
pyinstaller
コマンドを1ファイルにする
poetry run easy_vc preprocess --project_name amitaro --wav_dir raw_data/amitaro --valid_num 10 --test_dir raw_data/test_data --sample_rate 16000 --jobs 4
poetry run easy_vc extract_feats --project_name amitaro --version 1 --device_id 0
poetry run easy_vc generate_filelist --project_name amitaro --version 1 --useF0 no --sid 0
poetry run easy_vc train --project_name amitaro --config_path configs/16k_v2.json --sample_rate 16000 --use_f0 False --total_epoch 10 --batch_size 10 --device_id 0 --log_step_interval 10 --val_step_interval 10 --test_step_interval 10 --save_model_epoch_interval 2 --cache_gpu False --freeze_vocoder True
.venv/bin/pyinstaller easy_vc_dev/cli.py --onefile --add-data easy_vc_dev/utils/whisper/assets/*:easy_vc_dev/utils/whisper/assets/
cli preprocess --project_name tsukuyomi --wav_dir raw_data/tsukuyomi --valid_num 10 --test_dir raw_data/test_data --sample_rate 16000 --jobs 4
cli extract_feats --project_name tsukuyomi --version 1 --device_id 0
cli generate_filelist --project_name tsukuyomi --version 1 --useF0 no --sid 0
音声変換
リアルタイム音声変換
Reference
このソフトウェアは次のリポジトリの実装を参考にしています。
Retrieval-based-Voice-Conversion-WebUI hifi-gan
trainの種類
ckpt | finetune | vocoder_ckpt | discriminator_ckpt | ||
---|---|---|---|---|---|
事前学習モデル | レ | 事前学習をするとき | |||
モデル作成 | レ | 事前学習など既存モデルからの学習 | |||
モデル作成 Finetune | レ | レ | 既存モデルからのfinetune(learning rateなどの復帰) | ||
モデル作成 vocoder ckpt | レ | レ(opt) | レ | レ(opt) | Vocoderを上書き |
モデル作成 discriminator ckpt | レ | レ(opt) | レ(opt) | レ | Discriminatorの上書き(NOT IMPLEMENTED) |
Project details
Release history Release notifications | RSS feed
Download files
Download the file for your platform. If you're not sure which to choose, learn more about installing packages.
Source Distribution
easy_vc_dev-0.1.1.tar.gz
(514.9 kB
view hashes)
Built Distribution
easy_vc_dev-0.1.1-py3-none-any.whl
(540.4 kB
view hashes)
Close
Hashes for easy_vc_dev-0.1.1-py3-none-any.whl
Algorithm | Hash digest | |
---|---|---|
SHA256 | 9bd97393fc90d497aa0b09286f4c01468abe07702634c4cb9e73508a66eaadd0 |
|
MD5 | 20f69eb4d2c1642e1451b28ae9fa269d |
|
BLAKE2b-256 | 6973548e47190938c14197631152d60f07e6a0a49077be6ab087c680755e38fe |