nonebot-plugin-vits-tts
Project description
📖 介绍
基于vits的tts语音生成,适配onebot v11协议
已兼容pydantic v1&v2
💿 安装
nb-cli
nb plugin install nonebot-plugin-vits-tts
pip
pip install nonebot_plugin_vits_tts
⚙️ 配置
配置项 | 类型 | 默认值 | 说明 |
---|---|---|---|
VITS__DEVICE | int | 0 | 使用指定的cuda设备进行tts合成,如果指定的设备不存在会自动使用cpu进行推理 |
VITS__VMODEL_PATH | str | models | 插件会读取此文件夹下的所有模型 |
VITS__AT_BOT | bool | false | 使用语音合成是否需要@bot |
VITS__COOLDOWN | int | 0 | 在每个群里生成语音的冷却时间,防止设备负载过大 |
VITS__VMODEL_FILE_NAME | str | model.pth | 模型文件名 |
VITS__CONFIG_FILE_NAME | str | config | 模型配置文件 |
VITS__TENCENT_SECRET_ID | str | 腾讯云机器翻译SECRET_ID,用于语种识别 | |
VITS__TENCENT_SECRET_KEY | str | 腾讯云机器翻译SECRET_KEY,这两项不配置或者配置不正确会使用langdetect库进行语种识别,使用langdetect准确率较低 | |
VITS__DEFAULT_LENGTH_SCALE | float | 1 | 整体语速 |
VITS__DEFAULT_NOISE_SCALE | float | 0.667 | 感情变化程度 |
VITS__DEFAULT_NOISE_SCALE_W | float | 0.6 | 音素发音长度 |
VITS__AUDIO_CONVERT_TO_MP3 | bool | false | 是否将语音转换为mp3格式,默认为wav格式,如果设置为true,需要在设备上安装ffmpeg |
假如你的项目配置是这样,则VITS__VMODEL_PATH
应为models
,VITS__VMODEL_FILE_NAME
为model.pth
,VITS__CONFIG_FILE_NAME
为config.json
awsomebot
├─ .env
├─ .env.dev
├─ .env.prod
├─ .gitignore
├─ README.md
├─ models
│ ├─ model1
│ │ ├─ config.json
│ │ └─ model.pth
│ └─ model2
│ ├─ config.json
│ └─ model.pth
├─ pyproject.toml
└─ src
└─ plugins
└─ ...
注意
所有的模型文件名应为VITS__VMODEL_FILE_NAME
的值,配置文件名应为VITS__CONFIG_FILE_NAME
的值,一个文件夹只允许放一个模型和配置文件,
不同模型使用文件夹分割开来,插件会自动加载所有文件夹下的模型
使用cuda设备合成音频
- 安装合适版本的cuda-toolkit
- 需要手动安装GPU版本的pytorch,详见Pytorch
🎉 使用
仅可以在群聊中使用
使用方法:
-
[角色]说[要合成的文本]
例如:- 宁宁说私のオナニを見てください
-
发送
/help
可以获取可用角色列表
目前仅支持简体中文,日语,英文,插件会自动识别要合成文本的语种
模型分享
由我自己训练的模型,目前有以下几个galgame的模型
ATRI,
RiddleJoker,
千恋万花,
魔女的夜宴,
星光咖啡馆与死神之蝶
模型不定期更新,可前往我的huggingface主页查看
💡 感谢
- 此插件基于Plachtaa/VITS-fast-fine-tuning的代码改进而来
关于模型训练
Plachtaa/VITS-fast-fine-tuning的笔记本
另外还提供一个我改进过的笔记本
,这个笔记本只保存最新的模型文件,不会将训练的中间文件保存到云盘导致云盘爆掉不能训练
Project details
Download files
Download the file for your platform. If you're not sure which to choose, learn more about installing packages.
Source Distribution
Built Distribution
File details
Details for the file nonebot_plugin_vits_tts-0.1.5.tar.gz
.
File metadata
- Download URL: nonebot_plugin_vits_tts-0.1.5.tar.gz
- Upload date:
- Size: 43.3 kB
- Tags: Source
- Uploaded using Trusted Publishing? Yes
- Uploaded via: twine/4.0.2 CPython/3.11.8
File hashes
Algorithm | Hash digest | |
---|---|---|
SHA256 | 888658527f19d612e431c1cde0167151baaea7c516b6ca617d5db3b4ef451f2b |
|
MD5 | e012627d6852f4c514642062f821f964 |
|
BLAKE2b-256 | bb92fda7270b8869408eec262a929f195abed56b2a7e2416967b4a26856d8794 |
File details
Details for the file nonebot_plugin_vits_tts-0.1.5-py3-none-any.whl
.
File metadata
- Download URL: nonebot_plugin_vits_tts-0.1.5-py3-none-any.whl
- Upload date:
- Size: 50.3 kB
- Tags: Python 3
- Uploaded using Trusted Publishing? Yes
- Uploaded via: twine/4.0.2 CPython/3.11.8
File hashes
Algorithm | Hash digest | |
---|---|---|
SHA256 | db31e44685213f95dbce8e0cca45822a02a059cc954be43ec9a9a54e1bd38acb |
|
MD5 | 84af0bc24ee82c1e530df72414fde81c |
|
BLAKE2b-256 | 5d759938420c6f568bc7263ccd1b5f6c01e9d1ebfc49db587a2d25a8886521b8 |