say's speech NaturalIntonation AI Voice library for KS903__Bate_vr_FinalLAST_librarypackages_datas__
Project description
README.md
KS903NaturalIntonationAIVoice_Bate_vr_FinalLAST_librarypackages_datas (テスト及びベータ版です)
概要
KS903NaturalIntonationAIVoice_Bate_vr_FinalLAST_librarypackages_datas は、自然なイントネーションでテキストを音声化するための音声合成AIライブラリです。このライブラリは、日本語と英語のテキストを音声合成し、それに合わせてテキストを表示する機能を提供します。以下に、主な機能と構成要素について説明します。
本作は[KS903NaturalIntonationAIVoice]シリーズのサンプルテスト版であり、今後の正式版への移行を趣旨としています。
新機能の搭載のお知らせ
本バージョンから、自然なイントネーションでテキストを音声化するための高度な音声合成AIライブラリとして以下の機能が導入されます。
- テキスト抽出機能:
- PDF、DOCX、画像、CSV、TXTファイルからテキストを抽出する機能を搭載しています。
- 抽出したテキストは、日本語および英語で音声読み上げ表示が可能です。
主な機能
-
音声合成:
- 指定された言語(日本語または英語)でテキストを音声化します。
- 使用する音声は、システムにインストールされている音声エンジンの中から自動的に選択されます。
-
テキストの逐次表示:
- 音声合成に合わせて、テキストを一文字ずつ表示します。
- 各文字の表示速度は、音声再生時間に基づいて計算されます。
-
言語処理:
- テキストを「、」や「。」で分割し、それぞれの部分を言語に応じて音声合成します。
- 分割された部分が日本語または英語であることを認識し、適切な音声合成を行います。
-
ファイルからのテキスト読み込み:
- コマンドライン引数から指定されたテキストファイルを読み込み、その内容を処理します。
クラスの構成
-
__init__
メソッド- `を用いて音声エンジンを初期化し、使用可能な音声のリストを取得します。
-
speech_text
メソッド- 与えられたテキストを指定された言語で音声合成し、音声再生の開始および終了時間を記録します。
-
print_text
メソッド- テキストを一文字ずつ表示するためのメソッドです。音声合成の再生時間に基づいて、各文字の表示間隔を計算します。
-
process_text
メソッド- テキストを言語に応じて処理し、音声合成とテキスト表示をスレッドで実行します。テキストを分割し、言語を判断して音声合成を行います。
-
ks903_aivoice_vr5_Beta_Sample_test_run
メソッド- コマンドラインから指定されたテキストファイルを読み込み、行ごとに
process_text
メソッドを呼び出して音声合成と表示を行います。
- コマンドラインから指定されたテキストファイルを読み込み、行ごとに
-
メインブロック
- スクリプトが直接実行された場合に、
KS903NaturalIntonationAIVoice_Bate_vr_FinalLAST_librarypackages_datas
クラスのインスタンスを作成し、ファイルパスを引数にしてメソッドを呼び出します。
注意事項の宣言についてのお知らせ項目について 実験段階ですので未完成部分が多いですがご了承ください。
- スクリプトが直接実行された場合に、
なお、ks903_aivoice_vr5_Beta_Sample_test_runの時の状況に踏まえて追加項目として(2023/11/5/16:14)、本ライブラリはKS903NaturalIntonationAIVoice_Bate_vr_1と比較して認識速度が格段に向上しています。
KS903NaturalIntonation_AIVoice_Bate__real_later_stbel_inadex_last_doctypeは、KS903NaturalIntonationAIVoice_Bate_vrの最終のバージョンとして、今後はKS903NaturalIntonationAIVoice_Bate_vrを廃版とします。そのため今後は[KS903NaturalIntonationAIVoice]シリーズのサンプルテスト版はリリースされませんのでご注意ください。そして、今後の趣旨の本作[KS903NaturalIntonationAIVoice]の本作プロジェクトに切り替えることを宣言します。
今後については正式版の本作[KS903NaturalIntonationAIVoice]のプロジェクトが新規リリースしていきますので本現行状況についてはこの方針を採用していきますのでご了承ください。
今後何かお知らせがあるばあについてはその都度報告いたしますのでよろしく願います。
インストール方法(最終バージョン)
このライブラリはpip
を使用してインストールできます。また、動作確認としてWindodosの音声合成適用バージョンが必要です。これにより、音声合成機能が実装されています。
使用方法?使い方の例として!
コマンドラインで以下のように実行します。
このライブラリは、pip
を使用してインストールできます。
pip install KS903NaturalIntonationAIVoice_Bate_vr_FinalLAST_librarypackages_datas
pythonファイル直接テキストファイル読み込む場合
bash
コードをコピーする
python v_bate_test_last.py <テキストファイルパス>=文字で直接入力するもしくはテキストファイルでもよいです。
pythonファイル単一で書く場合について
pythonファイル単一で書く場合は以下の通りです。
# v_bate_test_last.py
from KS903_Natural_Voice__AI_speech_sample_last import KS903NaturalIntonationAIVoice_Bate_vr_FinalLAST_librarypackages_datas
# クラスのインスタンスを生成
instance = KS903NaturalIntonationAIVoice_Bate_vr_FinalLAST_librarypackages_datas()
# run() メソッドを明示的に呼び出す
instance.KS903_Ntural_Voice__AI_speech_Beta_Sample_doctypeStarts_real_later_stbel_inadex_last_run()
これにより、指定されたテキストファイルの内容が音声で再生され、その内容がコンソールに逐次表示されます。
このライブラリは、音声合成とテキスト表示を組み合わせたインタラクティブな体験を提供し、教育や情報提示のための強力なツールとなることを趣旨としています。
実験段階ですので未完成部分多いですがご了承ください。
以上をもってご説明を終了します。
Creator/Inventor: NPO_KS_903.lnc (President: Takeshi Kumura, Director: Takuma Ozawa)
Developer: NPO_KS_903.lnc (President: Takeshi Kumura, Director: Takuma Ozawa)
Designer/Architect: NPO_KS_903.lnc (President: Takeshi Kumura, Director: Takuma Ozawa)
Founder: NPO_KS_903.lnc (President: Takeshi Kumura, Director: Takuma Ozawa)
Project details
Release history Release notifications | RSS feed
Download files
Download the file for your platform. If you're not sure which to choose, learn more about installing packages.
Source Distributions
Built Distribution
File details
Details for the file KS903NaturalIntonationAIVoice_Bate_vr_FinalLAST_librarypackages_datas-9.9.1.0.8-py3-none-any.whl
.
File metadata
- Download URL: KS903NaturalIntonationAIVoice_Bate_vr_FinalLAST_librarypackages_datas-9.9.1.0.8-py3-none-any.whl
- Upload date:
- Size: 4.8 kB
- Tags: Python 3
- Uploaded using Trusted Publishing? No
- Uploaded via: twine/5.1.1 CPython/3.9.8
File hashes
Algorithm | Hash digest | |
---|---|---|
SHA256 | 509676792269fa38688f2c5b16da37df94c9a20f67e6fa4f6185e643284c4d8c |
|
MD5 | 93b5897cf3ed7360179d79ce2d2feadc |
|
BLAKE2b-256 | f52e4d2417452ed767c0fcb59591411008dbc4fa6e9080737446775f2d698aec |