Skip to main content

say's speech NaturalIntonation AI Voice library for KS903__Bate_vr_FinalLAST_librarypackages_datas__

Project description

README.md

KS903NaturalIntonationAIVoice_Bate_vr_FinalLAST_librarypackages_datas (テスト及びベータ版です)

概要

KS903NaturalIntonationAIVoice_Bate_vr_FinalLAST_librarypackages_datas は、自然なイントネーションでテキストを音声化するための音声合成AIライブラリです。このライブラリは、日本語と英語のテキストを音声合成し、それに合わせてテキストを表示する機能を提供します。以下に、主な機能と構成要素について説明します。

本作は[KS903NaturalIntonationAIVoice]シリーズのサンプルテスト版であり、今後の正式版への移行を趣旨としています。

新機能の搭載のお知らせ

本バージョンから、自然なイントネーションでテキストを音声化するための高度な音声合成AIライブラリとして以下の機能が導入されます。

  • テキスト抽出機能:
    • PDF、DOCX、画像、CSV、TXTファイルからテキストを抽出する機能を搭載しています。
    • 抽出したテキストは、日本語および英語で音声読み上げ表示が可能です。

主な機能

  • 音声合成:

    • 指定された言語(日本語または英語)でテキストを音声化します。
    • 使用する音声は、システムにインストールされている音声エンジンの中から自動的に選択されます。
  • テキストの逐次表示:

    • 音声合成に合わせて、テキストを一文字ずつ表示します。
    • 各文字の表示速度は、音声再生時間に基づいて計算されます。
  • 言語処理:

    • テキストを「、」や「。」で分割し、それぞれの部分を言語に応じて音声合成します。
    • 分割された部分が日本語または英語であることを認識し、適切な音声合成を行います。
  • ファイルからのテキスト読み込み:

    • コマンドライン引数から指定されたテキストファイルを読み込み、その内容を処理します。

クラスの構成

  1. __init__ メソッド

    • `を用いて音声エンジンを初期化し、使用可能な音声のリストを取得します。
  2. speech_text メソッド

    • 与えられたテキストを指定された言語で音声合成し、音声再生の開始および終了時間を記録します。
  3. print_text メソッド

    • テキストを一文字ずつ表示するためのメソッドです。音声合成の再生時間に基づいて、各文字の表示間隔を計算します。
  4. process_text メソッド

    • テキストを言語に応じて処理し、音声合成とテキスト表示をスレッドで実行します。テキストを分割し、言語を判断して音声合成を行います。
  5. ks903_aivoice_vr5_Beta_Sample_test_run メソッド

    • コマンドラインから指定されたテキストファイルを読み込み、行ごとにprocess_textメソッドを呼び出して音声合成と表示を行います。
  6. メインブロック

    • スクリプトが直接実行された場合に、 KS903NaturalIntonationAIVoice_Bate_vr_FinalLAST_librarypackages_datasクラスのインスタンスを作成し、ファイルパスを引数にしてメソッドを呼び出します。

    注意事項の宣言についてのお知らせ項目について 実験段階ですので未完成部分が多いですがご了承ください。

なお、ks903_aivoice_vr5_Beta_Sample_test_runの時の状況に踏まえて追加項目として(2023/11/5/16:14)、本ライブラリはKS903NaturalIntonationAIVoice_Bate_vr_1と比較して認識速度が格段に向上しています。

KS903NaturalIntonation_AIVoice_Bate__real_later_stbel_inadex_last_doctypeは、KS903NaturalIntonationAIVoice_Bate_vrの最終のバージョンとして、今後はKS903NaturalIntonationAIVoice_Bate_vrを廃版とします。そのため今後は[KS903NaturalIntonationAIVoice]シリーズのサンプルテスト版はリリースされませんのでご注意ください。そして、今後の趣旨の本作[KS903NaturalIntonationAIVoice]の本作プロジェクトに切り替えることを宣言します。

今後については正式版の本作[KS903NaturalIntonationAIVoice]のプロジェクトが新規リリースしていきますので本現行状況についてはこの方針を採用していきますのでご了承ください。

今後何かお知らせがあるばあについてはその都度報告いたしますのでよろしく願います。

インストール方法(最終バージョン)

このライブラリはpipを使用してインストールできます。また、動作確認としてWindodosの音声合成適用バージョンが必要です。これにより、音声合成機能が実装されています。 使用方法?使い方の例として! コマンドラインで以下のように実行します。 このライブラリは、pip を使用してインストールできます。

pip install KS903NaturalIntonationAIVoice_Bate_vr_FinalLAST_librarypackages_datas

pythonファイル直接テキストファイル読み込む場合

bash
コードをコピーする

python v_bate_test_last.py <テキストファイルパス>=文字で直接入力するもしくはテキストファイルでもよいです。


pythonファイル単一で書く場合について

pythonファイル単一で書く場合は以下の通りです。


# v_bate_test_last.py
from KS903_Natural_Voice__AI_speech_sample_last import  KS903NaturalIntonationAIVoice_Bate_vr_FinalLAST_librarypackages_datas


# クラスのインスタンスを生成
instance = KS903NaturalIntonationAIVoice_Bate_vr_FinalLAST_librarypackages_datas()

# run() メソッドを明示的に呼び出す
instance.KS903_Ntural_Voice__AI_speech_Beta_Sample_doctypeStarts_real_later_stbel_inadex_last_run()



これにより、指定されたテキストファイルの内容が音声で再生され、その内容がコンソールに逐次表示されます。

このライブラリは、音声合成とテキスト表示を組み合わせたインタラクティブな体験を提供し、教育や情報提示のための強力なツールとなることを趣旨としています。

実験段階ですので未完成部分多いですがご了承ください。




以上をもってご説明を終了します。









Creator/Inventor: NPO_KS_903.lnc (President: Takeshi Kumura, Director: Takuma Ozawa)
Developer: NPO_KS_903.lnc (President: Takeshi Kumura, Director: Takuma Ozawa)
Designer/Architect: NPO_KS_903.lnc (President: Takeshi Kumura, Director: Takuma Ozawa)
Founder: NPO_KS_903.lnc (President: Takeshi Kumura, Director: Takuma Ozawa)

Project details


Download files

Download the file for your platform. If you're not sure which to choose, learn more about installing packages.

Source Distributions

No source distribution files available for this release.See tutorial on generating distribution archives.

Built Distribution

File details

Details for the file KS903NaturalIntonationAIVoice_Bate_vr_FinalLAST_librarypackages_datas-9.9.1.0.8-py3-none-any.whl.

File metadata

File hashes

Hashes for KS903NaturalIntonationAIVoice_Bate_vr_FinalLAST_librarypackages_datas-9.9.1.0.8-py3-none-any.whl
Algorithm Hash digest
SHA256 509676792269fa38688f2c5b16da37df94c9a20f67e6fa4f6185e643284c4d8c
MD5 93b5897cf3ed7360179d79ce2d2feadc
BLAKE2b-256 f52e4d2417452ed767c0fcb59591411008dbc4fa6e9080737446775f2d698aec

See more details on using hashes here.

Supported by

AWS AWS Cloud computing and Security Sponsor Datadog Datadog Monitoring Fastly Fastly CDN Google Google Download Analytics Microsoft Microsoft PSF Sponsor Pingdom Pingdom Monitoring Sentry Sentry Error logging StatusPage StatusPage Status page