日本語テキストにふりがなを付与するツール
Project description
skfurigana
日本語テキストにふりがな(ルビ)を付与し、さらに英数字をカタカナに自動変換するPythonパッケージです。
形態素解析(fugashi + unidic)によるふりがな付与に加え、DeepSeek APIを利用して英数字をカタカナに変換します。
特徴
- 日本語テキストに自動でふりがなを付与
- 英数字や記号をカタカナに変換(DeepSeek API利用)
- シンプルなAPIで非同期処理にも対応
インストール
pip install skfurigana
または、リポジトリをクローンして直接インストールも可能です。
git clone https://github.com/sugarkwork/furigana.git
cd furigana
pip install .
依存パッケージ
- fugashi[unidic]
- unidic
- skpmem
- json_repair
- chat_assistant
DeepSeek APIキーの設定
本パッケージの一部機能(英数字のカタカナ変換)には DeepSeek API キーが必要です。
プロジェクトのルートディレクトリに .env ファイルを作成し、以下のようにAPIキーを記載してください。
DEEPSEEK_API_KEY=あなたのAPIキー
使い方
ふりがな付与(同期処理)
from skfurigana import add_furigana
text = "お弁当を食べながら空を見上げているうちに、お弁当箱は空になった。"
result = add_furigana(text)
print(''.join(map(str, result)))
# 出力例: [お(お)][弁(べん)][当(とう)] を [食(た)]べながら[空(そら)]を...
ふりがな+英数字カタカナ変換(非同期処理)
import asyncio
from skfurigana import convert_furigana
async def main():
text = "LibreChatのdatabase全体をtext形式でdumpする方法について。"
result = await convert_furigana(text)
print(''.join(map(str, result)))
asyncio.run(main())
# 出力例: [LibreChat(リブレチャット)]の[database(データベース)]全体を[text(テキスト)]形式で...
英数字のみカタカナ変換(非同期処理)
import asyncio
from skfurigana import KatakanaTranslator
async def main():
translator = KatakanaTranslator()
words = ["LibreChat", "database", "text"]
result = await translator.translate_to_katakana(words)
print(result) # {'LibreChat': 'リブレチャット', 'database': 'データベース', ...}
asyncio.run(main())
ライセンス
MIT License
リンク
Project details
Download files
Download the file for your platform. If you're not sure which to choose, learn more about installing packages.
Source Distribution
skfurigana-0.1.3.tar.gz
(8.9 kB
view details)
Built Distribution
Filter files by name, interpreter, ABI, and platform.
If you're not sure about the file name format, learn more about wheel file names.
Copy a direct link to the current filters
File details
Details for the file skfurigana-0.1.3.tar.gz.
File metadata
- Download URL: skfurigana-0.1.3.tar.gz
- Upload date:
- Size: 8.9 kB
- Tags: Source
- Uploaded using Trusted Publishing? No
- Uploaded via: twine/6.1.0 CPython/3.12.1
File hashes
| Algorithm | Hash digest | |
|---|---|---|
| SHA256 |
03374eeadcb5023688324d73030c85a298dabdc94230f6729dec957f86670308
|
|
| MD5 |
ca5f3b8a223effc772feefe01b1292d4
|
|
| BLAKE2b-256 |
87333a6bde482058451054a2b17ff11c042a608c93267c64e3f1a0d100c40f6f
|
File details
Details for the file skfurigana-0.1.3-py3-none-any.whl.
File metadata
- Download URL: skfurigana-0.1.3-py3-none-any.whl
- Upload date:
- Size: 8.8 kB
- Tags: Python 3
- Uploaded using Trusted Publishing? No
- Uploaded via: twine/6.1.0 CPython/3.12.1
File hashes
| Algorithm | Hash digest | |
|---|---|---|
| SHA256 |
df5593a0775da37de280d7c144ca505938767ebc8026d17194c712d2b4cc37a5
|
|
| MD5 |
82a85d48d08f7a220926b761f744eec0
|
|
| BLAKE2b-256 |
e99e75b7112b5e0e56949ab180113f51a4887c2c7079a91606542cf6333d487b
|