日本語テキストにふりがなを付与するツール
Project description
skfurigana
日本語テキストにふりがな(ルビ)を付与し、さらに英数字をカタカナに自動変換するPythonパッケージです。
形態素解析(fugashi + unidic)によるふりがな付与に加え、DeepSeek APIを利用して英数字をカタカナに変換します。
特徴
- 日本語テキストに自動でふりがなを付与
- 英数字や記号をカタカナに変換(DeepSeek API利用)
- シンプルなAPIで非同期処理にも対応
インストール
pip install skfurigana
または、リポジトリをクローンして直接インストールも可能です。
git clone https://github.com/sugarkwork/furigana.git
cd furigana
pip install .
依存パッケージ
- fugashi[unidic]
- unidic
- skpmem
- json_repair
- chat_assistant
DeepSeek APIキーの設定
本パッケージの一部機能(英数字のカタカナ変換)には DeepSeek API キーが必要です。
プロジェクトのルートディレクトリに .env ファイルを作成し、以下のようにAPIキーを記載してください。
DEEPSEEK_API_KEY=あなたのAPIキー
使い方
ふりがな付与(同期処理)
from skfurigana import add_furigana
text = "お弁当を食べながら空を見上げているうちに、お弁当箱は空になった。"
result = add_furigana(text)
print(''.join(map(str, result)))
# 出力例: [お(お)][弁(べん)][当(とう)] を [食(た)]べながら[空(そら)]を...
ふりがな+英数字カタカナ変換(非同期処理)
import asyncio
from skfurigana import convert_furigana
async def main():
text = "LibreChatのdatabase全体をtext形式でdumpする方法について。"
result = await convert_furigana(text)
print(''.join(map(str, result)))
asyncio.run(main())
# 出力例: [LibreChat(リブレチャット)]の[database(データベース)]全体を[text(テキスト)]形式で...
英数字のみカタカナ変換(非同期処理)
import asyncio
from skfurigana import KatakanaTranslator
async def main():
translator = KatakanaTranslator()
words = ["LibreChat", "database", "text"]
result = await translator.translate_to_katakana(words)
print(result) # {'LibreChat': 'リブレチャット', 'database': 'データベース', ...}
asyncio.run(main())
ライセンス
MIT License
リンク
Project details
Download files
Download the file for your platform. If you're not sure which to choose, learn more about installing packages.
Source Distribution
skfurigana-0.1.5.tar.gz
(8.8 kB
view details)
Built Distribution
Filter files by name, interpreter, ABI, and platform.
If you're not sure about the file name format, learn more about wheel file names.
Copy a direct link to the current filters
File details
Details for the file skfurigana-0.1.5.tar.gz.
File metadata
- Download URL: skfurigana-0.1.5.tar.gz
- Upload date:
- Size: 8.8 kB
- Tags: Source
- Uploaded using Trusted Publishing? No
- Uploaded via: twine/6.1.0 CPython/3.12.1
File hashes
| Algorithm | Hash digest | |
|---|---|---|
| SHA256 |
2761d82be0f9a5b9b15042ea3c1c6c0bc6118b7742b43bfe232eebc43d9fc412
|
|
| MD5 |
3862cac132d3d7045e31ce5419cf46f7
|
|
| BLAKE2b-256 |
f3a2a4de3c20a59167f3e7d23837cba6d4e8f8e3bd13f55cc11ed1cc1c65a2be
|
File details
Details for the file skfurigana-0.1.5-py3-none-any.whl.
File metadata
- Download URL: skfurigana-0.1.5-py3-none-any.whl
- Upload date:
- Size: 8.7 kB
- Tags: Python 3
- Uploaded using Trusted Publishing? No
- Uploaded via: twine/6.1.0 CPython/3.12.1
File hashes
| Algorithm | Hash digest | |
|---|---|---|
| SHA256 |
ce699e538e1734426163565485eb59bdd36ef4d37231ae2f593ccb000d3aa04c
|
|
| MD5 |
8955b528360a6b45f4e7e749c6567e43
|
|
| BLAKE2b-256 |
3bc0ee7d1251327192d9991b675c01d9ae17c9242d5b8868f467015667eb743a
|