日本語テキストにふりがなを付与するツール
Project description
skfurigana
日本語テキストにふりがな(ルビ)を付与し、さらに英数字をカタカナに自動変換するPythonパッケージです。
形態素解析(fugashi + unidic)によるふりがな付与に加え、DeepSeek APIを利用して英数字をカタカナに変換します。
特徴
- 日本語テキストに自動でふりがなを付与
- 英数字や記号をカタカナに変換(DeepSeek API利用)
- シンプルなAPIで非同期処理にも対応
インストール
pip install skfurigana
または、リポジトリをクローンして直接インストールも可能です。
git clone https://github.com/sugarkwork/furigana.git
cd furigana
pip install .
依存パッケージ
- fugashi[unidic]
- unidic
- skpmem
- json_repair
- chat_assistant
DeepSeek APIキーの設定
本パッケージの一部機能(英数字のカタカナ変換)には DeepSeek API キーが必要です。
プロジェクトのルートディレクトリに .env ファイルを作成し、以下のようにAPIキーを記載してください。
DEEPSEEK_API_KEY=あなたのAPIキー
使い方
ふりがな付与(同期処理)
from skfurigana import add_furigana
text = "お弁当を食べながら空を見上げているうちに、お弁当箱は空になった。"
result = add_furigana(text)
print(''.join(map(str, result)))
# 出力例: [お(お)][弁(べん)][当(とう)] を [食(た)]べながら[空(そら)]を...
ふりがな+英数字カタカナ変換(非同期処理)
import asyncio
from skfurigana import convert_furigana
async def main():
text = "LibreChatのdatabase全体をtext形式でdumpする方法について。"
result = await convert_furigana(text)
print(''.join(map(str, result)))
asyncio.run(main())
# 出力例: [LibreChat(リブレチャット)]の[database(データベース)]全体を[text(テキスト)]形式で...
英数字のみカタカナ変換(非同期処理)
import asyncio
from skfurigana import KatakanaTranslator
async def main():
translator = KatakanaTranslator()
words = ["LibreChat", "database", "text"]
result = await translator.translate_to_katakana(words)
print(result) # {'LibreChat': 'リブレチャット', 'database': 'データベース', ...}
asyncio.run(main())
ライセンス
MIT License
リンク
Project details
Download files
Download the file for your platform. If you're not sure which to choose, learn more about installing packages.
Source Distribution
skfurigana-0.1.2.tar.gz
(8.9 kB
view details)
Built Distribution
Filter files by name, interpreter, ABI, and platform.
If you're not sure about the file name format, learn more about wheel file names.
Copy a direct link to the current filters
File details
Details for the file skfurigana-0.1.2.tar.gz.
File metadata
- Download URL: skfurigana-0.1.2.tar.gz
- Upload date:
- Size: 8.9 kB
- Tags: Source
- Uploaded using Trusted Publishing? No
- Uploaded via: twine/6.1.0 CPython/3.12.1
File hashes
| Algorithm | Hash digest | |
|---|---|---|
| SHA256 |
e3b90e79efe6bdf4de09a6be961f8852b1f0fccafebc5c340b3a11368f780d4e
|
|
| MD5 |
7946689d0cbb35883e83af13bfd017f0
|
|
| BLAKE2b-256 |
d7fb18d8abc3dd71ca9d209c6debcee1c0ba9d7f69dafe0b00d7f2d62015ec60
|
File details
Details for the file skfurigana-0.1.2-py3-none-any.whl.
File metadata
- Download URL: skfurigana-0.1.2-py3-none-any.whl
- Upload date:
- Size: 8.7 kB
- Tags: Python 3
- Uploaded using Trusted Publishing? No
- Uploaded via: twine/6.1.0 CPython/3.12.1
File hashes
| Algorithm | Hash digest | |
|---|---|---|
| SHA256 |
fb2f362abe7a103e222baaa2cc7d4e0c83ce255e5875a45cfa8bb84169507af2
|
|
| MD5 |
652819e448943b885613d6d97be11971
|
|
| BLAKE2b-256 |
81edf7c21d196a693b7b1e59769f1b006fec93ef38ca11f3d32deed3d878114f
|