Analyze and parse natural language temporal expression from Japanese sentences
Project description
ja-timex
自然言語で書かれた時間情報表現を抽出/規格化するルールベースの解析器
概要
ja-timex
は、現代日本語で書かれた自然文に含まれる時間情報表現を抽出しTIMEX3
と呼ばれるアノテーション仕様に変換することで、プログラムが利用できるような形に規格化するルールベースの解析器です。
以下の機能を持っています。
- ルールベースによる日本語テキストからの日付や時刻、期間や頻度といった時間情報表現を抽出
- アラビア数字/漢数字、西暦/和暦などの多彩なフォーマットに対応
- 時間表現のdatetime/timedeltaオブジェクトへの変換サポート
入力
from ja_timex import TimexParser
timexes = TimexParser().parse("彼は2008年4月から週に3回のジョギングを、朝8時から1時間行ってきた")
出力
[<TIMEX3 tid="t0" type="DATE" value="2008-04-XX" text="2008年4月">,
<TIMEX3 tid="t1" type="SET" value="P1W" freq="3X" text="週に3回">,
<TIMEX3 tid="t2" type="TIME" value="T08-XX-XX" text="朝8時">,
<TIMEX3 tid="t3" type="DURATION" value="PT1H" text="1時間">]
datetime/timedeltaへの変換
# <TIMEX3 tid="t0" type="DATE" value="2008-04-XX" text="2008年4月">
In []: timexes[0].to_datetime()
Out[]: DateTime(2008, 4, 1, 0, 0, 0, tzinfo=Timezone('Asia/Tokyo'))
# <TIMEX3 tid="t3" type="DURATION" value="PT1H" text="1時間">
In []: timexes[3].to_duration()
Out[]: Duration(hours=1)
インストール
pip install ja-timex
ドキュメント
参考仕様
本パッケージは、以下の論文で提案されている時間情報アノテーションの枠組みを元に作成しています。
Project details
Release history Release notifications | RSS feed
Download files
Download the file for your platform. If you're not sure which to choose, learn more about installing packages.
Source Distribution
ja_timex-0.2.8.tar.gz
(23.8 kB
view details)
Built Distribution
ja_timex-0.2.8-py3-none-any.whl
(27.7 kB
view details)
File details
Details for the file ja_timex-0.2.8.tar.gz
.
File metadata
- Download URL: ja_timex-0.2.8.tar.gz
- Upload date:
- Size: 23.8 kB
- Tags: Source
- Uploaded using Trusted Publishing? No
- Uploaded via: poetry/1.7.0 CPython/3.8.18 Linux/6.2.0-1015-azure
File hashes
Algorithm | Hash digest | |
---|---|---|
SHA256 | 5942d294050eee520a62ae4c7c6c1fc9132d2a00f137ff53013c901c9104d4bd |
|
MD5 | ccfaee4b4d68f8c35bba52f490d56fc0 |
|
BLAKE2b-256 | 6997c8cd9fc4e6c0e80aabaae1a822f7d1737e44bf149cc4a2a4e0f8934d788a |
File details
Details for the file ja_timex-0.2.8-py3-none-any.whl
.
File metadata
- Download URL: ja_timex-0.2.8-py3-none-any.whl
- Upload date:
- Size: 27.7 kB
- Tags: Python 3
- Uploaded using Trusted Publishing? No
- Uploaded via: poetry/1.7.0 CPython/3.8.18 Linux/6.2.0-1015-azure
File hashes
Algorithm | Hash digest | |
---|---|---|
SHA256 | 5a68dd432ebd56dafb4831bd3cae3b49d3517030c6a3e6a7b9c540f5d1ea887d |
|
MD5 | 3406bf7a3f71f9617a95d03fdbefc1ed |
|
BLAKE2b-256 | 1cdddc73c7871daa0e927cb12d5ddbe8357255dd92af94ea3095238f576adde8 |