Skip to main content

Analyze and parse natural language temporal expression from Japanese sentences

Project description

ja-timex

自然言語で書かれた時間情報表現を抽出/規格化するルールベースの解析器

概要

ja-timex は、現代日本語で書かれた自然文に含まれる時間情報表現を抽出しTIMEX3と呼ばれるアノテーション仕様に変換することで、プログラムが利用できるような形に規格化するルールベースの解析器です。

以下の機能を持っています。

  • ルールベースによる日本語テキストからの日付や時刻、期間や頻度といった時間情報表現を抽出
  • アラビア数字/漢数字、西暦/和暦などの多彩なフォーマットに対応
  • 時間表現のdatetime/timedeltaオブジェクトへの変換サポート

入力

from ja_timex import TimexParser

timexes = TimexParser().parse("彼は2008年4月から週に3回のジョギングを、朝8時から1時間行ってきた")

出力

[<TIMEX3 tid="t0" type="DATE" value="2008-04-XX" text="2008年4月">,
 <TIMEX3 tid="t1" type="SET" value="P1W" freq="3X" text="週に3回">,
 <TIMEX3 tid="t2" type="TIME" value="T08-XX-XX" text="朝8時">,
 <TIMEX3 tid="t3" type="DURATION" value="PT1H" text="1時間">]

datetime/timedeltaへの変換

# <TIMEX3 tid="t0" type="DATE" value="2008-04-XX" text="2008年4月">
In []: timexes[0].to_datetime()
Out[]: DateTime(2008, 4, 1, 0, 0, 0, tzinfo=Timezone('Asia/Tokyo'))
# <TIMEX3 tid="t3" type="DURATION" value="PT1H" text="1時間">
In []: timexes[3].to_duration()
Out[]: Duration(hours=1)

インストール

pip install ja-timex

ドキュメント

ja-timex documentation

参考仕様

本パッケージは、以下の論文で提案されている時間情報アノテーションの枠組みを元に作成しています。

Project details


Download files

Download the file for your platform. If you're not sure which to choose, learn more about installing packages.

Source Distribution

ja_timex-0.2.8.tar.gz (23.8 kB view details)

Uploaded Source

Built Distribution

ja_timex-0.2.8-py3-none-any.whl (27.7 kB view details)

Uploaded Python 3

File details

Details for the file ja_timex-0.2.8.tar.gz.

File metadata

  • Download URL: ja_timex-0.2.8.tar.gz
  • Upload date:
  • Size: 23.8 kB
  • Tags: Source
  • Uploaded using Trusted Publishing? No
  • Uploaded via: poetry/1.7.0 CPython/3.8.18 Linux/6.2.0-1015-azure

File hashes

Hashes for ja_timex-0.2.8.tar.gz
Algorithm Hash digest
SHA256 5942d294050eee520a62ae4c7c6c1fc9132d2a00f137ff53013c901c9104d4bd
MD5 ccfaee4b4d68f8c35bba52f490d56fc0
BLAKE2b-256 6997c8cd9fc4e6c0e80aabaae1a822f7d1737e44bf149cc4a2a4e0f8934d788a

See more details on using hashes here.

File details

Details for the file ja_timex-0.2.8-py3-none-any.whl.

File metadata

  • Download URL: ja_timex-0.2.8-py3-none-any.whl
  • Upload date:
  • Size: 27.7 kB
  • Tags: Python 3
  • Uploaded using Trusted Publishing? No
  • Uploaded via: poetry/1.7.0 CPython/3.8.18 Linux/6.2.0-1015-azure

File hashes

Hashes for ja_timex-0.2.8-py3-none-any.whl
Algorithm Hash digest
SHA256 5a68dd432ebd56dafb4831bd3cae3b49d3517030c6a3e6a7b9c540f5d1ea887d
MD5 3406bf7a3f71f9617a95d03fdbefc1ed
BLAKE2b-256 1cdddc73c7871daa0e927cb12d5ddbe8357255dd92af94ea3095238f576adde8

See more details on using hashes here.

Supported by

AWS AWS Cloud computing and Security Sponsor Datadog Datadog Monitoring Fastly Fastly CDN Google Google Download Analytics Microsoft Microsoft PSF Sponsor Pingdom Pingdom Monitoring Sentry Sentry Error logging StatusPage StatusPage Status page