Skip to main content

Analyze and parse natural language temporal expression from Japanese sentences

Project description

ja-timex

自然言語で書かれた時間情報表現を抽出/規格化するルールベースの解析器

概要

ja-timex は、現代日本語で書かれた自然文に含まれる時間情報表現を抽出しTIMEX3と呼ばれるアノテーション仕様に変換することで、プログラムが利用できるような形に規格化するルールベースの解析器です。

以下の機能を持っています。

  • ルールベースによる日本語テキストからの日付や時刻、期間や頻度といった時間情報表現を抽出
  • アラビア数字/漢数字、西暦/和暦などの多彩なフォーマットに対応
  • 時間表現のdatetime/timedeltaオブジェクトへの変換サポート

入力

from ja_timex import TimexParser

timexes = TimexParser().parse("彼は2008年4月から週に3回のジョギングを、朝8時から1時間行ってきた")

出力

[<TIMEX3 tid="t0" type="DATE" value="2008-04-XX" text="2008年4月">,
 <TIMEX3 tid="t1" type="SET" value="P1W" freq="3X" text="週に3回">,
 <TIMEX3 tid="t2" type="TIME" value="T08-XX-XX" text="朝8時">,
 <TIMEX3 tid="t3" type="DURATION" value="PT1H" text="1時間">]

datetime/timedeltaへの変換

# <TIMEX3 tid="t0" type="DATE" value="2008-04-XX" text="2008年4月">
In []: timexes[0].to_datetime()
Out[]: DateTime(2008, 4, 1, 0, 0, 0, tzinfo=Timezone('Asia/Tokyo'))
# <TIMEX3 tid="t3" type="DURATION" value="PT1H" text="1時間">
In []: timexes[3].to_duration()
Out[]: Duration(hours=1)

インストール

pip install ja-timex

ドキュメント

ja-timex documentation

参考仕様

本パッケージは、以下の論文で提案されている時間情報アノテーションの枠組みを元に作成しています。

Project details


Download files

Download the file for your platform. If you're not sure which to choose, learn more about installing packages.

Source Distribution

ja-timex-0.2.7.tar.gz (24.2 kB view details)

Uploaded Source

Built Distribution

If you're not sure about the file name format, learn more about wheel file names.

ja_timex-0.2.7-py3-none-any.whl (27.7 kB view details)

Uploaded Python 3

File details

Details for the file ja-timex-0.2.7.tar.gz.

File metadata

  • Download URL: ja-timex-0.2.7.tar.gz
  • Upload date:
  • Size: 24.2 kB
  • Tags: Source
  • Uploaded using Trusted Publishing? No
  • Uploaded via: poetry/1.2.0 CPython/3.8.13 Linux/5.15.0-1019-azure

File hashes

Hashes for ja-timex-0.2.7.tar.gz
Algorithm Hash digest
SHA256 3360d9bc0318dfbafd7c9d6de99e3cc790f11c65d0cea2416f19e27aaa23bdec
MD5 e5f9d5f299e65ad55bf009435449fa35
BLAKE2b-256 0f78ccc52fb9bb01bfd6290299551ea15ab4cc6beb44e0e8b74d4a18ae3a759f

See more details on using hashes here.

File details

Details for the file ja_timex-0.2.7-py3-none-any.whl.

File metadata

  • Download URL: ja_timex-0.2.7-py3-none-any.whl
  • Upload date:
  • Size: 27.7 kB
  • Tags: Python 3
  • Uploaded using Trusted Publishing? No
  • Uploaded via: poetry/1.2.0 CPython/3.8.13 Linux/5.15.0-1019-azure

File hashes

Hashes for ja_timex-0.2.7-py3-none-any.whl
Algorithm Hash digest
SHA256 6c5ccd0c3eae3204fa8bb55538618be29d96f8f9ccf1cb2bdc28071d662a467b
MD5 1efce16c9432ead108de2e96166c9f92
BLAKE2b-256 6bad966cb3eb0c92ab437c82142c6380dadea0be51b25f8ea309c4b60c7fd576

See more details on using hashes here.

Supported by

AWS Cloud computing and Security Sponsor Datadog Monitoring Depot Continuous Integration Fastly CDN Google Download Analytics Pingdom Monitoring Sentry Error logging StatusPage Status page