Skip to main content

Analyze and parse natural language temporal expression from Japanese sentences

Project description

ja-timex

自然言語で書かれた時間情報表現を抽出/規格化するルールベースの解析器

概要

ja-timex は、現代日本語で書かれた自然文に含まれる時間情報表現を抽出しTIMEX3と呼ばれるアノテーション仕様に変換することで、プログラムが利用できるような形に規格化するルールベースの解析器です。

以下の機能を持っています。

  • ルールベースによる日本語テキストからの日付や時刻、期間や頻度といった時間情報表現を抽出
  • アラビア数字/漢数字、西暦/和暦などの多彩なフォーマットに対応
  • 時間表現のdatetime/timedeltaオブジェクトへの変換サポート

入力

from ja_timex import TimexParser

timexes = TimexParser().parse("彼は2008年4月から週に3回ジョギングを1時間行ってきた")

出力

[<TIMEX3 tid="t0" type="DATE" value="2008-04-XX" text="2008年4月">,
 <TIMEX3 tid="t1" type="SET" value="P1W" freq="3X" text="週に3回">,
 <TIMEX3 tid="t2" type="DURATION" value="PT1H" text="1時間">]

datetime/timedeltaへの変換

# <TIMEX3 tid="t0" type="DATE" value="2008-04-XX" text="2008年4月">
In []: timexes[0].to_datetime()
Out[]: DateTime(2008, 4, 1, 0, 0, 0, tzinfo=Timezone('Asia/Tokyo'))
# <TIMEX3 tid="t2" type="DURATION" value="PT1H" text="1時間">
In []: timexes[2].to_duration()
Out[]: Duration(hours=1)

インストール

pip install ja-timex

ドキュメント

ja-timex documentation

参考仕様

本パッケージは、以下の論文で提案されている時間情報アノテーションの枠組みを元に作成しています。

Project details


Download files

Download the file for your platform. If you're not sure which to choose, learn more about installing packages.

Source Distribution

ja-timex-0.2.0.tar.gz (22.3 kB view details)

Uploaded Source

Built Distribution

ja_timex-0.2.0-py3-none-any.whl (25.5 kB view details)

Uploaded Python 3

File details

Details for the file ja-timex-0.2.0.tar.gz.

File metadata

  • Download URL: ja-timex-0.2.0.tar.gz
  • Upload date:
  • Size: 22.3 kB
  • Tags: Source
  • Uploaded using Trusted Publishing? No
  • Uploaded via: poetry/1.1.8 CPython/3.8.11 Linux/5.8.0-1040-azure

File hashes

Hashes for ja-timex-0.2.0.tar.gz
Algorithm Hash digest
SHA256 e0d9b834db9eb993acb283e36f7ed4c3d020f1b501363e3ac856f2653f362cf4
MD5 6464e02557c9b989e0183d51dcee0e51
BLAKE2b-256 a206b9a131d93c9a751760c5d3ee69477f6ac8be3fe55c3dbc675fb8ad911699

See more details on using hashes here.

File details

Details for the file ja_timex-0.2.0-py3-none-any.whl.

File metadata

  • Download URL: ja_timex-0.2.0-py3-none-any.whl
  • Upload date:
  • Size: 25.5 kB
  • Tags: Python 3
  • Uploaded using Trusted Publishing? No
  • Uploaded via: poetry/1.1.8 CPython/3.8.11 Linux/5.8.0-1040-azure

File hashes

Hashes for ja_timex-0.2.0-py3-none-any.whl
Algorithm Hash digest
SHA256 91ab4db99f6a1ce0128aaba8d73b5ee0e1aa180395429395b74f15367a6bd311
MD5 f71fb6112559d4aaa02a5d3df139b350
BLAKE2b-256 85caa36a948d5e45e22a4472eb3e5f9199335d76dafb72833c0bad47d783366d

See more details on using hashes here.

Supported by

AWS Cloud computing and Security Sponsor Datadog Monitoring Fastly CDN Google Download Analytics Pingdom Monitoring Sentry Error logging StatusPage Status page