Skip to main content

通用、便捷、准确的字符串时间解析工具

Project description

gggdtparser

通用时间解析器(General General General DateTime Parser) ,是基于Python编写的字符串时间抽取解析工具,经过了众多测试用例进行测试,具有通用、高效、准确的解析能力。

项目背景

  1. 在日常开发中,特别是爬虫采集时,来自各种语言、各种格式、语义化话的字符串时间,对其解析非常复杂繁琐。
  2. 通用的字符串解析需要考虑的情况很多,既要尽可能多地满足各类字符串时间格式,还需对解析出的结果的准确有很高要求。
  3. Python中各类解析库,在解析前的要求很高,只能解析无噪声的字符串时间,极为不方便。

项目原理

  1. 采用正则的方式完成对时间的抽取,进一步对抽取到的时间进行解析,即抽取和解析一体,用户给与的时间文本可以有很多非时间内容,使得解析更加便捷。
  2. 对语义话时间进行计算,对其他语言进行支持。
  3. 使用正则规则,后续增加特殊时间格式较为方便。

项目特色

  1. 文本时间内能包含一些噪音
  2. 解析速度快

使用方法

安装

pip install gggdtparser

使用

import gggdtparser
parse_dt = gggdtparser.parse("发布:2022/02/02 02:02:02,来源:xxx网")
print(parse_dt)  # 2022-02-02 02:02:02

测试

import datetime
import gggdtparser
parse_dt = gggdtparser.parse("发布:2022/02/02 02:02:02,来源:xxx网")
is_right = gggdtparser.check(parse_dt, datetime.datetime(year=2022, month=2, day=2, hour=2, minute=2, second=2))
print(is_right)  # True

使用案例

详细案例

  1. 参考dtformat.md中支持的格式。
  2. 参考test.py中的测试案例。

特色案例

  1. 语义时间的支持
   il y a 26 minutes
   il y a 1 heure
   Publié aujourd’hui à 10h34, modifié à 10h39
   23分鐘前
   ......      

  1. 允许噪音
   发布于:2023/2/20
   Hoje Macau - 4 Abr 2023 
   2023年04月10日 07:46 来源:新闻网
   ......
  1. 支持多种语言
   31 март 2023  # 俄语
   31 de marzo de 2023  # 西班牙语
   27 Fev 2023  # 卡拜尔语
   ......

待完善

  1. 兼容更多语言
  2. 对时区的解析

关于作者

  1. 邮箱:1194542196@qq.com
  2. 微信:hu1194542196
  3. 目前对常见的时间格式解析支持比较全,但是一些特殊的时间格式和其他语言的支持不够完善,如果遇到解析bug 或不能解析的时间格式,可以私信作者,你们的提供越多,本库才能更完善。

Project details


Download files

Download the file for your platform. If you're not sure which to choose, learn more about installing packages.

Source Distribution

gggdtparser-0.1.2.tar.gz (18.3 kB view details)

Uploaded Source

Built Distribution

If you're not sure about the file name format, learn more about wheel file names.

gggdtparser-0.1.2-py3-none-any.whl (28.1 kB view details)

Uploaded Python 3

File details

Details for the file gggdtparser-0.1.2.tar.gz.

File metadata

  • Download URL: gggdtparser-0.1.2.tar.gz
  • Upload date:
  • Size: 18.3 kB
  • Tags: Source
  • Uploaded using Trusted Publishing? No
  • Uploaded via: twine/4.0.2 CPython/3.9.5

File hashes

Hashes for gggdtparser-0.1.2.tar.gz
Algorithm Hash digest
SHA256 2b0de4185acadf669d440ba39fcd0c1a22c94c0a783fd4b454312f739ad24a1e
MD5 aa33e3cc27a93fdd31e6ea63016cf4c0
BLAKE2b-256 aa52d81a8eb9d1c831352da738ebab873d00954da8890485ec979f30c862bcdd

See more details on using hashes here.

File details

Details for the file gggdtparser-0.1.2-py3-none-any.whl.

File metadata

  • Download URL: gggdtparser-0.1.2-py3-none-any.whl
  • Upload date:
  • Size: 28.1 kB
  • Tags: Python 3
  • Uploaded using Trusted Publishing? No
  • Uploaded via: twine/4.0.2 CPython/3.9.5

File hashes

Hashes for gggdtparser-0.1.2-py3-none-any.whl
Algorithm Hash digest
SHA256 32c422fc2d32c7d20569756920d2151172004268b6d23bdcdd5cfa9f7b6e00b1
MD5 f3ab2bed656c6812165475a9083614ea
BLAKE2b-256 250e66f3a7fdbdcf818ef479cba35af0bd8f87de8ab0c5720b0bafb4f6bef3f5

See more details on using hashes here.

Supported by

AWS Cloud computing and Security Sponsor Datadog Monitoring Depot Continuous Integration Fastly CDN Google Download Analytics Pingdom Monitoring Sentry Error logging StatusPage Status page