通用、便捷、准确的字符串时间解析工具
Project description
gggdtparser
通用时间解析器(General General General DateTime Parser) ,是基于Python编写的字符串时间抽取解析工具,经过了众多测试用例进行测试,具有通用、高效、准确的解析能力。
项目背景
- 在日常开发中,特别是爬虫采集时,来自各种语言、各种格式、语义化话的字符串时间,对其解析非常复杂繁琐。
- 通用的字符串解析需要考虑的情况很多,既要尽可能多地满足各类字符串时间格式,还需对解析出的结果的准确有很高要求。
- Python中各类解析库,在解析前的要求很高,只能解析无噪声的字符串时间,极为不方便。
项目原理
- 采用正则的方式完成对时间的抽取,进一步对抽取到的时间进行解析,即抽取和解析一体,用户给与的时间文本可以有很多非时间内容,使得解析更加便捷。
- 对语义话时间进行计算,对其他语言进行支持。
- 使用正则规则,后续增加特殊时间格式较为方便。
使用方法
安装
pip install gggdtparser
使用
import gggdtparser
dt = gggdtparser.parse("发布:2022/02/02 02:02:02,来源:xxx网")
print(dt)
使用案例
- 参考dtformat.md中支持的格式。
- 参考test.py中的测试案例。
关于作者
- 邮箱:1194542196@qq.com
- 微信:hu1194542196
- 目前对常见的时间格式解析支持比较全,但是一些特殊的时间格式和其他语言的支持不够完善,如果遇到解析bug或不能解析的时间格式,可以私信作者,你们的提供越多,本库才能更完善。
Project details
Release history Release notifications | RSS feed
Download files
Download the file for your platform. If you're not sure which to choose, learn more about installing packages.
Source Distribution
gggdtparser-0.0.2.tar.gz
(10.0 kB
view hashes)
Built Distribution
Close
Hashes for gggdtparser-0.0.2-py3-none-any.whl
Algorithm | Hash digest | |
---|---|---|
SHA256 | 25d52f196bd1b5e0e099c19c7e83d4d97d318413fd3fc05e02ad8c22929a280c |
|
MD5 | 4317945613201ba10b7d3916aea8a9da |
|
BLAKE2b-256 | b4e5f7fe532a2125ebbe78b38f0e74b14c9a3c30f14d36e3a5fd118d955094eb |