通用、便捷、准确的字符串时间解析工具
Project description
gggdtparser
通用时间解析器(General General General DateTime Parser) ,是基于Python编写的字符串时间抽取解析工具,经过了众多测试用例进行测试,具有通用、高效、准确的解析能力。
项目背景
- 在日常开发中,特别是爬虫采集时,来自各种语言、各种格式、语义化话的字符串时间,对其解析非常复杂繁琐。
- 通用的字符串解析需要考虑的情况很多,既要尽可能多地满足各类字符串时间格式,还需对解析出的结果的准确有很高要求。
- Python中各类解析库,在解析前的要求很高,只能解析无噪声的字符串时间,极为不方便。
项目原理
- 采用正则的方式完成对时间的抽取,进一步对抽取到的时间进行解析,即抽取和解析一体,用户给与的时间文本可以有很多非时间内容,使得解析更加便捷。
- 对语义话时间进行计算,对其他语言进行支持。
- 使用正则规则,后续增加特殊时间格式较为方便。
使用方法
安装
pip install gggdtparser
使用
import gggdtparser
dt = gggdtparser.parse("发布:2022/02/02 02:02:02,来源:xxx网")
print(dt)
使用案例
- 参考dtformat.md中支持的格式。
- 参考test.py中的测试案例。
关于作者
- 邮箱:1194542196@qq.com
- 微信:hu1194542196
- 目前对常见的时间格式解析支持比较全,但是一些特殊的时间格式和其他语言的支持不够完善,如果遇到解析bug或不能解析的时间格式,可以私信作者,你们的提供越多,本库才能更完善。
Project details
Release history Release notifications | RSS feed
Download files
Download the file for your platform. If you're not sure which to choose, learn more about installing packages.
Source Distribution
gggdtparser-0.0.3.tar.gz
(10.1 kB
view hashes)
Built Distribution
Close
Hashes for gggdtparser-0.0.3-py3-none-any.whl
Algorithm | Hash digest | |
---|---|---|
SHA256 | 854e6ca6e147cb5deccadc1eb16080fe3583f44366fc2ae4c766ea5a37b8707a |
|
MD5 | 0e3ec2d606ca2ad57d867b6ebd04e2d2 |
|
BLAKE2b-256 | 9ba9259a8c583ed80c65f72e019d4aca5a209c7bd20aab9137895f25447b4168 |