Skip to main content

A simple and convenient toolkit containing useful functions, classes, and methods.

Project description

simtoolsz

PyPI - License PyPI - Version Python - Version

English | 中文

一个简单、方便的工具集合,均是个人工作中的常用功能。对之前pytoolsz工具包的精简重构,保留最实用的功能模块。

部分功能可能还有问题,如果使用中发现问题还请反馈给我。

功能特性

🕐 时间处理 (simtoolsz.datetime)

  • 时间格式转换: 支持多种时间格式间的相互转换(中文、英文、ISO8601、秒、分钟、小时等)
  • 智能格式识别: 自动识别输入的时间格式类型
  • 枚举支持: 提供 DurationFormat 枚举类,标准化时间格式处理
  • 时间计算: 支持时间跨度的计算和转换

📧 邮件处理 (simtoolsz.mail)

  • 邮件发送: 支持HTML/纯文本邮件,附件、抄送、密送
  • 邮件接收: IMAP协议邮件读取,支持主题搜索
  • 编码支持: UTF-7编码解码,处理国际化邮件
  • 内嵌图片: 支持HTML邮件中的内嵌图片

💾 数据处理 (simtoolsz.db)

  • 压缩包数据读取: 直接从ZIP压缩包读取CSV、Excel、Parquet、JSON数据到DuckDB
  • 特殊格式支持: 支持TSV、Avro、Arrow等特殊格式文件的数据库转换
  • 批量处理: 支持多文件批量导入数据库
  • 灵活配置: 可自定义表名映射和导入参数

📖 数据读取 (simtoolsz.reader)

  • 多格式读取: 统一接口读取CSV、TSV、Excel、Parquet、JSON、IPC、Avro等格式
  • Polars集成: 基于Polars的高性能数据读取
  • 智能选择: 根据文件扩展名自动选择合适的读取器
  • Lazy加载支持: 支持大数据集的懒加载模式

🛠️ 工具函数 (simtoolsz.utils)

  • 日期获取: today() 函数,支持时区、格式化、标准datetime对象返回
  • 列表操作: take_from_list() 智能列表元素查找
  • 文件夹操作: checkFolders() 批量文件夹检查和创建
  • 文件查找: lastFile() 基于时间或大小的文件查找

国家代码转换 (simtoolsz.countrycode)

  • 国家名称到代码: 支持将国家名称转换为对应的ISO 3166-1 alpha-2代码
  • 代码到国家名称: 支持将ISO 3166-1 alpha-2代码转换为国家名称
  • G7/G20国家列表: 提供G7和G20国家的代码列表
  • 多类型国家代码转换:支持类型丰富,详细可见代码转换模块说明

安装

pip install simtoolsz

核心依赖

  • Python >= 3.11
  • pendulum >= 3.1.0
  • duckdb >= 1.4.0
  • polars >= 1.0.0

快速开始

时间格式转换

from simtoolsz.datetime import TimeConversion

# 中文时间到秒
tc = TimeConversion("1天2小时30分钟45秒", "chinese")
seconds = tc.convert("seconds")
print(f"1天2小时30分钟45秒 = {seconds}秒")

# 秒到中文时间
tc = TimeConversion(90061, "seconds")
chinese = tc.convert("chinese")
print(f"90061秒 = {chinese}")

发送邮件

from simtoolsz.mail import send_email

# 发送纯文本邮件
result = send_email(
    email_account="your@qq.com",
    password="your_password",
    subject="测试邮件",
    content="这是一封测试邮件",
    recipients="friend@example.com"
)

# 发送HTML邮件带附件
result = send_email(
    email_account="your@gmail.com",
    password="app_password",
    subject="项目报告",
    content="<h1>本月工作报告</h1><p>详见附件</p>",
    recipients=["boss@company.com", "同事<colleague@company.com>"],
    attachments=["report.pdf", "data.xlsx"],
    html_mode=True
)

数据读取

from simtoolsz.reader import getreader
import polars as pl

# 使用getreader读取CSV文件
reader = getreader("data.csv")
df = reader("data.csv")

# 读取TSV文件
df = load_tsv("data.tsv")

# Lazy加载大数据集
lazy_df = load_data("large_data.csv", lazy=True)

# 加载压缩数据集
df = load_data("large_data_archive.tar.gz/data.csv")

压缩包数据导入数据库

from simtoolsz.db import zip2db

# 从ZIP文件读取数据到DuckDB
con = zip2db(
    zip_file="data.zip",
    db_file="output.db",
    table={"users.csv": "用户表", "orders.xlsx": "订单表"}
)

# 查询数据
tables = con.execute("SHOW TABLES").fetchall()
print(f"导入的表: {tables}")

工具函数

from simtoolsz.utils import today, take_from_list

# 获取当前日期时间
current = today(addtime=True)
formatted = today(fmt="YYYY年MM月DD日 HH:mm:ss")

# 列表查找
result = take_from_list("hello", ["he", "world"])  # 返回 "he"
result = take_from_list([2, 3], [1, 2, 3, 4])    # 返回 2

国家代码转换

from simtoolsz.countrycode import CountryCode

# 初始化国家代码转换工具
cc = CountryCode()

# 转换国家名称到代码
code = cc.convert("中国")  # 返回 "CN"

# 转换代码到国家名称
name = cc.convert("US", target="name")  # 返回 "United States"

# 获取G7国家列表
g7 = cc.convert("G7", target="name")
print(g7)

Project details


Download files

Download the file for your platform. If you're not sure which to choose, learn more about installing packages.

Source Distribution

simtoolsz-0.2.15.tar.gz (159.8 kB view details)

Uploaded Source

Built Distribution

If you're not sure about the file name format, learn more about wheel file names.

simtoolsz-0.2.15-py3-none-any.whl (78.5 kB view details)

Uploaded Python 3

File details

Details for the file simtoolsz-0.2.15.tar.gz.

File metadata

  • Download URL: simtoolsz-0.2.15.tar.gz
  • Upload date:
  • Size: 159.8 kB
  • Tags: Source
  • Uploaded using Trusted Publishing? Yes
  • Uploaded via: twine/6.1.0 CPython/3.13.12

File hashes

Hashes for simtoolsz-0.2.15.tar.gz
Algorithm Hash digest
SHA256 5dbcdd9551be951c8affed0dbc7857946bbcfe9a56eaee57ce0e4f36e5817e25
MD5 c4705c8790ce01ce4ef250aa0293744e
BLAKE2b-256 ef9f84770dab331e01f20a2f05cec3c74e2989ec9b33b88fedfc8724fe990a28

See more details on using hashes here.

Provenance

The following attestation bundles were made for simtoolsz-0.2.15.tar.gz:

Publisher: publish.yml on SidneyLYZhang/simtoolsz

Attestations: Values shown here reflect the state when the release was signed and may no longer be current.

File details

Details for the file simtoolsz-0.2.15-py3-none-any.whl.

File metadata

  • Download URL: simtoolsz-0.2.15-py3-none-any.whl
  • Upload date:
  • Size: 78.5 kB
  • Tags: Python 3
  • Uploaded using Trusted Publishing? Yes
  • Uploaded via: twine/6.1.0 CPython/3.13.12

File hashes

Hashes for simtoolsz-0.2.15-py3-none-any.whl
Algorithm Hash digest
SHA256 5a21d4cc0bd242093caf07e4063246aea38564995ff719b00442b1499c45a628
MD5 2d74ab2be1ab061bfb3479b5268003c0
BLAKE2b-256 350610b945d34046beb00dec284bb8c9c959182356d92db7c2405c4a03e0fbe7

See more details on using hashes here.

Provenance

The following attestation bundles were made for simtoolsz-0.2.15-py3-none-any.whl:

Publisher: publish.yml on SidneyLYZhang/simtoolsz

Attestations: Values shown here reflect the state when the release was signed and may no longer be current.

Supported by

AWS Cloud computing and Security Sponsor Datadog Monitoring Depot Continuous Integration Fastly CDN Google Download Analytics Pingdom Monitoring Sentry Error logging StatusPage Status page