数据表概览-数据分析第一步
Project description
数据概览工具
当前支持的功能:基于Pandas
的DataFrame,生成该DataFrame的表和字段粒度概览,HTML格式。
当前功能:
-
数据表概览
- 数据表行数,列数,内存大小
- 各类型数据字段数量
-
数据字段概览
- 每个字段的类型,数量,去重后数量,缺失值数量,缺失率等
-
数据字段详情
- 每个字段的详细信息
在研功能:
- 导出excel和csv
- 其他
使用示例:
参考data_overview/Usage.ipynb
文件
import pandas as pd
import data_overview as do # 前提是先要执行:pip install data_overview进行安装
# 载入数据
df = pd.read_csv("./data/test_data.csv", encoding='gb18030')
# 用法:输入df,可导出数据概览
dfo = do.DataOverview(df)
dfo.to_html("./data/report.html") # 导出路径和命名自定义
Project details
Release history Release notifications | RSS feed
Download files
Download the file for your platform. If you're not sure which to choose, learn more about installing packages.
Source Distribution
data_overview-0.1.0.tar.gz
(42.8 kB
view hashes)
Built Distribution
Close
Hashes for data_overview-0.1.0-py3-none-any.whl
Algorithm | Hash digest | |
---|---|---|
SHA256 | 51ed796ceb5934a172a686a7b68122b921869ef7c5e84997252ed86e0250192e |
|
MD5 | 784947e7622d2a4cabe4ed71f6f0e77c |
|
BLAKE2b-256 | 811cd760106ce2153dc8b8666e013480b55beab45394d40a58f227cd91d40cab |