use this filter to analys pandas quicker and smarter
Project description
dfilter-python:机器学习一些统计量的分析工具
===============================
**注意: 本项目维护更新看作者心情!**
.. contents::
介绍
----
dfilter-python 采用 Python2.7 编写。
import,很简单:
.. code-block:: python
import dfilter
快速开始
---------
准备
~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
**Tips** :
1. 确保你的系统里面已经安装了 `Python2.7 <https://www.python.org/>`_ ,不同作业系统如何安装不再赘述。
2. 检查你系统中 `python` 和 `pip` 的版本, 如果不属于 `python2.7` , 请在执行代码范例时,自行将 `python` 和 `pip` 分别替换成 `python2.7` 和 `pip2` 。
3. 确保你的系统中安装了 `git` 程序 以及 `python-pip` 。
函数使用 ----在 pandas 后
~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
**get_colume_name_as_list** (dataframe)
得到数据的列名称。
**basic_info** (dataframe,列名)
得到数据列的基础信息。
**get_coverage** (dataframe,列名)
得到数据列元素的覆盖率。
**get_pearson_similarity** (dataframe,列名1,列名2,是否均值填充空值)
得到数据的皮尔逊相关系数。
**get_fisher_score** (dataframe,列名1,y[列表],是否均值填充空值)
得到数据的Fisher得分。
**get_fisher_score_with_list** (dataframe,[列名1,列名2,.....],y[列表],是否均值填充空值)
输入列中元素的Fisher得分。
**get_K_L_divergence** (dataframe,列名1,列名2)
输入列中元素的KL散度
**get_K_L_divergence_as_list** (dataframe,[列名1,列名2,.....])
输入列中元素的KL散度。
**get_K_L_divergence_as_list_with_y** (dataframe,[列名1,列名2,.....],y[列表])
输入列中元素的KL散度。
**check_normal_cluster** (dataframe,列名,是否均值填充空值)
输入列中元素的 正态检验
**get_homogeneity_of_variance** (dataframe,列名1,列名2,是否均值填充空值)
输入列中元素的 方差齐性检验
**compare_between_two_couples** (dataframe,列名1,列名2,是否均值填充空值)
输入列中元素的 两组数之间的比较
===============================
**注意: 本项目维护更新看作者心情!**
.. contents::
介绍
----
dfilter-python 采用 Python2.7 编写。
import,很简单:
.. code-block:: python
import dfilter
快速开始
---------
准备
~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
**Tips** :
1. 确保你的系统里面已经安装了 `Python2.7 <https://www.python.org/>`_ ,不同作业系统如何安装不再赘述。
2. 检查你系统中 `python` 和 `pip` 的版本, 如果不属于 `python2.7` , 请在执行代码范例时,自行将 `python` 和 `pip` 分别替换成 `python2.7` 和 `pip2` 。
3. 确保你的系统中安装了 `git` 程序 以及 `python-pip` 。
函数使用 ----在 pandas 后
~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
**get_colume_name_as_list** (dataframe)
得到数据的列名称。
**basic_info** (dataframe,列名)
得到数据列的基础信息。
**get_coverage** (dataframe,列名)
得到数据列元素的覆盖率。
**get_pearson_similarity** (dataframe,列名1,列名2,是否均值填充空值)
得到数据的皮尔逊相关系数。
**get_fisher_score** (dataframe,列名1,y[列表],是否均值填充空值)
得到数据的Fisher得分。
**get_fisher_score_with_list** (dataframe,[列名1,列名2,.....],y[列表],是否均值填充空值)
输入列中元素的Fisher得分。
**get_K_L_divergence** (dataframe,列名1,列名2)
输入列中元素的KL散度
**get_K_L_divergence_as_list** (dataframe,[列名1,列名2,.....])
输入列中元素的KL散度。
**get_K_L_divergence_as_list_with_y** (dataframe,[列名1,列名2,.....],y[列表])
输入列中元素的KL散度。
**check_normal_cluster** (dataframe,列名,是否均值填充空值)
输入列中元素的 正态检验
**get_homogeneity_of_variance** (dataframe,列名1,列名2,是否均值填充空值)
输入列中元素的 方差齐性检验
**compare_between_two_couples** (dataframe,列名1,列名2,是否均值填充空值)
输入列中元素的 两组数之间的比较
Project details
Download files
Download the file for your platform. If you're not sure which to choose, learn more about installing packages.
Source Distribution
dfilter-0.5.tar.gz
(6.0 kB
view details)
File details
Details for the file dfilter-0.5.tar.gz.
File metadata
- Download URL: dfilter-0.5.tar.gz
- Upload date:
- Size: 6.0 kB
- Tags: Source
- Uploaded using Trusted Publishing? No
- Uploaded via: twine/1.12.1 pkginfo/1.5.0.1 requests/2.18.4 setuptools/36.5.0.post20170921 requests-toolbelt/0.9.1 tqdm/4.28.1 CPython/2.7.13
File hashes
| Algorithm | Hash digest | |
|---|---|---|
| SHA256 |
49bd56f8dbe7ed560618d6cb1637ef49fb5e5926d2ee434d04b25f0626cae55d
|
|
| MD5 |
e60425f09749c464afa41a6a0301217e
|
|
| BLAKE2b-256 |
4b1078b35defd0ca72c0e05cf0aac2f13da67c13243248142d578c03f4a901f4
|