Skip to main content

use this filter to analys pandas quicker and smarter

Project description

dfilter-python:机器学习一些统计量的分析工具
===============================

**注意: 本项目维护更新看作者心情!**

.. contents::


介绍
----

dfilter-python 采用 Python2.7 编写。

import,很简单:

.. code-block:: python

import dfilter



快速开始
---------

准备
~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~

**Tips** :

1. 确保你的系统里面已经安装了 `Python2.7 <https://www.python.org/>`_ ,不同作业系统如何安装不再赘述。
2. 检查你系统中 `python` 和 `pip` 的版本, 如果不属于 `python2.7` , 请在执行代码范例时,自行将 `python` 和 `pip` 分别替换成 `python2.7` 和 `pip2` 。
3. 确保你的系统中安装了 `git` 程序 以及 `python-pip` 。




函数使用 ----在 pandas 后
~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~

**get_colume_name_as_list** (dataframe)

得到数据的列名称。

**basic_info** (dataframe,列名)

得到数据列的基础信息。

**get_coverage** (dataframe,列名)

得到数据列元素的覆盖率。

**get_pearson_similarity** (dataframe,列名1,列名2,是否均值填充空值)

得到数据的皮尔逊相关系数。

**get_fisher_score** (dataframe,列名1,y[列表],是否均值填充空值)

得到数据的Fisher得分。

**get_fisher_score_with_list** (dataframe,[列名1,列名2,.....],y[列表],是否均值填充空值)

输入列中元素的Fisher得分。

**get_K_L_divergence** (dataframe,列名1,列名2)

输入列中元素的KL散度

**get_K_L_divergence_as_list** (dataframe,[列名1,列名2,.....])

输入列中元素的KL散度。

**get_K_L_divergence_as_list_with_y** (dataframe,[列名1,列名2,.....],y[列表])

输入列中元素的KL散度。

**check_normal_cluster** (dataframe,列名,是否均值填充空值)

输入列中元素的 正态检验

**get_homogeneity_of_variance** (dataframe,列名1,列名2,是否均值填充空值)

输入列中元素的 方差齐性检验

**compare_between_two_couples** (dataframe,列名1,列名2,是否均值填充空值)

输入列中元素的 两组数之间的比较

Project details


Download files

Download the file for your platform. If you're not sure which to choose, learn more about installing packages.

Source Distribution

dfilter-0.5.tar.gz (6.0 kB view details)

Uploaded Source

File details

Details for the file dfilter-0.5.tar.gz.

File metadata

  • Download URL: dfilter-0.5.tar.gz
  • Upload date:
  • Size: 6.0 kB
  • Tags: Source
  • Uploaded using Trusted Publishing? No
  • Uploaded via: twine/1.12.1 pkginfo/1.5.0.1 requests/2.18.4 setuptools/36.5.0.post20170921 requests-toolbelt/0.9.1 tqdm/4.28.1 CPython/2.7.13

File hashes

Hashes for dfilter-0.5.tar.gz
Algorithm Hash digest
SHA256 49bd56f8dbe7ed560618d6cb1637ef49fb5e5926d2ee434d04b25f0626cae55d
MD5 e60425f09749c464afa41a6a0301217e
BLAKE2b-256 4b1078b35defd0ca72c0e05cf0aac2f13da67c13243248142d578c03f4a901f4

See more details on using hashes here.

Supported by

AWS Cloud computing and Security Sponsor Datadog Monitoring Depot Continuous Integration Fastly CDN Google Download Analytics Pingdom Monitoring Sentry Error logging StatusPage Status page