Project description

Mega Spark说明

该项目旨在通过spark进行一站式数据分析与模型训练，保证最终落地的只有分析报告，可视化，以及模型训练评估结果，其次该项目将pysaprk封装成mega对象来延续pandas的使用方法，进而实现在大数据场景下的使用pandas方法进行数据分析和模型训练，消除相关同学在spark上投入的学习成本

目前提供以下模块：

如果要给该项目贡献代码，在本地调试好后测试，本地安装方法

$ git clone ...
$ cd megaspark
$ python install .

以tomega模块为例，安装完成之后，可以使用以下方法导入使用

import megaspark.tomega as mg

data_df = mg.read_csv("path/to/file.csv")
data_df.mega.head(5)

$ cd /path/to/megaspark
$ python3 setup.py sdist bdist_wheel
$ pip3 install twine
$ python3 -m twine upload dist/*

These details have not been verified by PyPI

1.1.1

Sep 14, 2020

This version

1.1.0

Sep 13, 2020

1.0.0

Sep 13, 2020

Download the file for your platform. If you're not sure which to choose, learn more about installing packages.

Uploaded Sep 13, 2020 Source

Uploaded Sep 13, 2020 Python 3

Hashes for mega-spark-1.1.0.tar.gz
Algorithm	Hash digest
SHA256	`585dd252cdae5bd5edda295126d3e423d550eb128bace8097474f585db0c5dc8`
MD5	`c0a3972575e9f52ca73f46f814c0c96d`
BLAKE2b-256	`a45492f54ed917c021746de4f28aa78860b002aad3b31f242f3a4870007ef4ec`

Hashes for mega_spark-1.1.0-py3-none-any.whl
Algorithm	Hash digest
SHA256	`8101738d8181bff8d46397b3d038d63f72e8998a9c5c26ae610eb8ba59ad4661`
MD5	`fe1a33a503e81c2d9edd803df16d622f`
BLAKE2b-256	`ebd32074ed6db1c01ecc8d73c72e9efce1267c4f3acc6bb6908a169a38edce9b`