Project description

dataflat

A library to flatten all this annoiyng nested keys and columns on Dictionaries, Pandas Dataframes and Spark (pyspark) Dataframes.

Installation

pip install dataflat

Get started

How to instantiate a Flattener:

from dataflat.flattener_handler import Options, Flattener

id_key = 'id'
black_list = ['keys','or','columns','to','skip']

#The following variables have the default values for each transform function
to_snake_case = False
replace_dots = False

# Instantiate a Dictionary Flattener
dict_name = 'dct'
flattener_dict = Flattener().handler(Options.DICTIONARY)
flattener_dict.transform(dictionary, id_key, black_list, dict_name, to_snake_case, replace_dots)


# Instantiate a Pandas Dataframe Flattener
##Default chunk size = 500
dataframe_name = 'df'
chunk_size = 500
flattener_pd = Flattener().handler(Options.PANDAS_DF)
flattener_pd.transform(dataframe, id_key, black_list, dataframe_name, to_snake_case, replace_dots, chunk_size)

# Instantiate a Spark Dataframe Flattener
dataframe_name = 'df'
flattener_sp = Flattener().handler(Options.SPARK_DF)
flattener_sp.transform(dataframe, id_key, black_list, dataframe_name, to_snake_case, replace_dots)

Project details

These details have not been verified by PyPI

Project links

Homepage

Release history Release notifications | RSS feed

2.0.0

Sep 6, 2024

1.1.0

Jul 17, 2023

This version

1.0.6

Jun 29, 2023

1.0.5

Jun 29, 2023

1.0.4

Jun 9, 2023

1.0.3

Jun 9, 2023

1.0.2

Jun 9, 2023

1.0.1

Mar 23, 2023

Download files

Download the file for your platform. If you're not sure which to choose, learn more about installing packages.

Source Distribution

dataflat-1.0.6.tar.gz (12.1 kB view hashes)

Uploaded Jun 29, 2023 Source

Built Distribution

dataflat-1.0.6-py3-none-any.whl (16.4 kB view hashes)

Uploaded Jun 29, 2023 Python 3

Hashes for dataflat-1.0.6.tar.gz

Hashes for dataflat-1.0.6.tar.gz
Algorithm	Hash digest
SHA256	`c804a413a3cc7f5f9a36aead54e2af7ced2d893ecd30014dfa7ad3c8d2f2f512`
MD5	`c235ce90cabff96287c2e5d8c02470fe`
BLAKE2b-256	`1574bd47e06b9b06042ed09dc0feac5c3a39a7ab40d3fa711f11715bb681da74`

Hashes for dataflat-1.0.6-py3-none-any.whl

Hashes for dataflat-1.0.6-py3-none-any.whl
Algorithm	Hash digest
SHA256	`7e118e728e7acacd7476454d0e9ec5cd3b608f9dfe5a365b1d7c391e47d362a3`
MD5	`5e413f53e905fc74fe209165ac4474fd`
BLAKE2b-256	`6d8150a5377659a4e306b716c8365300a4453704829addf3a2d2506fbf107756`