Pacote para facilitar o envio de arquivos para o s3, transformar arquivos csv e rds para Parquet, realizar limpeza simples dos dados e guardar dicionários de siglas governamentais.
Project description
MCDATA_PACKAGE
MCDATA_PACKAGE é um pacote Python para facilitar o envio de arquivos para o S3, transformar arquivos CSV e RDS para Parquet, realizar limpeza simples dos dados e guardar dicionários de siglas governamentais.
Instalação
Você pode instalar o pacote MCDATA_PACKAGE usando pip:
pip install mcdata_package
Uso
Aqui estão alguns exemplos de como você pode usar o pacote MCDATA_PACKAGE:
Transformar arquivos CSV e RDS para Parquet
from mcdata.transformar import csv_to_parquet, rds_to_parquet csv_to_parquet('/path/to/csv_file.csv', '/path/to/parquet_file.parquet') rds_to_parquet('/path/to/rds_file.rds', '/path/to/parquet_file.parquet')
Manipular tabelas
import pandas as pd from mcdata.tabela import ManipularTabela df = pd.read_csv('/path/to/csv_file.csv') manipulator = ManipularTabela(df) processed_df = manipulator.process_table(remove_duplicates=True, null_value_replacement='Unknown', column_mapping={'OldColumnName': 'NewColumnName'}, column_value_mapping={'UF': {31: 'São Paulo'}})
Obter dicionários de siglas governamentais
from mcdata.dicionarios import uf
Licença
Este projeto é licenciado sob a Licença MIT - por favor, veja LICENSE para mais detalhes.
Project details
Release history Release notifications | RSS feed
Download files
Download the file for your platform. If you're not sure which to choose, learn more about installing packages.
Source Distribution
Built Distribution
Hashes for rodrigomm23-0.0.3-py3-none-any.whl
Algorithm | Hash digest | |
---|---|---|
SHA256 | c1734978c0783ed1f054c7a5e147bca8a12baa6ef82950ee96a89753d1581543 |
|
MD5 | e9f0e551db94bfc71600fbca0eb4abdb |
|
BLAKE2b-256 | 6f342e1c1dce44025c8de532fbca56653629fc9ec806c78902d2f2870bbea75f |