Building blocks for Data Engineering

Project description

phidata

Building Blocks for Data Engineering

Phidata is a set of building blocks for data engineering

It makes data tools plug-n-play so teams can deliver high-quality, reliable data products

How it works

You start with a codebase that has data tools pre-configured
Enable the Apps you need - Airflow, Superset, Jupyter, MLFlow
Build data products (tables, metrics) in a dev environment running locally on docker
Write pipelines in python or SQL. Use GPT-3 to generate boilerplate code
Run production on AWS. Infrastructure is also pre-configured

Advantages

Automate the grunt work
Recipes for common data tasks
Everything is version controlled: Infra, Apps and Workflows
Equal dev and production environments for data development at scale
Multiple teams working together share code and define dependencies in a pythonic way
Formatting (black), linting (ruff), type-checking (mypy) and testing (pytest) included

More Information:

Website: phidata.com
Documentation: https://docs.phidata.com
Chat: Discord

Quickstart

Let's build a data product using crypto data. Open the Terminal and follow along to download sample data and analyze it in a jupyter notebook.

Setup

Create a python virtual environment

python3 -m venv ~/.venvs/dpenv
source ~/.venvs/dpenv/bin/activate

Install and initialize phidata

pip install phidata
phi init

If you encounter errors, try updating pip using python -m pip install --upgrade pip

Create workspace

Workspace is a directory containing the source code for your data platform. Run phi ws init to create a new workspace.

Press Enter to select the default name (data-platform) and template (aws-data-platform)

phi ws init

cd into the new workspace directory

cd data-platform

Run your first workflow

The first step of building a data product is collecting the data. The workflows/crypto/prices.py file contains an example task for downloading crypto data locally to a CSV file. Run it using

phi wf run crypto/prices

Note how we define the output as a CsvTableLocal object with partitions and pre-write checks

# Step 1: Define CsvTableLocal for storing data
# Path: `storage/tables/crypto_prices`
crypto_prices_local = CsvTableLocal(
    name="crypto_prices",
    database="crypto",
    partitions=["ds"],
    write_checks=[NotEmpty()],
)

Checkout data-platform/storage/tables/crypto_prices for the CSVs

Run your first App

Docker is a great tool for testing locally. Your workspace comes pre-configured with a jupyter notebook for analyzing data. Install docker desktop and after the engine is running, start the workspace using

phi ws up

Press Enter to confirm. Verify the container is running using the docker dashboard or docker ps

docker ps --format 'table {{.Names}}\t{{.Image}}'

NAMES               IMAGE
jupyter-container   phidata/jupyter-aws-dp:dev

Jupyter UI

Open localhost:8888 in a new tab to view the jupyterlab UI. Password: admin

Navigate to notebooks/examples/crypto_prices.ipynb and run all cells.

Shutdown

Play around and then stop the workspace using

phi ws down

Checkout the documentation for more information or chat with us on discord

Project details

Release history Release notifications | RSS feed

2.4.11

May 20, 2024

2.4.10

May 15, 2024

2.4.9

May 15, 2024

2.4.8

May 14, 2024

2.4.7

May 13, 2024

2.4.6

May 12, 2024

2.4.5

May 12, 2024

2.4.4

May 9, 2024

2.4.3

May 9, 2024

2.4.2

May 8, 2024

2.4.1

May 7, 2024

2.4.0

May 5, 2024

2.3.90

May 3, 2024

2.3.89

May 1, 2024

2.3.88

Apr 30, 2024

2.3.87

Apr 30, 2024

2.3.86

Apr 29, 2024

2.3.85

Apr 29, 2024

2.3.84

Apr 28, 2024

2.3.83

Apr 25, 2024

2.3.82

Apr 24, 2024

2.3.81

Apr 24, 2024

2.3.80

Apr 21, 2024

2.3.79

Apr 20, 2024

2.3.78

Apr 20, 2024

2.3.77

Apr 19, 2024

2.3.76

Apr 19, 2024

2.3.75

Apr 18, 2024

2.3.74

Apr 18, 2024

2.3.73

Apr 18, 2024

2.3.72

Apr 17, 2024

2.3.71

Apr 17, 2024

2.3.70

Apr 17, 2024

2.3.69 yanked

Apr 17, 2024

2.3.68

Apr 16, 2024

2.3.67

Apr 15, 2024

2.3.66

Apr 11, 2024

2.3.65

Apr 11, 2024

2.3.64

Apr 9, 2024

2.3.63

Mar 28, 2024

2.3.62

Mar 19, 2024

2.3.61

Mar 19, 2024

2.3.60

Mar 18, 2024

2.3.59

Mar 17, 2024

2.3.57

Mar 15, 2024

2.3.56

Mar 15, 2024

2.3.55

Mar 15, 2024

2.3.54

Mar 14, 2024

2.3.53.dev0 pre-release

Mar 13, 2024

2.3.52

Mar 12, 2024

2.3.51

Mar 6, 2024

2.3.50

Mar 4, 2024

2.3.49

Mar 4, 2024

2.3.48

Feb 29, 2024

2.3.47

Feb 28, 2024

2.3.46

Feb 28, 2024

2.3.45

Feb 27, 2024

2.3.44

Feb 27, 2024

2.3.43

Feb 26, 2024

2.3.42

Feb 21, 2024

2.3.41

Feb 20, 2024

2.3.40

Feb 19, 2024

2.3.39

Feb 15, 2024

2.3.38

Feb 14, 2024

2.3.37

Feb 13, 2024

2.3.36

Feb 12, 2024

2.3.35

Feb 11, 2024

2.3.34

Feb 10, 2024

2.3.33

Feb 9, 2024

2.3.32

Feb 9, 2024

2.3.31

Feb 9, 2024

2.3.30

Feb 8, 2024

2.3.29

Feb 8, 2024

2.3.28

Feb 7, 2024

2.3.27

Feb 7, 2024

2.3.26

Feb 7, 2024

2.3.25

Feb 7, 2024

2.3.24

Feb 7, 2024

2.3.23

Feb 7, 2024

2.3.22

Feb 7, 2024

2.3.21

Feb 5, 2024

2.3.20

Feb 5, 2024

2.3.19

Feb 4, 2024

2.3.18

Feb 4, 2024

2.3.16

Feb 4, 2024

2.3.15

Feb 4, 2024

2.3.14

Feb 4, 2024

2.3.13

Feb 3, 2024

2.3.12

Jan 31, 2024

2.3.11

Jan 31, 2024

2.3.10

Jan 30, 2024

2.3.9

Jan 30, 2024

2.3.8

Jan 29, 2024

2.3.7

Jan 28, 2024

2.3.6

Jan 26, 2024

2.3.5

Jan 23, 2024

2.3.4

Jan 22, 2024

2.3.3

Jan 21, 2024

2.3.2

Jan 19, 2024

2.3.1

Jan 19, 2024

2.3.0

Jan 17, 2024

2.2.0

Jan 15, 2024

2.2.0.dev5 pre-release

Jan 15, 2024

2.2.0.dev4 pre-release

Jan 14, 2024

2.2.0.dev3 pre-release

Jan 14, 2024

2.2.0.dev2 pre-release

Jan 14, 2024

2.2.0.dev1 pre-release

Jan 14, 2024

2.2.0.dev0 pre-release

Jan 14, 2024

2.1.6

Jan 9, 2024

2.1.5

Jan 4, 2024

2.1.4

Jan 4, 2024

2.1.3

Jan 2, 2024

2.1.2

Jan 2, 2024

2.1.1

Dec 14, 2023

2.1.0

Dec 11, 2023

2.0.61

Nov 27, 2023

2.0.60

Nov 24, 2023

2.0.59

Nov 24, 2023

2.0.58

Nov 20, 2023

2.0.57

Nov 20, 2023

2.0.56

Nov 17, 2023

2.0.55

Nov 17, 2023

2.0.54

Nov 16, 2023

2.0.53

Nov 15, 2023

2.0.52

Nov 15, 2023

2.0.51

Nov 15, 2023

2.0.50

Nov 15, 2023

2.0.49

Nov 15, 2023

2.0.48

Nov 15, 2023

2.0.47

Nov 14, 2023

2.0.46

Nov 14, 2023

2.0.45

Nov 14, 2023

2.0.44

Nov 14, 2023

2.0.43

Nov 14, 2023

2.0.42

Nov 14, 2023

2.0.41

Nov 14, 2023

2.0.40

Nov 13, 2023

2.0.39

Nov 13, 2023

2.0.38

Nov 10, 2023

2.0.37

Nov 10, 2023

2.0.36

Nov 10, 2023

2.0.35

Nov 10, 2023

2.0.34

Nov 9, 2023

2.0.33

Nov 9, 2023

2.0.32

Nov 8, 2023

2.0.31

Nov 7, 2023

2.0.30

Nov 7, 2023

2.0.29

Nov 7, 2023

2.0.28

Nov 7, 2023

2.0.27

Nov 3, 2023

2.0.26

Nov 3, 2023

2.0.25

Nov 2, 2023

2.0.24

Nov 2, 2023

2.0.23

Nov 1, 2023

2.0.22

Nov 1, 2023

2.0.21

Nov 1, 2023

2.0.20

Oct 30, 2023

2.0.19

Oct 18, 2023

2.0.18

Oct 13, 2023

2.0.17

Oct 12, 2023

2.0.16

Oct 12, 2023

2.0.15

Oct 7, 2023

2.0.14

Oct 6, 2023

2.0.13

Oct 4, 2023

2.0.12

Oct 2, 2023

2.0.11

Oct 1, 2023

2.0.10

Sep 30, 2023

2.0.9

Sep 28, 2023

2.0.8

Sep 28, 2023

2.0.7

Sep 19, 2023

2.0.6

Sep 18, 2023

2.0.5

Sep 15, 2023

2.0.4

Sep 12, 2023

2.0.3

Sep 12, 2023

2.0.2

Sep 12, 2023

2.0.1

Sep 12, 2023

2.0.0

Sep 11, 2023

2.0.0.dev50 pre-release

Sep 11, 2023

2.0.0.dev31 pre-release

Sep 11, 2023

2.0.0.dev30 pre-release

Sep 11, 2023

2.0.0.dev29 pre-release

Sep 1, 2023

2.0.0.dev28 pre-release

Aug 23, 2023

2.0.0.dev27 pre-release

Aug 23, 2023

2.0.0.dev26 pre-release

Aug 16, 2023

2.0.0.dev25 pre-release

Aug 16, 2023

2.0.0.dev24 pre-release

Aug 15, 2023

2.0.0.dev23 pre-release

Aug 15, 2023

2.0.0.dev22 pre-release

Aug 11, 2023

2.0.0.dev21 pre-release

Aug 11, 2023

2.0.0.dev20 pre-release

Aug 9, 2023

2.0.0.dev19 pre-release

Aug 9, 2023

2.0.0.dev18 pre-release

Aug 7, 2023

2.0.0.dev17 pre-release

Aug 7, 2023

2.0.0.dev16 pre-release

Aug 7, 2023

2.0.0.dev15 pre-release

Aug 4, 2023

2.0.0.dev14 pre-release

Aug 3, 2023

2.0.0.dev13 pre-release

Aug 2, 2023

2.0.0.dev12 pre-release

Aug 2, 2023

2.0.0.dev11 pre-release

Jul 27, 2023

2.0.0.dev10 pre-release

Jul 26, 2023

2.0.0.dev9 pre-release

Jul 25, 2023

2.0.0.dev8 pre-release

Jul 24, 2023

2.0.0.dev7 pre-release

Jul 24, 2023

2.0.0.dev6 pre-release

Jul 18, 2023

2.0.0.dev5 pre-release

Jul 18, 2023

2.0.0.dev4 pre-release

Jul 12, 2023

2.0.0.dev3 pre-release

Jul 12, 2023

2.0.0.dev2 pre-release

Jul 11, 2023

2.0.0.dev1 pre-release

Jul 11, 2023

1.7.9

Jul 7, 2023

1.7.8

Jun 21, 2023

1.7.7

Jun 20, 2023

1.7.6

Jun 20, 2023

1.7.5

Jun 15, 2023

1.7.4

Jun 14, 2023

1.7.3

Jun 13, 2023

1.7.2

Jun 13, 2023

1.7.1

Jun 12, 2023

1.7.0

Jun 12, 2023

1.6.22

Jun 7, 2023

1.6.21

Jun 7, 2023

1.6.20

Jun 4, 2023

1.6.19

Jun 3, 2023

1.6.18

Jun 3, 2023

1.6.17

Jun 3, 2023

1.6.16

Jun 1, 2023

1.6.15

May 31, 2023

1.6.14

May 23, 2023

1.6.12

May 23, 2023

1.6.11

May 23, 2023

1.6.10

May 23, 2023

1.6.9

May 23, 2023

1.6.8

May 23, 2023

1.6.7

May 19, 2023

1.6.6

May 19, 2023

1.6.5

May 19, 2023

1.6.4

May 17, 2023

1.6.3

May 8, 2023

1.6.2

May 3, 2023

1.6.1

Apr 18, 2023

1.6.0

Apr 18, 2023

1.5.9

Apr 11, 2023

1.5.7

Apr 9, 2023

1.5.6

Apr 9, 2023

1.5.5

Apr 7, 2023

1.5.4

Apr 7, 2023

1.5.3

Apr 7, 2023

1.5.2

Apr 7, 2023

1.5.1

Apr 7, 2023

1.5.0

Apr 7, 2023

1.4.4

Mar 15, 2023

1.4.3

Mar 13, 2023

1.4.2.dev1 pre-release

Mar 13, 2023

1.4.1

Feb 13, 2023

1.4.0

Feb 8, 2023

1.3.4

Feb 6, 2023

This version

1.3.2

Feb 3, 2023

1.3.1

Feb 3, 2023

1.3.0

Feb 3, 2023

1.2.0

Feb 1, 2023

1.1.4

Jan 31, 2023

1.1.3

Jan 31, 2023

1.1.2

Jan 31, 2023

1.1.1

Jan 24, 2023

1.1.0

Jan 22, 2023

1.0.5

Jan 20, 2023

1.0.4

Jan 19, 2023

1.0.3

Jan 19, 2023

1.0.2

Jan 17, 2023

1.0.1

Jan 16, 2023

1.0.0

Jan 14, 2023

1.0.0.dev6 pre-release

Jan 13, 2023

1.0.0.dev4 pre-release

Jan 11, 2023

1.0.0.dev3 pre-release

Jan 11, 2023

1.0.0.dev1 pre-release

Jan 8, 2023

0.4.10

Jan 5, 2023

0.4.9

Jan 5, 2023

0.4.7

Jan 5, 2023

0.4.6

Jan 4, 2023

0.4.5

Jan 3, 2023

0.4.3

Jan 1, 2023

0.4.2

Dec 21, 2022

0.4.1

Dec 14, 2022

0.4.0

Dec 13, 2022

0.3.50

Dec 12, 2022

0.3.15

Dec 9, 2022

0.3.14

Dec 5, 2022

0.3.13

Nov 28, 2022

0.3.12

Nov 28, 2022

0.3.11

Nov 22, 2022

0.3.10

Nov 15, 2022

0.3.9

Nov 14, 2022

0.3.8

Nov 11, 2022

0.3.7

Nov 11, 2022

0.3.6

Nov 9, 2022

0.3.5

Nov 8, 2022

0.3.4

Nov 8, 2022

0.3.3

Nov 8, 2022

0.3.2

Nov 6, 2022

0.3.1

Nov 4, 2022

0.3.0

Nov 2, 2022

0.3.0.dev4 pre-release

Nov 2, 2022

0.2.40.dev4 pre-release

Nov 2, 2022

0.2.40.dev1 pre-release

Nov 2, 2022

0.2.33

Oct 28, 2022

0.2.32

Oct 27, 2022

0.2.31

Oct 27, 2022

0.2.30

Oct 27, 2022

0.2.29

Oct 27, 2022

0.2.27

Oct 27, 2022

0.2.26

Oct 26, 2022

0.2.25

Oct 21, 2022

0.2.24

Oct 19, 2022

0.2.23

Oct 18, 2022

0.2.22

Oct 18, 2022

0.2.21

Oct 18, 2022

0.2.20

Oct 17, 2022

0.2.19

Oct 13, 2022

0.2.18

Oct 13, 2022

0.2.17

Oct 13, 2022

0.2.16

Oct 12, 2022

0.2.15

Oct 2, 2022

0.2.14

Oct 2, 2022

0.2.13

Oct 2, 2022

0.2.12

Oct 1, 2022

0.2.11

Oct 1, 2022

0.2.10

Oct 1, 2022

0.2.9

Sep 30, 2022

0.2.8

Sep 30, 2022

0.2.7

Sep 30, 2022

0.2.6

Sep 29, 2022

0.2.5

Sep 26, 2022

0.2.4

Sep 12, 2022

0.2.3

Sep 11, 2022

0.2.2

Sep 9, 2022

0.2.1

Sep 8, 2022

0.2.0

Jul 31, 2022

0.2.0.dev3 pre-release

Jul 27, 2022

0.2.0.dev2 pre-release

Jul 25, 2022

0.1.59

Jul 10, 2022

0.1.58

Jul 10, 2022

0.1.57

Jul 8, 2022

0.1.56

Jun 30, 2022

0.1.55

Jun 22, 2022

0.1.54

Jun 12, 2022

0.1.53

Jun 9, 2022

0.1.52

Jun 9, 2022

0.1.51

Jun 7, 2022

0.1.50

Jun 6, 2022

0.1.49

Jun 3, 2022

0.1.48

May 26, 2022

0.1.47

May 11, 2022

0.1.46

May 11, 2022

0.1.45

May 11, 2022

0.1.44

May 11, 2022

0.1.43

May 10, 2022

0.1.42

May 6, 2022

0.1.41

Apr 29, 2022

0.1.40

Apr 29, 2022

0.1.39

Apr 29, 2022

0.1.38

Apr 26, 2022

0.1.37

Apr 25, 2022

0.1.36

Apr 25, 2022

0.1.35

Apr 18, 2022

0.1.34

Apr 18, 2022

0.1.33

Apr 18, 2022

0.1.32

Apr 14, 2022

0.1.31

Apr 14, 2022

0.1.30

Apr 13, 2022

0.1.29

Apr 13, 2022

0.1.28

Apr 13, 2022

0.1.27

Apr 13, 2022

0.1.26

Apr 12, 2022

0.1.25

Apr 12, 2022

0.1.24

Apr 12, 2022

0.1.23

Apr 11, 2022

0.1.22

Apr 11, 2022

0.1.21

Apr 11, 2022

0.1.20

Apr 11, 2022

0.1.19

Apr 11, 2022

0.1.18

Apr 8, 2022

0.1.17

Apr 7, 2022

0.1.16

Apr 5, 2022

0.1.15

Apr 4, 2022

0.1.14

Apr 4, 2022

0.1.13

Apr 4, 2022

0.1.12

Apr 3, 2022

0.1.11

Apr 1, 2022

0.1.10

Apr 1, 2022

0.1.9

Mar 31, 2022

0.1.8

Mar 31, 2022

0.1.7

Mar 28, 2022

0.1.5

Mar 28, 2022

0.1.4

Mar 28, 2022

0.1.3

Mar 24, 2022

0.1.2

Mar 17, 2022

0.1.1

Mar 17, 2022

Download files

Download the file for your platform. If you're not sure which to choose, learn more about installing packages.

Source Distribution

phidata-1.3.2.tar.gz (369.0 kB view hashes)

Uploaded Feb 3, 2023 Source

Built Distribution

phidata-1.3.2-py3-none-any.whl (545.3 kB view hashes)

Uploaded Feb 3, 2023 Python 3

Hashes for phidata-1.3.2.tar.gz

Hashes for phidata-1.3.2.tar.gz
Algorithm	Hash digest
SHA256	`b98a8ee9df16b6b47cb30e06d75a04fdbe8ba140630271be9b34248374a889bf`
MD5	`ce08062c9ca25300db4d188a95d82b61`
BLAKE2b-256	`86d6ceb4fb487d0c7aecc018ee02317ca224405b4aec98e4f32594dbb4724254`

Hashes for phidata-1.3.2-py3-none-any.whl

Hashes for phidata-1.3.2-py3-none-any.whl
Algorithm	Hash digest
SHA256	`10c88568d623f4898ddbbfdb654a1bc155e5c3b09f63d2ac39b7c1c20c4310ae`
MD5	`52c1b43fd49ff73385c63c2c4cc5a151`
BLAKE2b-256	`4d90fd482b7bb7bdf42951479c8ec0b977cd6340bbbfcc76edcd9c893603cb4d`