BigQuery client wrapper with clean API

These details have not been verified by PyPI

Project links

Homepage

Project description

BigFlow — The Python framework for BigQuery

Tired of the limiting BigQuery console? Open your Jupyter notebook and start working with BigQuery using Python!

BigFlow lets you:

Work with BigQuery using Python code.
Create a workflow that you can automatically convert to an Airflow DAG.
Implement a configurable environment for your workflows.
Organize your data processing.
Create a workflow from a Jupyter notebook.
Work with BigQuery from any other environment.
Run and schedule the Apache-Beam pipelines.
Mix BigQuery, Python and Apache-Beam in your workflows.

BigFlow scales to your needs. It's very easy to start making queries and creating workflows. If needed, BigFlow lets you implement complex stuff (the Allegro experimentation platform was created using the BigFlow framework).

Installation

pip install bigflow

pip install bigflow[beam](if you want to use the Apache Beam)

Compatibility

BigFlow is compatible with Python >= 3.5.

Cheat sheet

Setup

We recommend using the Jupyter Lab to go through the examples. You can also run the examples as scripts, or from your own Jupyter notebook. In those cases, you can authorize using pydata_google_auth(look at the example below) or Google sdk.

Inside this repository you can find the file named 'MilitaryExpenditure.csv'. Use the script below to load the csv to the BigQuery table. You will use the created table to explore the BigFlow methods.

First of all, install the dependencies:

pip install bigflow

pip install pydata_google_auth

Then, fill up the PROJECT_ID and DATA_PATH:

PROJECT_ID = 'put-you-project-id-here'
DATA_PATH = '/path/to/json/file/311_requests.csv'

import bigflow as bf
import pydata_google_auth
import pandas as pd

credentials = pydata_google_auth.get_user_credentials(['https://www.googleapis.com/auth/bigquery'])

dataset = bf.Dataset(
    project_id=PROJECT_ID,
    dataset_name='external_data',
    credentials=credentials)

df = pd.read_csv(DATA_PATH, dtype={
    'street_number': str,
    'state_plane_x_coordinate': str
})

load_table = dataset.load_table_from_dataframe('311_requests', df, partitioned=False)
load_table.run()

Authorize with a GCP user account

import bigflow as bf
import pydata_google_auth

credentials = pydata_google_auth.get_user_credentials(['https://www.googleapis.com/auth/bigquery'])  

dataset = bf.Dataset(
    project_id='put-you-project-id-here',
    dataset_name='bigflow_cheatsheet',
    credentials=credentials)

Create table

import bigflow as bf

dataset = bf.Dataset(
    project_id='put-you-project-id-here',
    dataset_name='bigflow_cheatsheet',
    internal_tables=['request_aggregate'])

create_table = dataset.create_table("""
CREATE TABLE IF NOT EXISTS request_aggregate (
    batch_date TIMESTAMP,
    request_count INT64)
PARTITION BY DATE(batch_date)""")

create_table.run()

Query table

import bigflow as bf

PROJECT_ID = 'put-you-project-id-here'

dataset = bf.Dataset(
    project_id=PROJECT_ID,
    dataset_name='bigflow_cheatsheet',
    external_tables={
        '311_requests': '{}.external_data.311_requests'.format(PROJECT_ID)
    })

select_requests = dataset.collect("""
SELECT *
FROM `{311_requests}`
WHERE DATE(TIMESTAMP(created_date)) = "{dt}"
LIMIT 1000
""")

requests_df = select_requests.run('2014-05-21')
print(requests_df)

Estimate query cost(dry run)

import bigflow as bf

PROJECT_ID = 'put-you-project-id-here'

dataset = bf.Dataset(
    project_id=PROJECT_ID,
    dataset_name='bigflow_cheatsheet',
    external_tables={
        '311_requests': '{}.external_data.311_requests'.format(PROJECT_ID)
    })

dry_select = dataset.dry_run("""
SELECT *
FROM `{311_requests}`
WHERE DATE(TIMESTAMP(created_date)) = "{dt}"
LIMIT 1000
""")

print(dry_select.run('2014-05-21'))

Write to table

import bigflow as bf

PROJECT_ID = 'put-you-project-id-here'

dataset = bf.Dataset(
    project_id=PROJECT_ID,
    dataset_name='bigflow_cheatsheet',
    external_tables={
        '311_requests': '{}.external_data.311_requests'.format(PROJECT_ID)
    },
    internal_tables=['request_aggregate'])

create_table = dataset.create_table("""
CREATE TABLE IF NOT EXISTS request_aggregate (
    batch_date TIMESTAMP,
    request_count INT64)
PARTITION BY DATE(batch_date)""").run()

write_truncate_daily_request_count = dataset.write_truncate('request_aggregate', """
WITH batched_requests as (
    SELECT 
        DATE(TIMESTAMP(created_date)) as batch_date,
        *
    FROM `{311_requests}`
    WHERE DATE(TIMESTAMP(created_date)) = "{dt}"
)

SELECT 
    TIMESTAMP(batch_date) as batch_date,
    count(*) as request_count
FROM `batched_requests`
WHERE DATE(TIMESTAMP(created_date)) = "{dt}"
GROUP BY batch_date
""")

write_truncate_daily_request_count.run('2014-05-21')

Create non-partitioned table from query results

import bigflow as bf

PROJECT_ID = 'put-you-project-id-here'

dataset = bf.Dataset(
    project_id=PROJECT_ID,
    dataset_name='bigflow_cheatsheet',
    external_tables={
        '311_requests': '{}.external_data.311_requests'.format(PROJECT_ID)
    },
    internal_tables=['request_aggregate_tmp'])

write_tmp_daily_request_count = dataset.write_tmp('request_aggregate_tmp', """
WITH batched_requests as (
    SELECT 
        DATE(TIMESTAMP(created_date)) as batch_date,
        *
    FROM `{311_requests}`
    WHERE DATE(TIMESTAMP(created_date)) = "{dt}"
)

SELECT 
    TIMESTAMP(batch_date) as batch_date,
    count(*) as request_count
FROM `batched_requests`
WHERE DATE(TIMESTAMP(created_date)) = "{dt}"
GROUP BY batch_date
""")

write_tmp_daily_request_count.run('2014-05-21')

Save pandas DataFrame to table

import bigflow as bf
import pandas as pd

PROJECT_ID = 'put-you-project-id-here'

dataset = bf.Dataset(
    project_id=PROJECT_ID,
    dataset_name='bigflow_cheatsheet',
    external_tables={
        '311_requests': '{}.external_data.311_requests'.format(PROJECT_ID)
    },
    internal_tables=['request_aggregate'])

create_table = dataset.create_table("""
CREATE TABLE IF NOT EXISTS request_aggregate (
    batch_date TIMESTAMP,
    request_count INT64)
PARTITION BY DATE(batch_date)""").run()

load_df = dataset.load_table_from_dataframe('request_aggregate', pd.DataFrame([{
    'batch_date': pd.Timestamp('2017-01-01T12'),
    'request_count': 200
}]))

load_df.run('2017-01-01')

Generate DAG from notebook

Create an empty notebook and add the following processing logic:

import bigflow as bf

PROJECT_ID = 'put-you-project-id-here'

dataset = bf.Dataset(
    project_id=PROJECT_ID,
    dataset_name='bigflow_cheatsheet',
    external_tables={
        '311_requests': '{}.external_data.311_requests'.format(PROJECT_ID)
    },
    internal_tables=['request_aggregate'])

create_table = dataset.create_table("""
CREATE TABLE IF NOT EXISTS request_aggregate (
    batch_date TIMESTAMP,
    request_count INT64)
PARTITION BY DATE(batch_date)""")

write_truncate_daily_request_count = dataset.write_truncate('request_aggregate', """
WITH batched_requests as (
    SELECT 
        DATE(TIMESTAMP(created_date)) as batch_date,
        *
    FROM `{311_requests}`
    WHERE DATE(TIMESTAMP(created_date)) = "{dt}"
)

SELECT 
    TIMESTAMP(batch_date) as batch_date,
    count(*) as request_count
FROM `batched_requests`
WHERE DATE(TIMESTAMP(created_date)) = "{dt}"
GROUP BY batch_date
""")

workflow_v1 = bf.Workflow(definition=[
    create_table.to_job(),
    write_truncate_daily_request_count.to_job()
])

Next, create another notebook and add the following code that will generate the Airflow DAG:

import bigflow as bf

bf.build_dag_from_notebook('/path/to/your/notebook.ipynb', 'workflow_v1', start_date='2014-05-21')

After you run the code above, you will get a zipped Airflow DAG that you can deploy. The easiest way to deploy a DAG is by using the Cloud Composer.

Wait for tables

If you want to wait for some data to appear before you start a processing, you can use sensor component:

import bigflow as bf

PROJECT_ID = 'put-you-project-id-here'

dataset = bf.Dataset(
    project_id=PROJECT_ID,
    dataset_name='bigflow_cheatsheet',
    external_tables={
        '311_requests': '{}.external_data.311_requests'.format(PROJECT_ID)
    },
    internal_tables=['request_aggregate'])

wait_for_requests = bf.sensor_component(
    '311_requests', 
    where_clause="DATE(TIMESTAMP(created_date)) = DATE(TIMESTAMP_ADD(TIMESTAMP('{dt}'), INTERVAL -24 HOUR))",
    ds=dataset)

workflow_v2 = bf.Workflow(definition=[wait_for_requests.to_job()])

# Should raise ValueError because there is no data for '2090-01-01'
workflow_v2.run('2090-01-01')

Write custom component

If you want to write you own component, you can do it by writing a function:

import bigflow as bf

PROJECT_ID = 'put-you-project-id-here'

dataset = bf.Dataset(
    project_id=PROJECT_ID,
    dataset_name='bigflow_cheatsheet',
    external_tables={
        '311_requests': '{}.external_data.311_requests'.format(PROJECT_ID)
    },
    internal_tables=['request_aggregate'])

def is_table_ready(df):
    return df.iloc[0]['table_ready']

@bf.component(ds=dataset)
def wait_for_requests(ds):
    result = ds.collect('''
        SELECT count(*) > 0 as table_ready
        FROM `{311_requests}`
        WHERE DATE(TIMESTAMP(created_date)) = DATE(TIMESTAMP_ADD(TIMESTAMP('{dt}'), INTERVAL -24 HOUR))
        ''')

    if not is_table_ready(result):
        raise ValueError('311_requests is not ready')

workflow_v2 = bf.Workflow(definition=[wait_for_requests.to_job()])

# Should raise ValueError because there is no data for '2090-01-01'
workflow_v2.run('2090-01-01')

Running BigFlow

BigFlow offers a cli (command-line interface) that lets you run or deploy jobs and workflows directly from your terminal. The main commands are:

run - lets you run a job or a workflow,

To run any command, start with bf and command name. To ask for help, use bf -h or bf <command name> -h.

Run

run command lets you run a job or a workflow. Here are a few examples how it can be used:

bf run --workflow workflowId
bf run --workflow workflowId --runtime '2020-01-01 00:00:00' --config prod
bf run --job jobId
bf run --job jobId --runtime '2020-01-01 00:00:00'
bf run --job jobId --runtime '2020-01-01 00:00:00' --config dev

Run command requires you to provide one of those two parameters:

--job <job id> - use it to run a job by its id. You can set job id by setting id field in the object representing this job.
--workflow <workflow id> - use it to run a workflow by its id. You can set workflow id using named parameter workflow_id (bf.Workflow(workflow_id="YOUR_ID", ...)). In both cases, id needs to be set and unique.

Run command also allows the following optional parameters:

--runtime <runtime in format YYYY-MM-DD hh:mm:ss> - use it to set the date and time when this job or workflow should be started. Example value: 2020-01-01 00:12:00. The default is now.
--config <runtime> - use it to configure environment name that should be used. Example: dev, prod. If not set, the default Config name will be used. This env name is applied to all bigflow.Config objects that are defined by individual workflows as well as to deployment_config.py.
--project_package <project_package> - use it to set the main package of your project, only when project_setup.PROJECT_NAME not found. Example: logistics_tasks. The value does not affect when project_setup.PROJECT_NAME is set. Otherwise, it is required.

Tutorial

Inside this repository, you can find the BigFlow tutorial. We recommend using the GCP Jupyter Lab to go through the tutorial. It takes a few clicks to set up.

Other resources

CLI

TODO what is CLI? how to install bf command?

CLI deploy

CLI deploy commands deploy your workflows to Google Cloud Composer. There are two artifacts which are deployed and should be built before using deploy:

DAG files built by bigflow,
Docker image built by bigflow.

There are three deploy commands:

deploy-dags uploads all DAG files from a {project_dir}/.dags folder to a Google Cloud Storage Bucket which underlies your Composer's DAGs Folder.
deploy-image pushes a docker image to Google Cloud Container Registry which should be readable from your Composer's Kubernetes cluster.
deploy simply runs both deploy-dags and deploy-image.

Start your work from reading detailed help:

bf deploy-dags -h
bf deploy-image -h
bf deploy -h

Authentication methods

There are two authentication methods: local_account for local development and service_account for CI/CD servers.

local_account method is used by default and it relies on your local user gcloud account. Check if you are authenticated by typing:

gcloud info

Example of the deploy-dags command with local_account authentication:

bf deploy-dags

service_account method allows you to authenticate with a service account as long as you have a Vault server for managing OAuth tokens.

Example of the deploy-dags command with service_account authentication (requires Vault):

bf deploy-dags --auth-method=service_account --vault-endpoint https://example.com/vault --vault-secret *****

Managing configuration in deployment_config.py

Deploy commands require a lot of configuration. You can pass all parameters directly as command line arguments, or save them in a deployment_config.py file.

For local development and for most CI/CD scenarios we recommend using a deployment_config.py file. This file has to contain a bigflow.Config object stored in the deployment_config variable and can be placed in a main folder of your project.

deployment_config.py example:

from bigflow import Config

deployment_config = Config(name='dev',                    
                           properties={
                               'gcp_project_id': 'my_gcp_dev_project',
                               'docker_repository_project': '{gcp_project_id}',
                               'docker_repository': 'eu.gcr.io/{docker_repository_project}/my-project',
                               'vault_endpoint': 'https://example.com/vault',
                               'dags_bucket': 'europe-west1-123456-bucket'
                           })\
        .ad_configuration(name='prod', properties={
                               'gcp_project_id': 'my_gcp_prod_project',
                               'dags_bucket': 'europe-west1-654321-bucket'})

Having that, you can run extremely concise deploy command, for example:

bf deploy-dags --config dev
bf deploy-dags --config prod

or even bf deploy-dags, because env dev is the default one in this case.

Important. By default, the deployment_config.py file is located in a main directory of your project, so bf expects it exists under this path: {current_dir}/deployment_config.py. You can change this location by setting the deployment-config-path parameter:

bf deploy-dags --deployment-config-path '/tmp/my_deployment_config.py'

Deploy DAG files examples

Upload DAG files from {current_dir}/.dags to a dev Composer using local_account authentication. Configuration is taken from {current_dir}/deployment_config.py:

bf deploy-dags --config dev

Upload DAG files from a given dir using service_account authentication. Configuration is specified via command line arguments:

bf deploy-dags \
--dags-dir '/tmp/my_dags' \
--auth-method=service_account \
--vault-secret ***** \
--vault-endpoint 'https://example.com/vault' \
--dags-bucket europe-west1-12323a-bucket \
--gcp-project-id my_gcp_dev_project \
--clear-dags-folder

Deploy Docker image examples

Upload a Docker image from a local repository using local_account authentication. Configuration is taken from {current_dir}/deployment_config.py:

bf deploy-image --version 1.0 --config dev

Upload a Docker image exported to a .tar file using service_account authentication. Configuration is specified via command line arguments:

bf deploy-image \
--image-tar-path '/tmp/image-0.1.0-tar' \
--docker-repository 'eu.gcr.io/my_gcp_dev_project/my_project' \
--auth-method=service_account \
--vault-secret ***** \
--vault-endpoint 'https://example.com/vault'

Complete deploy examples

Upload DAG files from {current_dir}/.dags dir and a Docker image from a local repository using local_account authentication. Configuration is taken from {current_dir}/deployment_config.py:

bf deploy --version 1.0 --config dev

The same, but configuration is taken from a given file:

bf deploy --version 1.0 --config dev --deployment-config-path '/tmp/my_deployment_config.py'

Upload DAG files from a given dir and a Docker image exported to a .tar file using service_account authentication. Configuration is specified via command line arguments:

bf deploy \
--image-tar-path '/tmp/image-0.1.0-tar' \
--dags-dir '/tmp/my_dags' \
--docker-repository 'eu.gcr.io/my_gcp_dev_project/my_project' \
--auth-method=service_account \
--vault-secret ***** \
--vault-endpoint 'https://example.com/vault' \
--dags-bucket europe-west1-12323a-bucket \
--gcp-project-id my_gcp_dev_project \
--clear-dags-folder

Project details

These details have not been verified by PyPI

Project links

Homepage

Release history Release notifications | RSS feed

1.11.3

Apr 9, 2025

1.11.1

Mar 11, 2025

1.11.0

Mar 6, 2025

1.10.0

May 29, 2024

1.9.0

May 20, 2024

1.9.0.dev1 pre-release

May 16, 2024

1.8.0

Jul 13, 2023

1.7.2

May 17, 2023

1.7.1

May 9, 2023

1.7.0

Mar 14, 2023

1.7.0.dev1 pre-release

Feb 23, 2023

1.6.0

Feb 23, 2023

1.6.0.dev1 pre-release

Feb 23, 2023

1.5.5.dev2 pre-release

Jan 19, 2023

1.5.5.dev1 pre-release

Jan 17, 2023

1.5.4

Jan 16, 2023

1.5.4.dev1 pre-release

Jan 16, 2023

1.5.3

Nov 28, 2022

1.5.3.dev1 pre-release

Nov 21, 2022

1.5.2

Nov 17, 2022

1.5.2.dev2 pre-release

Nov 16, 2022

1.5.2.dev1 pre-release

Nov 16, 2022

1.5.1

Nov 15, 2022

1.5.1.dev1 pre-release

Nov 15, 2022

1.5.0

Nov 8, 2022

1.5.0.dev2 pre-release

Nov 8, 2022

1.5.0.dev1 pre-release

Nov 7, 2022

1.4.2

Apr 5, 2022

1.4.2rc6 pre-release

Mar 22, 2022

1.4.2rc5 pre-release

Mar 22, 2022

1.4.2rc4 pre-release

Mar 12, 2022

1.4.2rc3 pre-release

Mar 12, 2022

1.4.2rc2 pre-release

Feb 28, 2022

1.4.2rc1 pre-release

Feb 17, 2022

1.4.2.dev5 pre-release

Mar 16, 2022

1.4.2.dev4 pre-release

Feb 15, 2022

1.4.2.dev3 pre-release

Feb 1, 2022

1.4.2.dev2 pre-release

Jan 31, 2022

1.4.2.dev1 pre-release

Jan 19, 2022

1.4.1

Jan 10, 2022

1.4.1.dev7 pre-release

Dec 28, 2021

1.4.1.dev6 pre-release

Dec 28, 2021

1.4.1.dev5 pre-release

Dec 10, 2021

1.4.1.dev4 pre-release

Dec 8, 2021

1.4.1.dev3 pre-release

Dec 8, 2021

1.4.1.dev2 pre-release

Nov 26, 2021

1.4.1.dev0 pre-release

Nov 26, 2021

1.4.0

Nov 26, 2021

1.4.0.dev1 pre-release

Nov 25, 2021

1.3.6.dev4 pre-release

Oct 26, 2021

1.3.6.dev3 pre-release

Oct 22, 2021

1.3.6.dev2 pre-release

Sep 17, 2021

1.3.6.dev1 pre-release

Sep 13, 2021

1.3.5

Sep 8, 2021

1.3.4

Sep 2, 2021

1.3.3

Aug 19, 2021

1.3.2

Aug 13, 2021

1.3.1

Jul 28, 2021

1.3.0

Jul 13, 2021

1.3.0.dev10 pre-release

Jul 13, 2021

1.3.0.dev8 pre-release

Jun 24, 2021

1.3.0.dev7 pre-release

May 31, 2021

1.3.0.dev6 pre-release

May 17, 2021

1.3.0.dev5 pre-release

May 4, 2021

1.3.0.dev4 pre-release

Apr 27, 2021

1.3.0.dev3 pre-release

Apr 27, 2021

1.3.0.dev2 pre-release

Apr 15, 2021

1.3.0.dev1 pre-release

Apr 14, 2021

1.2.1

Apr 16, 2021

1.2.0

Mar 30, 2021

1.2.0rc1 pre-release

Mar 25, 2021

1.2.0b2 pre-release

Mar 25, 2021

1.2.0b1 pre-release

Mar 19, 2021

1.1.4

Feb 5, 2021

1.1.3

Jan 8, 2021

1.1.2

Jan 8, 2021

1.1.1

Jan 8, 2021

1.1.0

Jan 8, 2021

1.1.0a3 pre-release

Dec 29, 2020

1.1.0a2 pre-release

Dec 29, 2020

1.1.0a1 pre-release

Dec 28, 2020

1.1.dev9 pre-release

Dec 21, 2020

1.1.dev8 pre-release

Dec 21, 2020

1.1.dev7 pre-release

Dec 21, 2020

1.1.dev6 pre-release

Dec 18, 2020

1.1.dev5 pre-release

Dec 18, 2020

1.1.dev4 pre-release

Dec 16, 2020

1.1.dev3 pre-release

Dec 15, 2020

1.1.dev2 pre-release

Dec 15, 2020

1.1.dev1 pre-release

Dec 11, 2020

1.0.4

Dec 8, 2020

1.0.3

Dec 3, 2020

1.0.2

Nov 19, 2020

1.0.2.dev2 pre-release

Nov 18, 2020

1.0.2.dev1 pre-release

Nov 18, 2020

1.0.1

Nov 18, 2020

1.0.1.dev1 pre-release

Nov 13, 2020

1.0.0

Nov 4, 2020

1.0rc1 pre-release

Nov 3, 2020

1.0b6 pre-release

Nov 2, 2020

1.0b5 pre-release

Oct 30, 2020

1.0b4 pre-release

Oct 30, 2020

1.0b3 pre-release

Oct 30, 2020

1.0b2 pre-release

Oct 29, 2020

1.0b1 pre-release

Oct 29, 2020

1.0.dev91 pre-release

Oct 29, 2020

1.0.dev90 pre-release

Oct 27, 2020

1.0.dev89 pre-release

Oct 27, 2020

1.0.dev88 pre-release

Oct 26, 2020

1.0.dev87 pre-release

Oct 26, 2020

1.0.dev86 pre-release

Oct 22, 2020

1.0.dev85 pre-release

Oct 22, 2020

1.0.dev84 pre-release

Oct 22, 2020

1.0.dev83 pre-release

Oct 22, 2020

1.0.dev82 pre-release

Oct 22, 2020

1.0.dev81 pre-release

Oct 21, 2020

1.0.dev80 pre-release

Oct 21, 2020

1.0.dev79 pre-release

Oct 21, 2020

1.0.dev78 pre-release

Oct 21, 2020

1.0.dev77 pre-release

Oct 20, 2020

1.0.dev76 pre-release

Oct 19, 2020

1.0.dev75 pre-release

Oct 19, 2020

1.0.dev74 pre-release

Oct 16, 2020

1.0.dev73 pre-release

Oct 16, 2020

1.0.dev72 pre-release

Oct 15, 2020

1.0.dev71 pre-release

Oct 14, 2020

1.0.dev70 pre-release

Oct 13, 2020

1.0.dev69 pre-release

Oct 13, 2020

1.0.dev68 pre-release

Oct 9, 2020

1.0.dev67 pre-release

Oct 7, 2020

1.0.dev66 pre-release

Oct 6, 2020

1.0.dev65 pre-release

Oct 6, 2020

1.0.dev64 pre-release

Oct 5, 2020

1.0.dev63 pre-release

Oct 5, 2020

1.0.dev61 pre-release

Sep 30, 2020

1.0.dev60 pre-release

Sep 30, 2020

1.0.dev59 pre-release

Sep 30, 2020

1.0.dev58 pre-release

Sep 30, 2020

1.0.dev57 pre-release

Sep 30, 2020

1.0.dev56 pre-release

Sep 30, 2020

1.0.dev55 pre-release

Sep 30, 2020

1.0.dev53 pre-release

Sep 30, 2020

1.0.dev52 pre-release

Sep 29, 2020

1.0.dev51 pre-release

Sep 29, 2020

1.0.dev50 pre-release

Sep 29, 2020

1.0.dev49 pre-release

Sep 29, 2020

1.0.dev48 pre-release

Sep 29, 2020

1.0.dev47 pre-release

Sep 29, 2020

1.0.dev46 pre-release

Sep 29, 2020

1.0.dev45 pre-release

Sep 29, 2020

1.0.dev44 pre-release

Sep 28, 2020

1.0.dev43 pre-release

Sep 24, 2020

1.0.dev42 pre-release

Sep 24, 2020

1.0.dev41 pre-release

Sep 24, 2020

1.0.dev39 pre-release

Sep 24, 2020

1.0.dev38 pre-release

Sep 24, 2020

1.0.dev37 pre-release

Sep 24, 2020

1.0.dev36 pre-release

Sep 24, 2020

1.0.dev35 pre-release

Sep 14, 2020

1.0.dev34 pre-release

Sep 11, 2020

1.0.dev33 pre-release

Sep 11, 2020

1.0.dev32 pre-release

Sep 10, 2020

1.0.dev31 pre-release

Sep 7, 2020

1.0.dev30 pre-release

Sep 7, 2020

1.0.dev29 pre-release

Sep 7, 2020

1.0.dev28 pre-release

Sep 7, 2020

1.0.dev27 pre-release

Sep 4, 2020

1.0.dev26 pre-release

Sep 2, 2020

1.0.dev25 pre-release

Sep 2, 2020

1.0.dev24 pre-release

Sep 1, 2020

1.0.dev23 pre-release

Sep 1, 2020

1.0.dev22 pre-release

Aug 28, 2020

1.0.dev21 pre-release

Aug 27, 2020

1.0.dev20 pre-release

Aug 27, 2020

1.0.dev19 pre-release

Aug 27, 2020

1.0.dev18 pre-release

Aug 27, 2020

1.0.dev17 pre-release

Aug 27, 2020

1.0.dev16 pre-release

Aug 26, 2020

1.0.dev15 pre-release

Aug 26, 2020

1.0.dev14 pre-release

Aug 26, 2020

1.0.dev13 pre-release

Aug 26, 2020

1.0.dev12 pre-release

Aug 26, 2020

1.0.dev11 pre-release

Aug 25, 2020

1.0.dev10 pre-release

Aug 25, 2020

1.0.dev9 pre-release

Aug 25, 2020

1.0.dev8 pre-release

Aug 25, 2020

1.0.dev7 pre-release

Aug 25, 2020

1.0.dev6 pre-release

Aug 24, 2020

1.0.dev5 pre-release

Aug 21, 2020

1.0.dev4 pre-release

Aug 21, 2020

1.0.dev3 pre-release

Aug 20, 2020

1.0.dev2 pre-release

Aug 19, 2020

1.0.dev1 pre-release

Aug 11, 2020

0.1.1

Aug 11, 2020

This version

0.1.0

Aug 11, 2020

Download files

Download the file for your platform. If you're not sure which to choose, learn more about installing packages.

Source Distribution

bigflow-0.1.0.tar.gz (39.4 kB view details)

Uploaded Aug 11, 2020 Source

Built Distribution

bigflow-0.1.0-py2-none-any.whl (37.0 kB view details)

Uploaded Aug 11, 2020 Python 2

File details

Details for the file bigflow-0.1.0.tar.gz.

File metadata

Download URL: bigflow-0.1.0.tar.gz
Upload date: Aug 11, 2020
Size: 39.4 kB
Tags: Source
Uploaded using Trusted Publishing? No
Uploaded via: twine/1.15.0 pkginfo/1.5.0.1 requests/2.23.0 setuptools/44.1.1 requests-toolbelt/0.9.1 tqdm/4.48.2 CPython/2.7.17

File hashes

Hashes for bigflow-0.1.0.tar.gz
Algorithm	Hash digest
SHA256	`c3e516913d2d10bacf9e691a7a707b5949ded9032bb6dbe3bddac862e0315936`
MD5	`c7c3ab37a2f3b8144a7b66c1160e93fc`
BLAKE2b-256	`0c1c4f8e6d9977be249d6caad64dfeab014a6231e3220536aec9b3b83f9c0d5f`

See more details on using hashes here.

File details

Details for the file bigflow-0.1.0-py2-none-any.whl.

File metadata

Download URL: bigflow-0.1.0-py2-none-any.whl
Upload date: Aug 11, 2020
Size: 37.0 kB
Tags: Python 2
Uploaded using Trusted Publishing? No
Uploaded via: twine/1.15.0 pkginfo/1.5.0.1 requests/2.23.0 setuptools/44.1.1 requests-toolbelt/0.9.1 tqdm/4.48.2 CPython/2.7.17

File hashes

Hashes for bigflow-0.1.0-py2-none-any.whl
Algorithm	Hash digest
SHA256	`ea44b334fa671fbd970b2a65eeb5a0632847f777c92be27a93cffee166706c5c`
MD5	`b046ad08dc9b0acf208d58e2399aabcd`
BLAKE2b-256	`fc44cdfb60af23873e11da463803cc3c55f85c57499d33caa10889ac7b7b5823`

See more details on using hashes here.

bigflow 0.1.0

Navigation

Verified details

Maintainers

Unverified details

Project links

Meta

Classifiers

Project description

BigFlow — The Python framework for BigQuery

Installation

Compatibility

Cheat sheet

Setup

Authorize with a GCP user account

Create table

Query table

Estimate query cost(dry run)

Write to table

Create non-partitioned table from query results

Save pandas DataFrame to table

Generate DAG from notebook

Wait for tables

Write custom component

Running BigFlow

Run

Tutorial

Other resources

CLI

CLI deploy

Authentication methods

Managing configuration in deployment_config.py

Deploy DAG files examples

Deploy Docker image examples

Complete deploy examples

Project details

Verified details

Maintainers

Unverified details

Project links

Meta

Classifiers

Release history Release notifications | RSS feed

Download files

Source Distribution

Built Distribution

File details

File metadata

File hashes

File details

File metadata

File hashes