SDK for creating DataForge extensions

Project description

dataforge-sdk

SDK for creating DataForge extensions.

Example projects and usage patterns: https://github.com/dataforgelabs/dataforge-sdk

Postgres Utilities

The dataforge.pg module provides helper functions to execute SQL operations against the DataForge Postgres metastore:

from dataforge.pg import select, update, pull

# Execute a SELECT query and return a Spark DataFrame
df = select("SELECT * FROM my_table")

# Execute an UPDATE/INSERT/DELETE query
update("UPDATE my_table SET col = 'value'")

# Trigger a new data pull for source_id 123
pull(123)

IngestionSession

The IngestionSession class manages a custom data ingestion process lifecycle.

from dataforge import IngestionSession

# Initialize a session (production use)
session = IngestionSession()

# Initialize a session (optional source_name/project_name for testing)
session = IngestionSession(source_name="my_source", project_name="my_project")

# Ingest data 
# pass a function returning a DataFrame (recommended to integrate logging with DataForge)
session.ingest(lambda: spark.read.csv("s3://bucket/path/input.csv"))

# pass a DataFrame (can be used for testing, not recommended for production deployment)
df = spark.read.csv("s3://bucket/path/input.csv")
session.ingest(df)

# ingest empty dataframe to create 0-record input
session.ingest()


# Fail the process with error message
session.fail("Error message")

# Retrieve latest tracking fields
tracking = session.latest_tracking_fields()

# Retrieve connection parameters for the current source
connection_parameters = session.connection_parameters()

# Retrieve custom parameters for the current source
custom_parameters = session.custom_parameters()

ParsingSession

The ParsingSession class manages a custom parse process lifecycle.

from dataforge import ParsingSession

# Initialize a session (production use)
session = ParsingSession()

# Initialize a session (optional input_id for testing)
session = ParsingSession(input_id=123)

# Retrieve custom parameters
params = session.custom_parameters()

# Get the path of file to be parsed
path = session.file_path

# Run parsing: pass a DataFrame, a function returning a DataFrame or None (0-record file)
session.run(lambda: spark.read.json(session.file_path))

# Fail the process with error message
session.fail("Error message")

PostOutputSession

The PostOutputSession class manages a custom post-output process lifecycle.

from dataforge import PostOutputSession

# Initialize a session (production use)
session = PostOutputSession()

# Initialize a session (optional names for testing)
session = PostOutputSession(output_name="report", output_source_name="my_source", project_name="my_project")


# Get the path of file generated by preceding output process
path = session.file_path()

# Retrieve connection parameters for the current output
connection_parameters = session.connection_parameters()

# Retrieve custom parameters for the current source
custom_parameters = session.custom_parameters()

# Run post-output logic: pass a function encapsulating custom code
session.run(lambda: print(f"Uploading file from {path}"))

# Fail the process with error message
session.fail("Error message")

Project details

Release history Release notifications | RSS feed

10.2.0rc22 pre-release

Jun 3, 2026

This version

10.2.0rc21 pre-release

Jun 3, 2026

10.2.0rc20 pre-release

Jun 2, 2026

10.2.0rc19 pre-release

Jun 2, 2026

10.2.0rc18 pre-release

Jun 2, 2026

10.2.0rc17 pre-release

Jun 2, 2026

10.2.0rc16 pre-release

Jun 1, 2026

10.2.0rc15 pre-release

May 29, 2026

10.2.0rc14 pre-release

May 29, 2026

10.2.0rc13 pre-release

May 29, 2026

10.2.0rc12 pre-release

May 29, 2026

10.2.0rc11 pre-release

May 29, 2026

10.2.0rc10 pre-release

May 28, 2026

10.2.0rc9 pre-release

May 27, 2026

10.2.0rc8 pre-release

May 27, 2026

10.2.0rc7 pre-release

May 26, 2026

10.2.0rc6 pre-release

May 21, 2026

10.2.0rc5 pre-release

May 20, 2026

10.2.0rc4 pre-release

May 19, 2026

10.2.0rc3 pre-release

May 18, 2026

10.2.0rc2 pre-release

May 18, 2026

10.2.0rc1 pre-release

May 18, 2026

10.1.1

Apr 28, 2026

10.1.1rc14 pre-release

Apr 28, 2026

10.1.1rc13 pre-release

Apr 27, 2026

10.1.1rc12 pre-release

Apr 27, 2026

10.1.1rc11 pre-release

Apr 27, 2026

10.1.1rc10 pre-release

Apr 24, 2026

10.1.1rc9 pre-release

Apr 23, 2026

10.1.1rc8 pre-release

Apr 22, 2026

10.1.1rc7 pre-release

Apr 22, 2026

10.1.1rc6 pre-release

Apr 22, 2026

10.1.1rc5 pre-release

Apr 21, 2026

10.1.1rc4 pre-release

Apr 21, 2026

10.1.1rc3 pre-release

Apr 20, 2026

10.1.1rc2 pre-release

Apr 17, 2026

10.1.1rc1 pre-release

Apr 17, 2026

10.1.0

Apr 15, 2026

10.1.0rc54 pre-release

Apr 14, 2026

10.1.0rc53 pre-release

Apr 14, 2026

10.1.0rc52 pre-release

Apr 14, 2026

10.1.0rc51 pre-release

Apr 14, 2026

10.1.0rc50 pre-release

Apr 13, 2026

10.1.0rc49 pre-release

Apr 11, 2026

10.1.0rc48 pre-release

Apr 10, 2026

10.1.0rc47 pre-release

Apr 8, 2026

10.1.0rc46 pre-release

Apr 7, 2026

10.1.0rc45 pre-release

Apr 7, 2026

10.1.0rc44 pre-release

Apr 6, 2026

10.1.0rc43 pre-release

Apr 3, 2026

10.1.0rc42 pre-release

Apr 2, 2026

10.1.0rc41 pre-release

Apr 2, 2026

10.1.0rc40 pre-release

Apr 1, 2026

10.1.0rc39 pre-release

Apr 1, 2026

10.1.0rc38 pre-release

Mar 31, 2026

10.1.0rc37 pre-release

Mar 30, 2026

10.1.0rc36 pre-release

Mar 27, 2026

10.1.0rc35 pre-release

Mar 27, 2026

10.1.0rc34 pre-release

Mar 26, 2026

10.1.0rc33 pre-release

Mar 24, 2026

10.1.0rc32 pre-release

Mar 24, 2026

10.1.0rc31 pre-release

Mar 24, 2026

10.1.0rc30 pre-release

Mar 23, 2026

10.1.0rc29 pre-release

Mar 23, 2026

10.1.0rc28 pre-release

Mar 23, 2026

10.1.0rc27 pre-release

Mar 23, 2026

10.1.0rc26 pre-release

Mar 23, 2026

10.1.0rc25 pre-release

Mar 20, 2026

10.1.0rc24 pre-release

Mar 20, 2026

10.1.0rc23 pre-release

Mar 19, 2026

10.1.0rc22 pre-release

Mar 17, 2026

10.1.0rc21 pre-release

Mar 17, 2026

10.1.0rc20 pre-release

Mar 16, 2026

10.1.0rc19 pre-release

Mar 16, 2026

10.1.0rc18 pre-release

Mar 10, 2026

10.1.0rc17 pre-release

Mar 10, 2026

10.1.0rc16 pre-release

Mar 9, 2026

10.1.0rc15 pre-release

Mar 9, 2026

10.1.0rc14 pre-release

Mar 9, 2026

10.1.0rc13 pre-release

Mar 9, 2026

10.1.0rc12 pre-release

Mar 9, 2026

10.1.0rc11 pre-release

Mar 9, 2026

10.1.0rc10 pre-release

Mar 9, 2026

10.1.0rc9 pre-release

Mar 9, 2026

10.1.0rc8 pre-release

Mar 9, 2026

10.1.0rc7 pre-release

Mar 9, 2026

10.1.0rc6 pre-release

Mar 9, 2026

10.1.0rc5 pre-release

Mar 6, 2026

10.1.0rc4 pre-release

Mar 6, 2026

10.1.0rc3 pre-release

Mar 6, 2026

10.1.0rc2 pre-release

Mar 6, 2026

10.1.0rc1 pre-release

Mar 6, 2026

10.0.3

Feb 19, 2026

10.0.3rc6 pre-release

Feb 17, 2026

10.0.3rc5 pre-release

Feb 13, 2026

10.0.3rc4 pre-release

Feb 10, 2026

10.0.3rc3 pre-release

Feb 6, 2026

10.0.3rc2 pre-release

Feb 5, 2026

10.0.3rc1 pre-release

Feb 5, 2026

10.0.2

Jan 16, 2026

10.0.2rc1 pre-release

Jan 15, 2026

10.0.1

Jan 15, 2026

10.0.1rc7 pre-release

Jan 15, 2026

10.0.1rc6 pre-release

Jan 15, 2026

10.0.1rc5 pre-release

Jan 14, 2026

10.0.1rc4 pre-release

Jan 14, 2026

10.0.1rc3 pre-release

Jan 14, 2026

10.0.1rc2 pre-release

Jan 13, 2026

10.0.1rc1 pre-release

Jan 9, 2026

10.0.0

Jan 8, 2026

10.0.0rc23 pre-release

Jan 7, 2026

10.0.0rc22 pre-release

Jan 7, 2026

10.0.0rc21 pre-release

Dec 19, 2025

10.0.0rc20 pre-release

Dec 19, 2025

10.0.0rc19 pre-release

Dec 19, 2025

10.0.0rc18 pre-release

Dec 17, 2025

10.0.0rc17 pre-release

Dec 16, 2025

10.0.0rc16 pre-release

Dec 15, 2025

10.0.0rc15 pre-release

Dec 12, 2025

10.0.0rc14 pre-release

Dec 12, 2025

10.0.0rc13 pre-release

Dec 12, 2025

10.0.0rc12 pre-release

Dec 11, 2025

10.0.0rc11 pre-release

Dec 11, 2025

10.0.0rc10 pre-release

Dec 8, 2025

10.0.0rc9 pre-release

Dec 5, 2025

10.0.0rc8 pre-release

Dec 5, 2025

10.0.0rc7 pre-release

Dec 4, 2025

10.0.0rc6 pre-release

Dec 4, 2025

10.0.0rc5 pre-release

Dec 4, 2025

10.0.0rc4 pre-release

Sep 29, 2025

10.0.0rc3 pre-release

Sep 29, 2025

10.0.0rc2 pre-release

Dec 1, 2025

10.0.0rc1 pre-release

Nov 26, 2025

10.0.dev115 pre-release

Sep 5, 2025

9.2.6

Oct 15, 2025

9.2.6rc1 pre-release

Oct 15, 2025

9.2.5

Sep 26, 2025

9.2.5rc4 pre-release

Sep 25, 2025

9.2.5rc3 pre-release

Sep 25, 2025

9.2.5rc2 pre-release

Sep 24, 2025

9.2.5rc1 pre-release

Sep 24, 2025

9.2.4

Sep 5, 2025

9.2.4rc2 pre-release

Sep 4, 2025

9.2.4rc1 pre-release

Sep 3, 2025

9.2.3

Aug 27, 2025

9.2.3rc1 pre-release

Aug 26, 2025

9.2.2

Aug 14, 2025

9.2.1

Aug 14, 2025

9.2.1rc2 pre-release

Aug 12, 2025

9.2.1rc1 pre-release

Aug 12, 2025

9.2.0

Aug 7, 2025

9.2.0rc14 pre-release

Aug 5, 2025

9.2.0rc13 pre-release

Aug 4, 2025

9.2.0rc12 pre-release

Aug 4, 2025

9.2.0rc11 pre-release

Jul 31, 2025

9.2.0rc10 pre-release

Jul 31, 2025

9.2.0rc9 pre-release

Jul 29, 2025

9.2.0rc8 pre-release

Jul 29, 2025

9.2.0rc7 pre-release

Jul 29, 2025

9.2.0rc6 pre-release

Jul 29, 2025

9.2.0rc5 pre-release

Jul 28, 2025

9.2.0rc4 pre-release

Jul 25, 2025

9.2.0rc3 pre-release

Jul 25, 2025

Download files

Download the file for your platform. If you're not sure which to choose, learn more about installing packages.

Source Distribution

dataforge_sdk-10.2.0rc21.tar.gz (13.6 kB view details)

Uploaded Jun 3, 2026 Source

Built Distribution

If you're not sure about the file name format, learn more about wheel file names.

The dropdown lists show the available interpreters, ABIs, and platforms. Enable javascript to be able to filter the list of wheel files.

dataforge_sdk-10.2.0rc21-py3-none-any.whl (20.3 kB view details)

Uploaded Jun 3, 2026 Python 3

File details

Details for the file dataforge_sdk-10.2.0rc21.tar.gz.

File metadata

Download URL: dataforge_sdk-10.2.0rc21.tar.gz
Upload date: Jun 3, 2026
Size: 13.6 kB
Tags: Source
Uploaded using Trusted Publishing? No
Uploaded via: twine/6.2.0 CPython/3.10.20

File hashes

Hashes for dataforge_sdk-10.2.0rc21.tar.gz
Algorithm	Hash digest
SHA256	`40ba6646a7f2ccb7ee1647fdced081616631c9d19def1749a9bc0ba682e32060`
MD5	`ed4d1bc9952447b722a42ab550838a8f`
BLAKE2b-256	`368012c78a92d8efaac1fe95d1529152ba25c4cd00770fa53c184305aa881bb5`

See more details on using hashes here.

File details

Details for the file dataforge_sdk-10.2.0rc21-py3-none-any.whl.

File metadata

Download URL: dataforge_sdk-10.2.0rc21-py3-none-any.whl
Upload date: Jun 3, 2026
Size: 20.3 kB
Tags: Python 3
Uploaded using Trusted Publishing? No
Uploaded via: twine/6.2.0 CPython/3.10.20

File hashes

Hashes for dataforge_sdk-10.2.0rc21-py3-none-any.whl
Algorithm	Hash digest
SHA256	`e1aa3b4223493e42a11b7a296649d7754217f488f013db7b5ae5b989258195a7`
MD5	`939bfedcb205c57096faac8ff274b688`
BLAKE2b-256	`67b61501ccdee8e9f91065c00f3f3ec5570a1533e8658b9f822746812b4c7589`

See more details on using hashes here.

dataforge-sdk 10.2.0rc21

Navigation

Verified details

Maintainers

Unverified details

Project links

Meta

Project description

dataforge-sdk

Postgres Utilities

IngestionSession

ParsingSession

PostOutputSession

Project details

Verified details

Maintainers

Unverified details

Project links

Meta

Release history Release notifications | RSS feed

Download files

Source Distribution

Built Distribution

File details

File metadata

File hashes

File details

File metadata

File hashes