Metrics for Synthetic Data Generation Projects

These details have not been verified by PyPI

Project links

Project description

This repository is part of The Synthetic Data Vault Project, a project from DataCebo.

Overview

The SDMetrics library evaluates synthetic data by comparing it to the real data that you're trying to mimic. It includes a variety of metrics to capture different aspects of the data, for example quality and privacy. It also includes reports that you can run to generate insights, visualize data and share with your team.

The SDMetrics library is model-agnostic, meaning you can use any synthetic data. The library does not need to know how you created the data.

Install

Install SDMetrics using pip or conda. We recommend using a virtual environment to avoid conflicts with other software on your device.

pip install sdmetrics

conda install -c conda-forge sdmetrics

For more information about using SDMetrics, visit the SDMetrics Documentation.

Usage

Get started with SDMetrics Reports using some demo data,

from sdmetrics import load_demo
from sdmetrics.reports.single_table import QualityReport

real_data, synthetic_data, metadata = load_demo(modality='single_table')

my_report = QualityReport()
my_report.generate(real_data, synthetic_data, metadata)

Creating report: 100%|██████████| 4/4 [00:00<00:00,  5.22it/s]

Overall Quality Score: 82.84%

Properties:
Column Shapes: 82.78%
Column Pair Trends: 82.9%

Once you generate the report, you can drill down on the details and visualize the results.

my_report.get_visualization(property_name='Column Pair Trends')

Save the report and share it with your team.

my_report.save(filepath='demo_data_quality_report.pkl')

# load it at any point in the future
my_report = QualityReport.load(filepath='demo_data_quality_report.pkl')

Want more metrics? You can also manually apply any of the metrics in this library to your data.

# calculate whether the synthetic data respects the min/max bounds
# set by the real data
from sdmetrics.single_column import BoundaryAdherence

BoundaryAdherence.compute(
    real_data['start_date'],
    synthetic_data['start_date']
)

0.8503937007874016

# calculate whether the synthetic data is new or whether it's an exact copy of the real data
from sdmetrics.single_table import NewRowSynthesis

NewRowSynthesis.compute(
    real_data,
    synthetic_data,
    metadata
)

1.0

What's next?

To learn more about the reports and metrics, visit the SDMetrics Documentation.

The Synthetic Data Vault Project was first created at MIT's Data to AI Lab in 2016. After 4 years of research and traction with enterprise, we created DataCebo in 2020 with the goal of growing the project. Today, DataCebo is the proud developer of SDV, the largest ecosystem for synthetic data generation & evaluation. It is home to multiple libraries that support synthetic data, including:

🔄 Data discovery & transformation. Reverse the transforms to reproduce realistic data.
🧠 Multiple machine learning models -- ranging from Copulas to Deep Learning -- to create tabular, multi table and time series data.
📊 Measuring quality and privacy of synthetic data, and comparing different synthetic data generation models.

Get started using the SDV package -- a fully integrated solution and your one-stop shop for synthetic data. Or, use the standalone libraries for specific needs.

Project details

These details have not been verified by PyPI

Project links

Release history Release notifications | RSS feed

This version

0.21.0

May 29, 2025

0.21.0.dev0 pre-release

May 29, 2025

0.20.1

Apr 14, 2025

0.20.1.dev0 pre-release

Apr 14, 2025

0.20.0 yanked

Apr 11, 2025

Reason this release was yanked:

Imports crashed unless torch was installed

0.20.0.dev0 pre-release

Apr 10, 2025

0.19.0

Feb 25, 2025

0.19.0.dev0 pre-release

Feb 24, 2025

0.18.0

Dec 13, 2024

0.18.0.dev0 pre-release

Dec 13, 2024

0.17.1

Dec 4, 2024

0.17.1.dev0 pre-release

Dec 4, 2024

0.17.0

Nov 15, 2024

0.17.0.dev0 pre-release

Nov 14, 2024

0.16.0

Sep 25, 2024

0.16.0.dev0 pre-release

Sep 25, 2024

0.15.1

Aug 13, 2024

0.15.1.dev0 pre-release

Aug 13, 2024

0.15.0

Jul 15, 2024

0.15.0.dev0 pre-release

Jul 12, 2024

0.14.1

May 13, 2024

0.14.1.dev0 pre-release

May 13, 2024

0.14.0

Apr 11, 2024

0.14.0.dev0 pre-release

Apr 10, 2024

0.13.1

Mar 14, 2024

0.13.1.dev0 pre-release

Mar 14, 2024

0.13.0

Dec 4, 2023

0.13.0.dev0 pre-release

Nov 30, 2023

0.12.1

Nov 1, 2023

0.12.1.dev0 pre-release

Nov 1, 2023

0.12.0

Nov 1, 2023

0.12.0.dev0 pre-release

Oct 31, 2023

0.11.1

Sep 14, 2023

0.11.1.dev0 pre-release

Sep 14, 2023

0.11.0

Aug 10, 2023

0.11.0.dev0 pre-release

Aug 10, 2023

0.10.1

Jun 6, 2023

0.10.1.dev0 pre-release

Jun 5, 2023

0.10.0

May 4, 2023

0.10.0.dev2 pre-release

May 3, 2023

0.10.0.dev1 pre-release

May 3, 2023

0.10.0.dev0 pre-release

May 2, 2023

0.9.3

Apr 12, 2023

0.9.3.dev0 pre-release

Apr 11, 2023

0.9.2

Mar 8, 2023

0.9.2.dev0 pre-release

Mar 7, 2023

0.9.1

Feb 17, 2023

0.9.1.dev0 pre-release

Feb 16, 2023

0.9.0

Jan 18, 2023

0.9.0.dev0 pre-release

Jan 18, 2023

0.8.1

Dec 10, 2022

0.8.1.dev0 pre-release

Dec 8, 2022

0.8.0

Nov 2, 2022

0.8.0.dev0 pre-release

Nov 2, 2022

0.7.0

Sep 27, 2022

0.7.0.dev0 pre-release

Sep 27, 2022

0.6.0

Aug 12, 2022

0.6.0.dev1 pre-release

Aug 12, 2022

0.6.0.dev0 pre-release

Aug 12, 2022

0.5.1.dev0 pre-release

Jul 10, 2022

0.5.0

May 11, 2022

0.5.0.dev0 pre-release

May 11, 2022

0.4.2 yanked

May 10, 2022

Reason this release was yanked:

dependency conflict

0.4.2.dev0 pre-release

May 10, 2022

0.4.1

Dec 9, 2021

0.4.1.dev0 pre-release

Dec 9, 2021

0.4.0

Nov 16, 2021

0.4.0.dev0 pre-release

Nov 16, 2021

0.3.3.dev0 pre-release

Nov 5, 2021

0.3.2

Aug 17, 2021

0.3.2.dev1 pre-release

Aug 17, 2021

0.3.2.dev0 pre-release

Aug 17, 2021

0.3.1

Jul 12, 2021

0.3.1.dev1 pre-release

Jul 7, 2021

0.3.1.dev0 pre-release

Jul 2, 2021

0.3.0

Mar 31, 2021

0.3.0.dev1 pre-release

Mar 31, 2021

0.3.0.dev0 pre-release

Mar 29, 2021

0.2.1.dev0 pre-release

Mar 29, 2021

0.2.0

Feb 24, 2021

0.2.0.dev0 pre-release

Feb 23, 2021

0.1.3

Feb 13, 2021

0.1.3.dev0 pre-release

Feb 13, 2021

0.1.2

Jan 27, 2021

0.1.2.dev2 pre-release

Jan 27, 2021

0.1.2.dev1 pre-release

Jan 27, 2021

0.1.2.dev0 pre-release

Jan 27, 2021

0.1.1

Dec 30, 2020

0.1.1.dev0 pre-release

Dec 29, 2020

0.1.0

Dec 18, 2020

0.1.0.dev2 pre-release

Dec 18, 2020

0.1.0.dev1 pre-release

Dec 18, 2020

0.1.0.dev0 pre-release

Dec 16, 2020

0.0.4

Nov 27, 2020

0.0.4.dev0 pre-release

Nov 27, 2020

0.0.3

Nov 20, 2020

0.0.3.dev1 pre-release

Nov 20, 2020

0.0.3.dev0 pre-release

Nov 20, 2020

0.0.2

Aug 8, 2020

0.0.2.dev1 pre-release

Aug 7, 2020

0.0.2.dev0 pre-release

Jul 9, 2020

0.0.1

Jun 26, 2020

0.0.1.dev2 pre-release

Jun 26, 2020

0.0.1.dev1 pre-release

Jun 25, 2020

0.0.1.dev0 pre-release

Jun 25, 2020

0.0.0

Mar 20, 2020

Download files

Download the file for your platform. If you're not sure which to choose, learn more about installing packages.

Source Distribution

sdmetrics-0.21.0.tar.gz (131.2 kB view details)

Uploaded May 29, 2025 Source

Built Distribution

sdmetrics-0.21.0-py3-none-any.whl (193.5 kB view details)

Uploaded May 29, 2025 Python 3

File details

Details for the file sdmetrics-0.21.0.tar.gz.

File metadata

Download URL: sdmetrics-0.21.0.tar.gz
Upload date: May 29, 2025
Size: 131.2 kB
Tags: Source
Uploaded using Trusted Publishing? No
Uploaded via: twine/6.1.0 CPython/3.10.13

File hashes

Hashes for sdmetrics-0.21.0.tar.gz
Algorithm	Hash digest
SHA256	`c71087cc926cc4a3fbc700aaf969fb168da7edcca6a658a277eb33624e430222`
MD5	`4de343898e770a32b7f0ff0bf9af1474`
BLAKE2b-256	`7913961c907ea6de1278fb3fa8763c0bc536ad8486ec47e207cea6cd1a231eb6`

See more details on using hashes here.

File details

Details for the file sdmetrics-0.21.0-py3-none-any.whl.

File metadata

Download URL: sdmetrics-0.21.0-py3-none-any.whl
Upload date: May 29, 2025
Size: 193.5 kB
Tags: Python 3
Uploaded using Trusted Publishing? No
Uploaded via: twine/6.1.0 CPython/3.10.13

File hashes

Hashes for sdmetrics-0.21.0-py3-none-any.whl
Algorithm	Hash digest
SHA256	`745a54c377e4eb39af9eedece3eac23b034c3c0a6d2f42607f53a5be883020d0`
MD5	`765ec761e4d6075fe16328bb77be928d`
BLAKE2b-256	`7e8ca4fea2a8ae9e0e500f3179cfb0bae41d3be68ee336093d00a61e5f1b1332`

See more details on using hashes here.

sdmetrics 0.21.0

Navigation

Verified details

Maintainers

Unverified details

Project links

Meta

Classifiers

Project description

Overview

Install

Usage

What's next?

Project details

Verified details

Maintainers

Unverified details

Project links

Meta

Classifiers

Release history Release notifications | RSS feed

Download files

Source Distribution

Built Distribution

File details

File metadata

File hashes

File details

File metadata

File hashes