Timeseries DataFrame downsampling with LTTB, aggregation methods, gap handling, and fidelity testing

These details have not been verified by PyPI

Project links

Project description

downsampler

A Python package for time series DataFrame downsampling with LTTB, multiple aggregation methods, gap handling, and fidelity testing.

Features

Multiple downsampling methods: LTTB (visual fidelity), mean, median, min, max
Gap-aware processing: Automatically detects and handles gaps in time series
Edge handling: Flag, discard, or keep edge points
Multi-aggregate output: Generate min/mean/max columns in a single call
Deferred fetching: Lazy data loading with automatic edge buffering
Fidelity testing: Compare methods and measure visual accuracy

Installation

pip install downsampler

Or with visualization support:

pip install downsampler[viz]

Quick Start

Basic Downsampling

import pandas as pd
from downsampler import downsample

# Create sample data
df = pd.DataFrame(
    {'temperature': range(1000)},
    index=pd.date_range('2024-01-01', periods=1000, freq='1s')
)

# Downsample to 1-minute cadence (default: mean)
result = downsample(df, target_cadence='PT1M')

Using Different Methods

from downsampler import downsample, DownsampleConfig, AggregationMethod

# Mean (default)
result = downsample(df, '10min')

# Maximum
result = downsample(df, '10min', method='max')

# LTTB for visual fidelity
config = DownsampleConfig(
    method=AggregationMethod.LTTB,
    lttb_target_column='temperature'
)
result = downsample(df, '10min', config=config)

Multi-Aggregate Downsampling

Create min/mean/max columns for visualization with error bands:

from downsampler import downsample_multi_aggregate

result = downsample_multi_aggregate(
    df,
    target_cadence='1min',
    variables=['temperature', 'pressure'],
    aggregations=['min', 'mean', 'max']
)
# Result has columns: temperature_min, temperature_mean, temperature_max, etc.

Handling Gaps

from downsampler import DownsampleConfig, GapHandling

config = DownsampleConfig(
    gap_handling=GapHandling.SEGMENT,  # Process segments independently
    gap_threshold='5min'  # Gaps > 5 min trigger segmentation
)
result = downsample(df, '1min', config=config)

Deferred Data Fetching

For data that needs to be fetched from an external source:

from downsampler.deferred import deferred_downsample

def fetch_from_api(start, end):
    # Your data fetching logic here
    return pd.DataFrame(...)

result = deferred_downsample(
    fetcher=fetch_from_api,
    output_start=pd.Timestamp('2024-01-01'),
    output_end=pd.Timestamp('2024-01-02'),
    target_cadence='1H'
)

Fidelity Comparison

Compare different methods to find the best one for your data:

from downsampler.fidelity import FidelityComparison

comp = FidelityComparison(original_df, 'signal')
results = comp.compare_methods('10s')

for r in results:
    print(f"{r.method.value}: RMSE={r.metrics.rmse:.4f}")

# Get recommendation
config = comp.recommend_settings('10s', priority='visual')

Configuration Options

DownsampleConfig

Parameter	Type	Default	Description
`method`	AggregationMethod	MEAN	Downsampling method
`lttb_target_column`	str	None	Column to optimize for LTTB
`include_columns`	list[str]	[]	Columns to include (empty = all)
`exclude_columns`	list[str]	[]	Columns to exclude
`gap_handling`	GapHandling	SEGMENT	How to handle gaps
`gap_threshold`	str/Timedelta	"auto"	Min duration for gaps
`edge_handling`	EdgeHandling	FLAG	How to handle edges
`edge_window`	int	2	Points at each edge
`min_points_per_segment`	int	3	Min points for processing

Aggregation Methods

MEAN: Arithmetic mean (best for general use)
MEDIAN: Median (robust to outliers)
MIN: Minimum value (preserves lows)
MAX: Maximum value (preserves highs)
LTTB: Largest Triangle Three Buckets (best visual fidelity)

Gap Handling

SEGMENT: Split at gaps, process independently (recommended)
INTERPOLATE: Fill gaps before processing
IGNORE: Treat as continuous data

Edge Handling

KEEP: Keep edge points as-is
FLAG: Add _is_edge column
DISCARD: Remove edge points

Examples

See the examples/ directory for complete examples:

basic_downsampling.py: Core downsampling features
multi_aggregate.py: Creating min/mean/max columns
deferred_fetch.py: Lazy data loading
fidelity_comparison.marimo.py: Interactive comparison notebook

API Reference

Core Functions

downsample(df, target_cadence, config=None, **kwargs) -> DataFrame
downsample_multi_aggregate(df, target_cadence, variables, aggregations, ...) -> DataFrame

Gap Functions

find_gap_indices(df, timedelta_max_gap) -> Series
groupby_gaps(df, timedelta_max_gap) -> DataFrameGroupBy
split_at_gaps(df, timedelta_max_gap) -> list[DataFrame]
mark_gaps_in_dataframe(df, nominal_timedelta, ...) -> DataFrame

Deferred Functions

deferred_downsample(fetcher, output_start, output_end, target_cadence, ...) -> DataFrame
batch_deferred_downsample(fetcher, ..., batch_size) -> DataFrame
LazyDownsampler(fetcher, cache_buffer) -> LazyDownsampler

Fidelity Functions

compute_metrics(original, downsampled, column) -> FidelityMetrics
FidelityComparison(original_df, column) -> FidelityComparison
plot_comparison(original, downsampled, column, backend) -> Figure

License

MIT License - see LICENSE file for details.

Contributing

Contributions are welcome! Please feel free to submit issues and pull requests.

Project details

These details have not been verified by PyPI

Project links

Release history Release notifications | RSS feed

0.2.0

Mar 19, 2026

This version

0.1.0

Jan 21, 2026

Download files

Download the file for your platform. If you're not sure which to choose, learn more about installing packages.

Source Distribution

downsampler-0.1.0.tar.gz (31.1 kB view details)

Uploaded Jan 21, 2026 Source

Built Distribution

If you're not sure about the file name format, learn more about wheel file names.

The dropdown lists show the available interpreters, ABIs, and platforms. Enable javascript to be able to filter the list of wheel files.

downsampler-0.1.0-py3-none-any.whl (30.2 kB view details)

Uploaded Jan 21, 2026 Python 3

File details

Details for the file downsampler-0.1.0.tar.gz.

File metadata

Download URL: downsampler-0.1.0.tar.gz
Upload date: Jan 21, 2026
Size: 31.1 kB
Tags: Source
Uploaded using Trusted Publishing? No
Uploaded via: twine/6.2.0 CPython/3.13.7

File hashes

Hashes for downsampler-0.1.0.tar.gz
Algorithm	Hash digest
SHA256	`8ae3b8a660781c784b427ba2953a0570e77f251133c6d13449d8aa066b941dbb`
MD5	`9911b1aedd9458d0736e793206588bb0`
BLAKE2b-256	`69c6b387f61e552558bd706489123a25dff76d66b45c25ad38fda350a7008053`

See more details on using hashes here.

File details

Details for the file downsampler-0.1.0-py3-none-any.whl.

File metadata

Download URL: downsampler-0.1.0-py3-none-any.whl
Upload date: Jan 21, 2026
Size: 30.2 kB
Tags: Python 3
Uploaded using Trusted Publishing? No
Uploaded via: twine/6.2.0 CPython/3.13.7

File hashes

Hashes for downsampler-0.1.0-py3-none-any.whl
Algorithm	Hash digest
SHA256	`ff765859479f8ec75aa958b4bfa96a164b2540cc2d677a63665b99ed81d4d4ec`
MD5	`a746638222e4990fa58a6d2d281c2c83`
BLAKE2b-256	`ed1b61e9e1c7b59727abc1ed7d13b08003474434b4aa824a6fb0ce0b6ab247e2`

See more details on using hashes here.

downsampler 0.1.0

Navigation

Verified details

Maintainers

Unverified details

Project links

Meta

Classifiers

Project description

downsampler

Features

Installation

Quick Start

Basic Downsampling

Using Different Methods

Multi-Aggregate Downsampling

Handling Gaps

Deferred Data Fetching

Fidelity Comparison

Configuration Options

DownsampleConfig

Aggregation Methods

Gap Handling

Edge Handling

Examples

API Reference

Core Functions

Gap Functions

Deferred Functions

Fidelity Functions

License

Contributing

Project details

Verified details

Maintainers

Unverified details

Project links

Meta

Classifiers

Release history Release notifications | RSS feed

Download files

Source Distribution

Built Distribution

File details

File metadata

File hashes

File details

File metadata

File hashes