Euclid Archival Data Analysis Package

These details have been verified by PyPI

Project links

GitHub Statistics

Maintainers

rudolffu

These details have not been verified by PyPI

Project links

Documentation

Project description

euclidkit

A comprehensive Python package for Euclid archival data analysis, designed for use within the ESA Datalabs environment.

Overview

euclidkit facilitates advanced data exploration and visualization for Euclid Q1/(I)DR1 archival releases, including:

Data Access: Query and crossmatch sources with the Euclid MER catalogue
Spectroscopic Analysis: Access, download, and combine NISP spectra of archival sources
Unified Workflow: Streamlined tools for researchers working with Euclid spectroscopic data

The package is designed for efficient archive querying and Euclid spectrum compilation workflows.

Installation

Requirements

Python 3.11+
Access to ESA Datalabs environment (for data volumes)
COSMOS credentials for Euclid archive access

Basic Installation

pip install euclidkit

Development Installation

git clone https://github.com/rudolffu/euclidkit.git
cd euclidkit
pip install -e .

Quick Start

Setup Credentials

Store credentials in a private file under your home directory and restrict permissions:

mkdir -p ~/.euclidkit
touch ~/.euclidkit/.cred.txt
chmod 600 ~/.euclidkit/.cred.txt

Edit ~/.euclidkit/.cred.txt manually with your preferred editor (do not put credentials in shell history).

Use two lines:

COSMOS username
COSMOS password

Configuration

Create and edit the user config file:

euclidkit init-config --output ~/.euclidkit/euclidkit_config.yaml --template basic

Then edit ~/.euclidkit/euclidkit_config.yaml and set the credential path.

Set the credential path in the config:

data:
  credentials_file: /home/<user>/.euclidkit/.cred.txt

Basic Usage

# Note: the Python import path is currently still `euclidkit`.
from euclidkit.core.data_access import EuclidArchive

# Initialize archive connection
archive = EuclidArchive(environment='PDR')
archive.login()

# Crossmatch your sources with Euclid MER catalogue
results = archive.crossmatch_sources(
    user_table="my_sources.csv",
    radius=1.0,  # arcseconds
    output_file="crossmatch_results.fits"
)

# Query for available spectra
spectra_table = archive.query_spectra_sources(
    crossmatch_table=results,
    output_file="spectra_sources.fits"
)

# Combine spectra into a single FITS file
combined_file = archive.combine_spectra_to_fits(
    spectra_table=spectra_table,
    output_file="my_combined_spectra.fits"
)

Command Line Interface

Crossmatching Sources

# Crossmatch user table with Euclid MER catalogue
euclidkit crossmatch \
    --input my_sources.csv \
    --output crossmatch_results.fits \
    --radius 1.0 \
    --verbose

# Submit the entire table as a single async job (no batching). The output file
# uses async TAP mode; for very large tables euclidkit splits into async chunks.
euclidkit crossmatch \
    --input my_sources.csv \
    --output crossmatch_results.fits \
    --full-async \
    --async-chunk-size 500000

# When using the IDR environment the command defaults to the WIDE field and
# writes results to wide_<filename>. Use --idr-field DEEP to query the deep stack:
euclidkit crossmatch \
    --input my_sources.csv \
    --output crossmatch_results.fits \
    --environment IDR \
    --idr-field DEEP

# Crossmatch an already-uploaded archive user table (no local upload needed)
euclidkit crossmatch \
    --user-table-name my_table \
    --output crossmatch_results.fits \
    --match-mode object-id \
    --environment IDR \
    --idr-field WIDE

--max-sources vs --async-chunk-size:

--max-sources: limits how many rows from the input table are processed in total.
--async-chunk-size: controls rows per async TAP job when --full-async is enabled.

Uploading Tables

# Upload a FITS table to your Euclid TAP workspace
euclidkit upload-table \
    --input my_sources.fits \
    --table-name my_workspace_table \
    --description "Sources awaiting deep crossmatch" \
    --overwrite

# Upload CSV data as-is (format inferred automatically)
euclidkit upload-table \
    --input trimmed_sources.csv \
    --table-name trimmed_sources

Querying Spectra

# Query spectra from crossmatch results
euclidkit query-spectra \
    --crossmatch crossmatch_results.fits \
    --output spectra_sources.fits \
    --environment IDR \
    --idr-field WIDE \
    --verbose

# Query spectra by object IDs and auto-combine
euclidkit query-spectra \
    --object-ids 123456,789012,345678 \
    --output spectra_sources.fits \
    --combine-output my_spectra.fits \
    --max-spectra 100 \
    --verbose

Building Cutana Input

# Build Cutana CSV from a source table with object_id or ra/dec columns
euclidkit query-cutana \
    --sources my_sources.fits \
    --output cutana_input.csv \
    --instrument VIS \
    --cutout-size arcsec \
    --cutout-size-value 15

# NISP example with explicit filters
euclidkit query-cutana \
    --sources my_sources.fits \
    --output cutana_input_nisp.csv \
    --instrument NISP \
    --nisp-filters NIR_Y,NIR_H \
    --environment IDR \
    --idr-field DEEP \
    --cutout-size arcsec \
    --cutout-size-value 15

Compiling Spectra

# Compile individual spectra into chunked FITS files
euclidkit compile-spectra \
    --spectra-table spectra_sources.fits \
    --output-dir ./output \
    --prefix compiled_spectra \
    --max-extensions 1000 \
    --verbose

# IDR DEEP canonical mode: choose arm(s) using XML LambdaRange
euclidkit compile-spectra \
    --spectra-table spectra_sources.fits \
    --output-dir ./output \
    --prefix compiled_deep \
    --environment IDR \
    --idr-field DEEP \
    -L BOTH

# Datalink mode: compile BOTH arms into separate _rgs / _bgs outputs
euclidkit compile-spectra \
    --spectra-table spectra_sources.fits \
    --output-dir ./output \
    --prefix compiled_dl \
    --use-datalink \
    --environment IDR \
    --schema sedm \
    -L BOTH

Note: for canonical compilation from local Datalabs FITS volumes, --workers 2 is often not faster due to shared-storage I/O contention. Prefer --workers 1 unless benchmarking on your setup shows a clear gain. Note: -L/--lambda-range is the unified arm selector. In datalink mode, RGS/BGS map to corresponding retrieval types, and BOTH runs two passes and writes separate _rgs and _bgs files. --retrieval-type is kept for backward compatibility.

Key Features

Data Archive Integration

Multiple Environments: Support for PDR, IDR, OTF, and REG archive environments
Efficient Queries: Batch processing with TAP table uploads for large datasets
Crossmatching: Position-based matching with configurable search radius

Spectroscopic Tools

Spectrum Access: Direct access to Euclid data volumes on ESA Datalabs
FITS Compilation: Combine individual spectra into multi-extension FITS files
Metadata Preservation: Maintain source IDs, coordinates, and provenance information

Analysis Pipeline

Quality Control: Spectrum validation and quality assessment

Data Environment

ESA Datalabs Integration

This package is optimized for the ESA Datalabs environment with direct access to:

Euclid Q1 Data: /data/euclid_q1/ (35 TB volume)

API Reference

Core Classes

`EuclidArchive`

Main interface to the Euclid science archive.

archive = EuclidArchive(environment='PDR')
archive.login(credentials_file='~/.euclidkit/.cred.txt')

# Crossmatch sources
results = archive.crossmatch_sources(
    user_table="sources.csv",
    radius=1.0,
    output_file="results.fits"
)

# Query spectra
spectra = archive.query_spectra_sources(
    crossmatch_table=results,
    output_file="spectra.fits"
)

# Get individual spectrum
spectrum_hdu = archive.get_individual_spectrum(
    datalabs_path="/data/euclid_q1/path",
    file_name="spectrum_file.fits", 
    hdu_index=42
)

# Combine spectra
combined = archive.combine_spectra_to_fits(
    spectra_table=spectra,
    output_file="combined.fits",
    max_spectra=1000
)

`SpectrumCompiler`

Advanced spectrum compilation with chunking support.

from euclidkit.core.spectra import SpectrumCompiler

compiler = SpectrumCompiler(max_extensions=1000)

# Compile into chunked files
output_files = compiler.compile_spectra(
    spectra_table=spectra_table,
    output_dir="./output",
    output_prefix="compiled_spectra"
)

# Create single FITS file
single_file = compiler.compile_single_fits(
    spectra_table=spectra_table,
    output_file="all_spectra.fits"
)

# Generate metadata table
metadata = compiler.create_metadata_table(
    spectra_table=spectra_table,
    output_files=output_files,
    output_dir="./output"
)

Workflow Examples

Complete Spectroscopic Analysis Pipeline

from euclidkit.core.data_access import EuclidArchive
from euclidkit.core.spectra import SpectrumCompiler
import pandas as pd

# 1. Initialize archive
archive = EuclidArchive(environment='PDR')
archive.login()

# 2. Load your QSO candidates
qso_candidates = pd.read_csv('qso_candidates.csv')

# 3. Crossmatch with Euclid MER catalogue
crossmatches = archive.crossmatch_sources(
    user_table=qso_candidates,
    radius=2.0,  # 2 arcsecond radius
    output_file='qso_crossmatches.fits'
)

# 4. Find available spectra
spectra_sources = archive.query_spectra_sources(
    crossmatch_table=crossmatches,
    output_file='qso_spectra_sources.fits'
)

print(f"Found {len(spectra_sources)} spectra for {len(crossmatches)} crossmatches")

# 5. Create combined FITS file (for small samples)
if len(spectra_sources) <= 1000:
    combined_spectra = archive.combine_spectra_to_fits(
        spectra_table=spectra_sources,
        output_file='qso_combined_spectra.fits'
    )
    print(f"Combined spectra saved to: {combined_spectra}")

# 6. Or use chunked compilation for large samples
else:
    compiler = SpectrumCompiler(max_extensions=2000)
    output_files = compiler.compile_spectra(
        spectra_table=spectra_sources,
        output_dir='./spectra_chunks',
        output_prefix='qso_spectra'
    )
    print(f"Created {len(output_files)} chunked files")

archive.logout()

Diagnostics

Check your installation and environment:

# Check all components
euclidkit diagnostics

# Check specific components
euclidkit diagnostics --check-deps --check-data

Archive Environments

Use --environment (CLI) or environment=... (Python API) to select the archive backend:

PDR: Public Data Release archive.
IDR: Internal Data Release archive (consortium access).
OTF: On-the-fly archive environment.
REG: Regression/testing archive environment.

For IDR, you can also select the field with --idr-field:

WIDE: Uses the IDR WIDE MER catalogue.
DEEP: Uses the IDR DEEP MER catalogue.

Examples:

# IDR WIDE (default IDR field)
euclidkit crossmatch \
  --input my_sources.fits \
  --output xmatch_wide.fits \
  --environment IDR \
  --idr-field WIDE

# IDR DEEP
euclidkit crossmatch \
  --input my_sources.fits \
  --output xmatch_deep.fits \
  --environment IDR \
  --idr-field DEEP

Contributing

Fork the repository
Create a feature branch (git checkout -b feature/amazing-feature)
Commit your changes (git commit -m 'Add amazing feature')
Push to the branch (git push origin feature/amazing-feature)
Open a Pull Request

Documentation

For detailed documentation and examples, visit:

Support

Issues: GitHub Issues
Discussions: GitHub Discussions
Email: fuympku@outlook.com

Author

Yuming Fu (@rudolffu)

Email: fuympku@outlook.com
GitHub: https://github.com/rudolffu/euclidkit

License

This project is licensed under the BSD 3-Clause License - see the LICENSE file for details.

Acknowledgments

ESA Euclid Mission and Euclid Consortium
ESA Datalabs and Euclid Data Space infrastructure team
Astropy and astroquery communities

Changelog

Latest Changes

Spectroscopic Pipeline: Complete pipeline for accessing and combining Euclid spectra
CLI Integration: Added --combine-output option to query-spectra command
TAP Upload: Improved query performance using TAP table uploads
FITS Compilation: Efficient multi-extension FITS file creation
Error Handling: Robust handling of long filenames and missing data

See CHANGELOG.md for detailed version history.

Project details

These details have been verified by PyPI

Project links

GitHub Statistics

Maintainers

rudolffu

These details have not been verified by PyPI

Project links

Documentation

Release history Release notifications | RSS feed

This version

0.2.1

Mar 17, 2026

0.2.0

Mar 2, 2026

0.2.0rc4 pre-release

Feb 23, 2026

0.2.0rc3 pre-release

Feb 22, 2026

0.2.0rc2 pre-release

Feb 21, 2026

0.2.0rc1 pre-release

Feb 21, 2026

Download files

Download the file for your platform. If you're not sure which to choose, learn more about installing packages.

Source Distribution

euclidkit-0.2.1.tar.gz (2.1 MB view details)

Uploaded Mar 17, 2026 Source

Built Distribution

If you're not sure about the file name format, learn more about wheel file names.

The dropdown lists show the available interpreters, ABIs, and platforms. Enable javascript to be able to filter the list of wheel files.

euclidkit-0.2.1-py3-none-any.whl (2.0 MB view details)

Uploaded Mar 17, 2026 Python 3

File details

Details for the file euclidkit-0.2.1.tar.gz.

File metadata

Download URL: euclidkit-0.2.1.tar.gz
Upload date: Mar 17, 2026
Size: 2.1 MB
Tags: Source
Uploaded using Trusted Publishing? Yes
Uploaded via: twine/6.1.0 CPython/3.13.7

File hashes

Hashes for euclidkit-0.2.1.tar.gz
Algorithm	Hash digest
SHA256	`88bdb6469e59958a9674e3b83990162dadf24f127f12b5feefebb475de8b1ceb`
MD5	`3333d1cf4d69acc0db8d423ac4e03241`
BLAKE2b-256	`53ba3af5e7df93c7432ca54d7cbbd2e8a8a260b501eb9052c3455d185f9ad049`

See more details on using hashes here.

Provenance

The following attestation bundles were made for euclidkit-0.2.1.tar.gz:

Publisher: python-publish.yml on rudolffu/euclidkit

Attestations: Values shown here reflect the state when the release was signed and may no longer be current.

Statement:
- Statement type: https://in-toto.io/Statement/v1
- Predicate type: https://docs.pypi.org/attestations/publish/v1
- Subject name: euclidkit-0.2.1.tar.gz
- Subject digest: 88bdb6469e59958a9674e3b83990162dadf24f127f12b5feefebb475de8b1ceb
- Sigstore transparency entry: 1114861150
- Sigstore integration time: Mar 17, 2026
Source repository:
- Permalink: rudolffu/euclidkit@934638ab446fbc86b8e28b4c508813584ee64843
- Branch / Tag: refs/tags/v0.2.1
- Owner: https://github.com/rudolffu
- Access: public
Publication detail:
- Token Issuer: https://token.actions.githubusercontent.com
- Runner Environment: github-hosted
- Publication workflow: python-publish.yml@934638ab446fbc86b8e28b4c508813584ee64843
- Trigger Event: push

File details

Details for the file euclidkit-0.2.1-py3-none-any.whl.

File metadata

Download URL: euclidkit-0.2.1-py3-none-any.whl
Upload date: Mar 17, 2026
Size: 2.0 MB
Tags: Python 3
Uploaded using Trusted Publishing? Yes
Uploaded via: twine/6.1.0 CPython/3.13.7

File hashes

Hashes for euclidkit-0.2.1-py3-none-any.whl
Algorithm	Hash digest
SHA256	`68c1bc7134d2026e441c78658bc0e6d30eaaa0833e51c3c7eeaf30ff7467fbc8`
MD5	`ad01f224a82243f728d73d68bec78247`
BLAKE2b-256	`3d586bb56e60772e33bc6cec5606424bcdccf0592594221f3e65c12373ee0290`

See more details on using hashes here.

Provenance

The following attestation bundles were made for euclidkit-0.2.1-py3-none-any.whl:

Publisher: python-publish.yml on rudolffu/euclidkit

Attestations: Values shown here reflect the state when the release was signed and may no longer be current.

Statement:
- Statement type: https://in-toto.io/Statement/v1
- Predicate type: https://docs.pypi.org/attestations/publish/v1
- Subject name: euclidkit-0.2.1-py3-none-any.whl
- Subject digest: 68c1bc7134d2026e441c78658bc0e6d30eaaa0833e51c3c7eeaf30ff7467fbc8
- Sigstore transparency entry: 1114861156
- Sigstore integration time: Mar 17, 2026
Source repository:
- Permalink: rudolffu/euclidkit@934638ab446fbc86b8e28b4c508813584ee64843
- Branch / Tag: refs/tags/v0.2.1
- Owner: https://github.com/rudolffu
- Access: public
Publication detail:
- Token Issuer: https://token.actions.githubusercontent.com
- Runner Environment: github-hosted
- Publication workflow: python-publish.yml@934638ab446fbc86b8e28b4c508813584ee64843
- Trigger Event: push

euclidkit 0.2.1

Navigation

Verified details

Project links

GitHub Statistics

Maintainers

Unverified details

Project links

Meta

Classifiers

Project description

euclidkit

Overview

Installation

Requirements

Basic Installation

Development Installation

Quick Start

Setup Credentials

Configuration

Basic Usage

Command Line Interface

Crossmatching Sources

Uploading Tables

Querying Spectra

Building Cutana Input

Compiling Spectra

Key Features

Data Archive Integration

Spectroscopic Tools

Analysis Pipeline

Data Environment

ESA Datalabs Integration

API Reference

Core Classes

EuclidArchive

SpectrumCompiler

Workflow Examples

Complete Spectroscopic Analysis Pipeline

Diagnostics

Archive Environments

Contributing

Documentation

Support

Author

License

Acknowledgments

Changelog

Latest Changes

Project details

Verified details

Project links

GitHub Statistics

Maintainers

Unverified details

Project links

Meta

Classifiers

Release history Release notifications | RSS feed

Download files

Source Distribution

Built Distribution

File details

File metadata

File hashes

Provenance

File details

File metadata

File hashes

Provenance

`EuclidArchive`

`SpectrumCompiler`