Reportes de evaluación (clasificación/regresión/forecast) a Markdown con gráficos

These details have been verified by PyPI

Project links

GitHub Statistics

Maintainers

These details have not been verified by PyPI

Project description

evalcards

evalcards es una librería para Python que genera reportes de evaluación para modelos supervisados en Markdown, con métricas y gráficos listos para usar en informes. Soporta:

Clasificación: binaria y multiclase (OvR) con curvas ROC/PR por clase.
Regresión.
Forecasting (series de tiempo): sMAPE (%) y MASE.

Instalación

pip install evalcards

Uso rápido (Python)

from evalcards import make_report

# y_true: etiquetas/valores reales
# y_pred: etiquetas/valores predichos
# y_proba (opcional):
#   - binaria: vector 1D con prob. de la clase positiva
#   - multiclase: matriz (n_samples, n_classes) con prob. por clase

path = make_report(
    y_true, y_pred,
    y_proba=proba,                 # opcional
    path="reporte.md",             # nombre del archivo Markdown
    title="Mi modelo"              # título del reporte
)
print(path)  # ruta del reporte generado

Qué evalúa

Clasificación (binaria/multiclase)
Métricas: accuracy, precision/recall/F1 (macro/weighted),
AUC: roc_auc (binaria) y roc_auc_ovr_macro (multiclase).
Gráficos: matriz de confusión, ROC y PR (por clase en multiclase).
Regresión
Métricas: MAE, MSE, RMSE, R².
Gráficos: Ajuste (y vs ŷ) y Residuales.
Forecasting
Métricas: MAE, MSE, RMSE, sMAPE (%), MASE.
Parámetros extra: season (p.ej. 12) e insample (serie de entrenamiento para MASE).
Gráficos: Ajuste y Residuales.

Ejemplos

1) Clasificación binaria (scikit-learn)

from sklearn.datasets import make_classification
from sklearn.linear_model import LogisticRegression
from sklearn.model_selection import train_test_split
from evalcards import make_report

X, y = make_classification(n_samples=600, n_features=10, random_state=0)
X_tr, X_te, y_tr, y_te = train_test_split(X, y, test_size=0.3, random_state=0)

clf = LogisticRegression(max_iter=1000).fit(X_tr, y_tr)
y_pred = clf.predict(X_te)
proba = clf.predict_proba(X_te)[:, 1]

make_report(y_te, y_pred, y_proba=proba, path="rep_bin.md", title="Clasificación binaria")

2) Multiclase (OvR)

from sklearn.datasets import load_iris
from sklearn.ensemble import RandomForestClassifier
from sklearn.model_selection import train_test_split
from evalcards import make_report

X, y = load_iris(return_X_y=True)
X_tr, X_te, y_tr, y_te = train_test_split(X, y, test_size=0.3, random_state=0)

clf = RandomForestClassifier(random_state=0).fit(X_tr, y_tr)
y_pred = clf.predict(X_te)
proba = clf.predict_proba(X_te)  # (n_samples, n_classes)

make_report(
    y_te, y_pred, y_proba=proba,
    labels=[f"Clase_{c}" for c in clf.classes_],   # opcional (nombres por clase)
    path="rep_multi.md", title="Multiclase OvR"
)

3) Regresión

from sklearn.datasets import make_regression
from sklearn.ensemble import RandomForestRegressor
from sklearn.model_selection import train_test_split
from evalcards import make_report

X, y = make_regression(n_samples=600, n_features=8, noise=10, random_state=0)
X_tr, X_te, y_tr, y_te = train_test_split(X, y, test_size=0.3, random_state=0)

reg = RandomForestRegressor(random_state=0).fit(X_tr, y_tr)
y_pred = reg.predict(X_te)

make_report(y_te, y_pred, path="rep_reg.md", title="Regresión")

4) Forecasting (sMAPE/MASE)

import numpy as np
from evalcards import make_report

rng = np.random.default_rng(0)
t = np.arange(360)
y = 10 + 0.05*t + 5*np.sin(2*np.pi*t/12) + rng.normal(0,1,360)

y_train, y_test = y[:300], y[300:]
y_hat = y_test + rng.normal(0, 1.2, y_test.size)  # predicción de ejemplo

make_report(
    y_test, y_hat,
    task="forecast", season=12, insample=y_train,
    path="rep_forecast.md", title="Forecast"
)

Ejemplo multi-label

from sklearn.datasets import make_multilabel_classification
from sklearn.linear_model import LogisticRegression
from sklearn.multioutput import MultiOutputClassifier
from evalcards import make_report

X, y = make_multilabel_classification(n_samples=300, n_features=12, n_classes=4, n_labels=2, random_state=42)
clf = MultiOutputClassifier(LogisticRegression(max_iter=1000)).fit(X, y)
y_pred = clf.predict(X)
make_report(y, y_pred, path="rep_multilabel.md", title="Multi-label Example", lang="en",
            labels=[f"Tag_{i}" for i in range(y.shape[1])])

El reporte incluirá métricas multi-label (subset accuracy, hamming loss, F1/precision/recall macro y micro) y una matriz de confusión por etiqueta.

Salidas y PATH

Un archivo Markdown con las métricas y referencias a imágenes.
Imágenes PNG (confusión, ROC/PR, ajuste, residuales).
Por defecto, si path no incluye carpeta, todo se guarda en ./evalcards_reports/.
Puedes cambiar la carpeta con el argumento out_dir o usando una ruta en path.

Soporte de idiomas 'es/en'

Genera reportes en español o inglés usando el parámetro lang: "es" (español, default), "en" (inglés).

make_report(y_true, y_pred, path="rep.md", lang="en", title="My Model Report")

Entradas esperadas (formas comunes)

Clasificación
- y_true: enteros 0..K-1 (o etiquetas string).
- y_pred: del mismo tipo/espacio de clases que y_true.
- y_proba (opcional):
  - Binaria: vector 1D con prob. de la clase positiva.
  - Multiclase: matriz (n_samples, n_classes) con una columna por clase (mismo orden que tu modelo).
Regresión / Forecast
- y_true, y_pred: arrays 1D de floats.
- insample (forecast): serie de entrenamiento para MASE; season según la estacionalidad (ej. 12 mensual/anual).

Compatibilidad de modelos

Funciona con cualquier modelo que produzca predict (y opcionalmente predict_proba):

scikit-learn, XGBoost/LightGBM/CatBoost, statsmodels, Prophet/NeuralProphet, Keras/PyTorch (si pasas tus arrays).
Multiclase: pasa y_proba como matriz (una columna por clase) y, si quieres, labels para nombres.

Roadmap

v0.3 — Salida y métricas clave

Reporte HTML autocontenido (format="md|html")
Export JSON** de métricas/paths (--export-json)
Métricas nuevas (clasificación): AUPRC, Balanced Accuracy, MCC, Log Loss
Métricas nuevas (regresión): MAPE, MedAE, RMSLE

v0.4 — Multiclase y umbrales

ROC/PR micro & macro (multiclase) + roc_auc_macro, average_precision_macro
Análisis de umbral (curvas precisión–recobrado–F1 vs umbral + mejor umbral por métrica)
Matriz de confusión normalizada (global y por clase)

v0.5 — Probabilidades y comparación

Calibración: Brier score + curva de confiabilidad
Comparación multi-modelo en un único reporte (tabla “mejor por métrica”)
Curvas gain/lift (opcional)

v0.6 — DX, formatos y docs

Nuevos formatos de entrada: Parquet/Feather/NPZ
Config de proyecto (.evalcards.toml) para defaults (outdir, títulos, idioma)
Docs con MkDocs + GitHub Pages (guía, API, ejemplos ejecutables)
Plantillas/temas Jinja2 (branding)

Ideas

Soporte multi-label
Métricas de ranking (MAP/NDCG)
Curvas de calibración por bins configurables
QQ-plot e histograma de residuales (regresión)
i18n ES/EN (mensajes y etiquetas)

Documentación

Guía | Referencia de API | Changelog

Licencia

MIT

Autor

Ricardo Urdaneta

Linkedin

Project details

These details have been verified by PyPI

Project links

GitHub Statistics

Maintainers

Rockevans

These details have not been verified by PyPI

Release history Release notifications | RSS feed

0.2.11

Sep 20, 2025

0.2.10

Sep 10, 2025

This version

0.2.9

Sep 4, 2025

0.2.8

Sep 2, 2025

0.2.7

Aug 30, 2025

0.2.6

Aug 30, 2025

0.2.0

Aug 30, 2025

0.1.0

Aug 30, 2025

Download files

Download the file for your platform. If you're not sure which to choose, learn more about installing packages.

Source Distribution

evalcards-0.2.9.tar.gz (14.7 kB view details)

Uploaded Sep 4, 2025 Source

Built Distribution

If you're not sure about the file name format, learn more about wheel file names.

The dropdown lists show the available interpreters, ABIs, and platforms. Enable javascript to be able to filter the list of wheel files.

evalcards-0.2.9-py3-none-any.whl (10.1 kB view details)

Uploaded Sep 4, 2025 Python 3

File details

Details for the file evalcards-0.2.9.tar.gz.

File metadata

Download URL: evalcards-0.2.9.tar.gz
Upload date: Sep 4, 2025
Size: 14.7 kB
Tags: Source
Uploaded using Trusted Publishing? Yes
Uploaded via: twine/6.1.0 CPython/3.13.7

File hashes

Hashes for evalcards-0.2.9.tar.gz
Algorithm	Hash digest
SHA256	`a67e3031cf2ab442513c7d5417bce881477819968ff02b3c905b8eda957130eb`
MD5	`a459193367949f3365e241780a5c264c`
BLAKE2b-256	`fdd20d308266b60c86ed956b26eef10dc4b0a7a0ff526127db9b589b0ce1b717`

See more details on using hashes here.

Provenance

The following attestation bundles were made for evalcards-0.2.9.tar.gz:

Publisher: release.yml on Ricardouchub/evalcards

Attestations: Values shown here reflect the state when the release was signed and may no longer be current.

Statement:
- Statement type: https://in-toto.io/Statement/v1
- Predicate type: https://docs.pypi.org/attestations/publish/v1
- Subject name: evalcards-0.2.9.tar.gz
- Subject digest: a67e3031cf2ab442513c7d5417bce881477819968ff02b3c905b8eda957130eb
- Sigstore transparency entry: 470426544
- Sigstore integration time: Sep 4, 2025
Source repository:
- Permalink: Ricardouchub/evalcards@8f216eb11152740c0bbbc27d43bcd8297158dae9
- Branch / Tag: refs/tags/v0.2.9
- Owner: https://github.com/Ricardouchub
- Access: public
Publication detail:
- Token Issuer: https://token.actions.githubusercontent.com
- Runner Environment: github-hosted
- Publication workflow: release.yml@8f216eb11152740c0bbbc27d43bcd8297158dae9
- Trigger Event: push

File details

Details for the file evalcards-0.2.9-py3-none-any.whl.

File metadata

Download URL: evalcards-0.2.9-py3-none-any.whl
Upload date: Sep 4, 2025
Size: 10.1 kB
Tags: Python 3
Uploaded using Trusted Publishing? Yes
Uploaded via: twine/6.1.0 CPython/3.13.7

File hashes

Hashes for evalcards-0.2.9-py3-none-any.whl
Algorithm	Hash digest
SHA256	`300df583b3753c9bbd7e7d78de57d0579b5356f6fc836378d535f925ceba1b74`
MD5	`c743c553cde12d6fe0160e889f9b55df`
BLAKE2b-256	`ad4b83a777308db8a6fff91fdcb00a3c04b33dd6b6e5fe3090a582569d9471a8`

See more details on using hashes here.

Provenance

The following attestation bundles were made for evalcards-0.2.9-py3-none-any.whl:

Publisher: release.yml on Ricardouchub/evalcards

Attestations: Values shown here reflect the state when the release was signed and may no longer be current.

Statement:
- Statement type: https://in-toto.io/Statement/v1
- Predicate type: https://docs.pypi.org/attestations/publish/v1
- Subject name: evalcards-0.2.9-py3-none-any.whl
- Subject digest: 300df583b3753c9bbd7e7d78de57d0579b5356f6fc836378d535f925ceba1b74
- Sigstore transparency entry: 470426560
- Sigstore integration time: Sep 4, 2025
Source repository:
- Permalink: Ricardouchub/evalcards@8f216eb11152740c0bbbc27d43bcd8297158dae9
- Branch / Tag: refs/tags/v0.2.9
- Owner: https://github.com/Ricardouchub
- Access: public
Publication detail:
- Token Issuer: https://token.actions.githubusercontent.com
- Runner Environment: github-hosted
- Publication workflow: release.yml@8f216eb11152740c0bbbc27d43bcd8297158dae9
- Trigger Event: push

evalcards 0.2.9

Navigation

Verified details

Project links

GitHub Statistics

Maintainers

Unverified details

Meta

Classifiers

Project description

evalcards

Instalación

Uso rápido (Python)

Qué evalúa

Ejemplos

Ejemplo multi-label

Salidas y PATH

Soporte de idiomas 'es/en'

Entradas esperadas (formas comunes)

Compatibilidad de modelos

Roadmap

v0.3 — Salida y métricas clave

v0.4 — Multiclase y umbrales

v0.5 — Probabilidades y comparación

v0.6 — DX, formatos y docs

Ideas

Documentación

Licencia

Autor

Project details

Verified details

Project links

GitHub Statistics

Maintainers

Unverified details

Meta

Classifiers

Release history Release notifications | RSS feed

Download files

Source Distribution

Built Distribution

File details

File metadata

File hashes

Provenance

File details

File metadata

File hashes

Provenance