Reportes de evaluación (clasificación/regresión/forecast) a Markdown con gráficos

These details have been verified by PyPI

Project links

GitHub Statistics

Maintainers

Rockevans

These details have not been verified by PyPI

Project description

README English

evalcards

evalcards es una librería para Python que genera reportes de evaluación para modelos supervisados en Markdown, con métricas y gráficos listos para usar en informes. Soporta:

Clasificación: binaria y multiclase (OvR) con métricas como accuracy, balanced_accuracy, mcc, log_loss (si hay probabilidades), roc_auc/pr_auc, además de curvas ROC/PR por clase.
Regresión: MAE, MSE, RMSE, R², MedAE, MAPE, RMSLE.
Forecasting (series de tiempo): MAE, MSE, RMSE, MedAE, MAPE, RMSLE, sMAPE (%) y MASE.
Clasificación multi-label: matriz de confusión y curvas ROC/PR por etiqueta si se pasan probabilidades.
Export JSON métricas y rutas de imágenes para integración en pipelines (nuevo en v0.2.11).

Instalación

pip install evalcards

Uso rápido (Python)

from evalcards import make_report

# y_true: etiquetas/valores reales
# y_pred: etiquetas/valores predichos
# y_proba (opcional):
#   - binaria: vector 1D con prob. de la clase positiva
#   - multiclase: matriz (n_samples, n_classes) con prob. por clase
#   - multi-label: matriz (n_samples, n_labels) con prob. por etiqueta

path = make_report(
    y_true, y_pred,
    y_proba=proba,                 # opcional
    path="reporte.md",             # nombre del archivo Markdown
    title="Mi modelo"              # título del reporte
)
print(path)  # ruta del reporte generado

Qué evalúa

Clasificación (binaria/multiclase/multi-label) Métricas: accuracy, precision/recall/F1 (macro/weighted), balanced_accuracy, mcc, log_loss (si hay probabilidades). AUC / AUPRC: roc_auc y pr_auc (binaria), roc_auc_ovr_macro y pr_auc_macro (multiclase), roc_auc_macro (multi-label). Gráficos: matriz de confusión, ROC y PR (por clase en multiclase, por etiqueta en multi-label).
Regresión Métricas: MAE, MSE, RMSE, R², MedAE, MAPE, RMSLE. Gráficos: Ajuste (y vs ŷ) y Residuales.
Forecasting Métricas: MAE, MSE, RMSE, MedAE, MAPE, RMSLE, sMAPE (%), MASE. Parámetros extra: season (p.ej. 12) e insample (serie de entrenamiento para MASE). Gráficos: Ajuste y Residuales.

Ejemplos

1) Clasificación binaria (scikit-learn)

from sklearn.datasets import make_classification
from sklearn.linear_model import LogisticRegression
from sklearn.model_selection import train_test_split
from evalcards import make_report

X, y = make_classification(n_samples=600, n_features=10, random_state=0)
X_tr, X_te, y_tr, y_te = train_test_split(X, y, test_size=0.3, random_state=0)

clf = LogisticRegression(max_iter=1000).fit(X_tr, y_tr)
y_pred = clf.predict(X_te)
proba = clf.predict_proba(X_te)[:, 1]

make_report(y_te, y_pred, y_proba=proba, path="rep_bin.md", title="Clasificación binaria")

2) Multiclase (OvR)

from sklearn.datasets import load_iris
from sklearn.ensemble import RandomForestClassifier
@@ -107,51 +107,51 @@ X, y = make_multilabel_classification(n_samples=300, n_features=12, n_classes=4,
clf = MultiOutputClassifier(LogisticRegression(max_iter=1000)).fit(X, y)
y_pred = clf.predict(X)
# Probabilidad por etiqueta (matriz n_samples x n_labels)
y_proba = np.stack([m.predict_proba(X)[:,1] for m in clf.estimators_], axis=1)

make_report(y, y_pred, y_proba=y_proba, path="rep_multilabel.md", title="Multi-label Example", lang="en",
            labels=[f"Tag_{i}" for i in range(y.shape[1])])

4) Regresión

from sklearn.datasets import make_regression
from sklearn.ensemble import RandomForestRegressor
from sklearn.model_selection import train_test_split
from evalcards import make_report

X, y = make_regression(n_samples=600, n_features=8, noise=10, random_state=0)
X_tr, X_te, y_tr, y_te = train_test_split(X, y, test_size=0.3, random_state=0)

reg = RandomForestRegressor(random_state=0).fit(X_tr, y_tr)
y_pred = reg.predict(X_te)

make_report(y_te, y_pred, path="rep_reg.md", title="Regresión")

5) Forecasting (sMAPE/MASE + métricas extra)

import numpy as np
from evalcards import make_report

rng = np.random.default_rng(0)
t = np.arange(360)
y = 10 + 0.05*t + 5*np.sin(2*np.pi*t/12) + rng.normal(0,1,360)

y_train, y_test = y[:300], y[300:]
y_hat = y_test + rng.normal(0, 1.2, y_test.size)  # predicción de ejemplo

make_report(
    y_test, y_hat,
    task="forecast", season=12, insample=y_train,
    path="rep_forecast.md", title="Forecast"
)

6) Comparación Multi-Modelo (Nuevo en v0.3.0)

from evalcards import make_report
# Puedes pasar un diccionario con los nombres de tus modelos y sus predicciones
y_preds = {"Random Forest": y_pred_rf, "XGBoost": y_pred_xgb}
y_probas = {"Random Forest": proba_rf, "XGBoost": proba_xgb}

# Generará curvas conjuntas y tablas comparativas en el mismo reporte HTML/Markdown
make_report(y_te, y_preds, y_proba=y_probas, path="rep_multi.html", fmt="html", title="Comparativa")

7) Análisis de Equidad (Fairness & Bias)

# Mide el rendimiento por subgrupo demográfico, de cliente, etc.
grupos = ["Joven", "Adulto", "Adulto", "Joven", ...] 
make_report(y_te, y_pred, sensitive_features=grupos, title="Reporte de Equidad")

8) Tareas de Ranking (NDCG)

# Para sistemas de búsqueda o recomendación
make_report(y_te, y_pred, task="ranking", query_id=user_ids, title="Resultados de Búsqueda")

Configuración y Formatos

.evalcards.toml: Si creas un archivo .evalcards.toml en tu directorio, evalcards usará sus parámetros por defecto (útil para la CLI).
```
[evalcards]
outdir = "reportes_diarios"
lang = "es"
format = "html"
```
Formatos Rápidos (CLI): Puedes usar archivos .parquet y .feather directamente en los argumentos --y_true, --y_pred y --proba para cargar millones de registros rápidamente.

Salidas y PATH

Un archivo Markdown con las métricas y referencias a imágenes generadas.
Imágenes PNG (según el tipo de tarea):
- Clasificación binaria:
  - confusion.png (matriz de confusión global)
  - roc.png (curva ROC)
  - pr.png (curva Precision-Recall)
- Clasificación multiclase (OvR):
  - confusion.png (matriz de confusión global)
  - roc_class_<clase>.png (curva ROC para cada clase, One-vs-Rest)
  - pr_class_<clase>.png (curva PR para cada clase)
- Clasificación multi-label:
  - confusion_<etiqueta>.png (matriz de confusión para cada etiqueta)
  - roc_label_<etiqueta>.png (curva ROC para cada etiqueta, si se pasan probabilidades)
  - pr_label_<etiqueta>.png (curva PR para cada etiqueta, si se pasan probabilidades)
- Regresión / Forecasting:
  - fit.png (dispersión y vs ŷ, ajuste del modelo)
  - resid.png (gráfico de residuales)
Ubicación de archivos:
- Por defecto, los archivos se guardan en la carpeta ./evalcards_reports/ si path no incluye ruta.
- Puedes cambiar la carpeta con el argumento out_dir o usando una ruta en path.
Export JSON (opcional):
Si usas el parámetro export_json, también se genera un archivo .json con las métricas y los nombres/rutas de los PNG generados.
Ejemplo de nombres multi-label:
Si usas labels=["A","B","C"], los archivos serán:
- confusion_A.png, roc_label_A.png, pr_label_A.png
- confusion_B.png, roc_label_B.png, pr_label_B.png
- etc.
JSON (opcional): contiene metrics, charts y markdown.

Entradas esperadas (formas comunes)

Clasificación
- y_true: enteros 0..K-1 (o etiquetas string).
- y_pred: del mismo tipo/espacio de clases que y_true.
- y_proba (opcional):
  - Binaria: vector 1D con prob. de la clase positiva.
  - Multiclase: matriz (n_samples, n_classes) con una columna por clase (mismo orden que tu modelo).
  - Multi-label: matriz (n_samples, n_labels) con una columna por etiqueta (proba de pertenecer).
Regresión / Forecast
- y_true, y_pred: arrays 1D de floats.
- insample (forecast): serie de entrenamiento para MASE; season según la estacionalidad (ej. 12 mensual/anual).

Compatibilidad de modelos

Funciona con cualquier modelo que produzca predict (y opcionalmente predict_proba):

scikit-learn, XGBoost/LightGBM/CatBoost, statsmodels, Prophet/NeuralProphet, Keras/PyTorch.
Multiclase: y_proba como matriz (una columna por clase) y labels para nombres.

Roadmap

v0.3 — Salida y métricas clave

Reporte HTML autocontenido (format="md|html|both")
Export JSON** de métricas/paths (--export-json)
Métricas nuevas (clasificación): AUPRC, Balanced Accuracy, MCC, Log Loss, Brier Score
Métricas nuevas (regresión): MAPE, MedAE, RMSLE

v0.4 — Multiclase y umbrales

Análisis de umbral (curvas precisión–recobrado–F1 vs umbral)
ROC/PR micro & macro (multiclase) + roc_auc_macro, average_precision_macro
Matriz de confusión normalizada (global y por clase)

v0.5 — Probabilidades y comparación

Calibración: Brier score + curva de confiabilidad (Reliability Curve)
Comparación multi-modelo en un único reporte (pasa dict a y_pred/y_proba)
Gráficos interactivos HTML con Plotly
Análisis de Sesgo (Fairness & Bias) con sensitive_features
Insights automáticos para destacar hallazgos clave
Tareas de Ranking (NDCG) con query_id

v0.6 — DX, formatos y docs

Nuevos formatos de entrada: Parquet/Feather desde CLI
Config de proyecto (.evalcards.toml) para defaults (outdir, format, lang)
Plantillas/temas Jinja2 (branding base ya integrado en Markdown y HTML)
Docs con MkDocs + GitHub Pages (guía, API, ejemplos ejecutables)

Ideas

Soporte multi-label (completado)
Métricas de ranking (MAP/NDCG)
Curvas de calibración por bins configurables
QQ-plot e histograma de residuales (regresión)
i18n ES/EN (completado)

Documentación

Guía | Referencia de API | Changelog

Licencia

MIT

Autor

Ricardo Urdaneta

Linkedin

Project details

These details have been verified by PyPI

Project links

GitHub Statistics

Maintainers

Rockevans

These details have not been verified by PyPI

Release history Release notifications | RSS feed

1.0.1

Jun 2, 2026

This version

1.0.0

Jun 2, 2026

0.2.11

Sep 20, 2025

0.2.10

Sep 10, 2025

0.2.9

Sep 4, 2025

0.2.8

Sep 2, 2025

0.2.7

Aug 30, 2025

0.2.6

Aug 30, 2025

0.2.0

Aug 30, 2025

0.1.0

Aug 30, 2025

Download files

Download the file for your platform. If you're not sure which to choose, learn more about installing packages.

Source Distribution

evalcards-1.0.0.tar.gz (30.6 kB view details)

Uploaded Jun 2, 2026 Source

Built Distribution

If you're not sure about the file name format, learn more about wheel file names.

The dropdown lists show the available interpreters, ABIs, and platforms. Enable javascript to be able to filter the list of wheel files.

evalcards-1.0.0-py3-none-any.whl (22.3 kB view details)

Uploaded Jun 2, 2026 Python 3

File details

Details for the file evalcards-1.0.0.tar.gz.

File metadata

Download URL: evalcards-1.0.0.tar.gz
Upload date: Jun 2, 2026
Size: 30.6 kB
Tags: Source
Uploaded using Trusted Publishing? Yes
Uploaded via: twine/6.1.0 CPython/3.13.12

File hashes

Hashes for evalcards-1.0.0.tar.gz
Algorithm	Hash digest
SHA256	`79d2728ec302f5d028f4a951731776a8750ae378dd5533f7eac76255e8449ace`
MD5	`0ef8c94e1cf07268a1b3f64f91e9d3e6`
BLAKE2b-256	`64991744ea7ad030de5dffafbf800b9f5e244b5c80828f7f1250856dd42f14e9`

See more details on using hashes here.

Provenance

The following attestation bundles were made for evalcards-1.0.0.tar.gz:

Publisher: release.yml on Ricardouchub/evalcards

Attestations: Values shown here reflect the state when the release was signed and may no longer be current.

Statement:
- Statement type: https://in-toto.io/Statement/v1
- Predicate type: https://docs.pypi.org/attestations/publish/v1
- Subject name: evalcards-1.0.0.tar.gz
- Subject digest: 79d2728ec302f5d028f4a951731776a8750ae378dd5533f7eac76255e8449ace
- Sigstore transparency entry: 1704007675
- Sigstore integration time: Jun 2, 2026
Source repository:
- Permalink: Ricardouchub/evalcards@0fe1b1d0d86243018f8b76917982cbc78f7dfdfe
- Branch / Tag: refs/tags/v1.0.0
- Owner: https://github.com/Ricardouchub
- Access: public
Publication detail:
- Token Issuer: https://token.actions.githubusercontent.com
- Runner Environment: github-hosted
- Publication workflow: release.yml@0fe1b1d0d86243018f8b76917982cbc78f7dfdfe
- Trigger Event: push

File details

Details for the file evalcards-1.0.0-py3-none-any.whl.

File metadata

Download URL: evalcards-1.0.0-py3-none-any.whl
Upload date: Jun 2, 2026
Size: 22.3 kB
Tags: Python 3
Uploaded using Trusted Publishing? Yes
Uploaded via: twine/6.1.0 CPython/3.13.12

File hashes

Hashes for evalcards-1.0.0-py3-none-any.whl
Algorithm	Hash digest
SHA256	`655c4f9777507db7cc04ab12f78025bcc4b7a84baa5dcb38211f2f910af25f5e`
MD5	`998c8e627fbaaf067346664ed4855d64`
BLAKE2b-256	`29c32c6abddaa6c94ba9a8ddf9a955ed9fcbccc95a9cba4b9d3d3825826691bd`

See more details on using hashes here.

Provenance

The following attestation bundles were made for evalcards-1.0.0-py3-none-any.whl:

Publisher: release.yml on Ricardouchub/evalcards

Attestations: Values shown here reflect the state when the release was signed and may no longer be current.

Statement:
- Statement type: https://in-toto.io/Statement/v1
- Predicate type: https://docs.pypi.org/attestations/publish/v1
- Subject name: evalcards-1.0.0-py3-none-any.whl
- Subject digest: 655c4f9777507db7cc04ab12f78025bcc4b7a84baa5dcb38211f2f910af25f5e
- Sigstore transparency entry: 1704007699
- Sigstore integration time: Jun 2, 2026
Source repository:
- Permalink: Ricardouchub/evalcards@0fe1b1d0d86243018f8b76917982cbc78f7dfdfe
- Branch / Tag: refs/tags/v1.0.0
- Owner: https://github.com/Ricardouchub
- Access: public
Publication detail:
- Token Issuer: https://token.actions.githubusercontent.com
- Runner Environment: github-hosted
- Publication workflow: release.yml@0fe1b1d0d86243018f8b76917982cbc78f7dfdfe
- Trigger Event: push

evalcards 1.0.0

Navigation

Verified details

Project links

GitHub Statistics

Maintainers

Unverified details

Meta

Classifiers

Project description

evalcards

Instalación

Uso rápido (Python)

Qué evalúa

Ejemplos

Configuración y Formatos

Salidas y PATH

Entradas esperadas (formas comunes)

Compatibilidad de modelos

Roadmap

v0.3 — Salida y métricas clave

v0.4 — Multiclase y umbrales

v0.5 — Probabilidades y comparación

v0.6 — DX, formatos y docs

Ideas

Documentación

Licencia

Autor

Project details

Verified details

Project links

GitHub Statistics

Maintainers

Unverified details

Meta

Classifiers

Release history Release notifications | RSS feed

Download files

Source Distribution

Built Distribution

File details

File metadata

File hashes

Provenance

File details

File metadata

File hashes

Provenance