Skip to main content

Uma biblioteca de AutoML Exploratório e 'Glass-Box'.

Project description

ScoutML: Enterprise AutoML & Audit Framework

Versão: 2.1.0
Foco: Governança, Auditabilidade e Robustez

O ScoutML não é apenas mais um framework de AutoML. Ele foi desenhado para ambientes regulados e críticos (Crédito, Fraude, Seguros, Saúde), onde explicar por que um modelo tomou uma decisão é tão importante quanto a sua performance.

Diferente de outras ferramentas do tipo caixa-preta, o ScoutML gera um Relatório de Auditoria Completo (Markdown + Gráficos) detalhando cada decisão estatística tomada, desde a limpeza de dados até a validação de estabilidade (PSI/KS).


Principais Diferenciais (v2.1)

1. Scout v2 (O Analista Estatístico)

Antes de treinar, o Scout realiza uma varredura profunda nos dados:

  • Detecção de Leakage:
    Usa um modelo "Sentinela" para identificar variáveis que contêm a resposta (vazamento de dados) e remove-as automaticamente.
  • Perfilamento Estatístico:
    Calcula Skewness (assimetria), Kurtosis e Outliers (via IQR) para guiar o pré-processamento.
  • Higiene de Dados:
    Remove identificadores (IDs), colunas constantes e multicolinearidade excessiva.

2. Forge v2 (O Engenheiro Inteligente)

Constrói pipelines de scikit-learn dinamicamente, baseados no diagnóstico do Scout:

  • Tratamento de Outliers:
    Aplica RobustScaler automaticamente se detectar mais de 5% de outliers.
  • Normalização:
    Aplica PowerTransformer (Yeo-Johnson) em distribuições enviesadas.
  • Encoding Inteligente:
    Alterna entre OneHotEncoder (baixa cardinalidade) e TargetEncoder (alta cardinalidade) para evitar explosão dimensional.

3. Auditoria de Risco & Estabilidade

Para problemas de classificação, o ScoutML gera métricas padrão de mercado financeiro:

  • KS (Kolmogorov-Smirnov):
    Mede a separação entre classes.
  • PSI (Population Stability Index):
    Garante que o modelo não está degradado entre Treino e Teste.
  • Matriz de Confusão:
    Visualização clara de Falsos Positivos e Falsos Negativos.

Instalação

O ScoutML depende de bibliotecas robustas de Data Science.

  1. Crie um arquivo requirements.txt (veja a seção abaixo).
  2. Instale as dependências:
pip install -r requirements.txt

Project details


Download files

Download the file for your platform. If you're not sure which to choose, learn more about installing packages.

Source Distributions

No source distribution files available for this release.See tutorial on generating distribution archives.

Built Distribution

If you're not sure about the file name format, learn more about wheel file names.

trailblazer_ml-0.1.11-py3-none-any.whl (32.8 kB view details)

Uploaded Python 3

File details

Details for the file trailblazer_ml-0.1.11-py3-none-any.whl.

File metadata

File hashes

Hashes for trailblazer_ml-0.1.11-py3-none-any.whl
Algorithm Hash digest
SHA256 48d0fe2ffac53b308d123827d6e9297053cf6dcff4618359fa1c1a6d6321b248
MD5 0a5b8a5d0f9820e0ac23b2cc875a1925
BLAKE2b-256 7424f30c930e8b6a93024c7e54989dc6aa06e537d8405603faf932971b6b2d55

See more details on using hashes here.

Supported by

AWS Cloud computing and Security Sponsor Datadog Monitoring Depot Continuous Integration Fastly CDN Google Download Analytics Pingdom Monitoring Sentry Error logging StatusPage Status page