A Python package for fast exploration of machine learning pipelines
Project description
ExperionML
💡 Introdução
Durante a fase de exploração de um projeto de aprendizado de máquina, o cientista de dados precisa identificar o pipeline mais adequado para o seu problema específico. Esse processo normalmente envolve diversas etapas, como limpeza de dados, criação ou seleção de atributos relevantes, teste de diferentes algoritmos e avaliação de múltiplas configurações de modelos.
Explorar várias combinações de pipelines costuma exigir muitas linhas de código. Quando todo esse processo é realizado em um único notebook, o código rapidamente se torna longo, difícil de manter e pouco organizado. Por outro lado, dividir os experimentos em múltiplos notebooks pode dificultar a comparação entre resultados e a visão geral do progresso do projeto. Além disso, refatorar código para cada novo experimento pode consumir um tempo significativo.
Quantas vezes você já executou as mesmas etapas de pré-processamento para diferentes conjuntos de dados? Quantas vezes precisou copiar e colar código de repositórios antigos para reutilizar em novos projetos?
ExperionML foi desenvolvido para resolver esses problemas comuns no fluxo de trabalho de machine learning. A biblioteca atua como uma camada de orquestração sobre todo o pipeline de modelagem, permitindo que cientistas de dados executem experimentos de forma rápida, organizada e reproduzível.
Com o ExperionML, tarefas repetitivas são automatizadas e o foco passa a ser a experimentação e a análise de resultados. Em poucas linhas de código, é possível aplicar etapas essenciais de pré-processamento, selecionar atributos relevantes, treinar múltiplos modelos e comparar seus desempenhos em um mesmo conjunto de dados.
Dessa forma, o ExperionML permite que o usuário avance rapidamente do dado bruto para insights relevantes, mantendo os experimentos estruturados e fáceis de analisar.
Exemplo de etapas executadas no pipeline do ExperionML
1. Limpeza de dados
- Tratamento de valores ausentes
- Codificação de variáveis categóricas
- Detecção e remoção de outliers
- Balanceamento do conjunto de treinamento
2. Engenharia de atributos
- Criação de atributos não lineares
- Seleção das variáveis mais relevantes
3. Treinamento e validação de múltiplos modelos
- Ajuste de hiperparâmetros
- Treinamento dos modelos no conjunto de treino
- Avaliação no conjunto de teste
4. Análise dos resultados
- Cálculo de métricas de desempenho
- Visualizações para comparação entre modelos
Project details
Download files
Download the file for your platform. If you're not sure which to choose, learn more about installing packages.
Source Distribution
Built Distribution
Filter files by name, interpreter, ABI, and platform.
If you're not sure about the file name format, learn more about wheel file names.
Copy a direct link to the current filters
File details
Details for the file experionml-1.3.0.tar.gz.
File metadata
- Download URL: experionml-1.3.0.tar.gz
- Upload date:
- Size: 194.4 kB
- Tags: Source
- Uploaded using Trusted Publishing? Yes
- Uploaded via: twine/6.1.0 CPython/3.13.7
File hashes
| Algorithm | Hash digest | |
|---|---|---|
| SHA256 |
ba8c9173b26c32ee8362d38bde0d50e9681ce868c029e9693f5936a2bb2e4041
|
|
| MD5 |
d15ac8f06c0ba9f088329ebc6c43f5f2
|
|
| BLAKE2b-256 |
8b994ca92ff1abee3105c1cc05a3d297235009d0f4018aef00fdef48ab127bc6
|
Provenance
The following attestation bundles were made for experionml-1.3.0.tar.gz:
Publisher:
publish-to-pypi.yml on gersonrs/experionml
-
Statement:
-
Statement type:
https://in-toto.io/Statement/v1 -
Predicate type:
https://docs.pypi.org/attestations/publish/v1 -
Subject name:
experionml-1.3.0.tar.gz -
Subject digest:
ba8c9173b26c32ee8362d38bde0d50e9681ce868c029e9693f5936a2bb2e4041 - Sigstore transparency entry: 1239483488
- Sigstore integration time:
-
Permalink:
gersonrs/experionml@b11a6e5ba8a643d5e5bdaf369fe654a06fb8e4f2 -
Branch / Tag:
refs/tags/v1.3.0 - Owner: https://github.com/gersonrs
-
Access:
public
-
Token Issuer:
https://token.actions.githubusercontent.com -
Runner Environment:
github-hosted -
Publication workflow:
publish-to-pypi.yml@b11a6e5ba8a643d5e5bdaf369fe654a06fb8e4f2 -
Trigger Event:
release
-
Statement type:
File details
Details for the file experionml-1.3.0-py3-none-any.whl.
File metadata
- Download URL: experionml-1.3.0-py3-none-any.whl
- Upload date:
- Size: 147.6 kB
- Tags: Python 3
- Uploaded using Trusted Publishing? Yes
- Uploaded via: twine/6.1.0 CPython/3.13.7
File hashes
| Algorithm | Hash digest | |
|---|---|---|
| SHA256 |
dbde765581633ed58e5ede41c2efcecb9bb4ceb68f052e27cfe74a91b7fdb2b5
|
|
| MD5 |
3fa5e652076419caeed9caf60b80826b
|
|
| BLAKE2b-256 |
a818fe8ac889d6d339f926dd9e7cfb7c8cce47b8b3cc9db95c7a1e681e4daa64
|
Provenance
The following attestation bundles were made for experionml-1.3.0-py3-none-any.whl:
Publisher:
publish-to-pypi.yml on gersonrs/experionml
-
Statement:
-
Statement type:
https://in-toto.io/Statement/v1 -
Predicate type:
https://docs.pypi.org/attestations/publish/v1 -
Subject name:
experionml-1.3.0-py3-none-any.whl -
Subject digest:
dbde765581633ed58e5ede41c2efcecb9bb4ceb68f052e27cfe74a91b7fdb2b5 - Sigstore transparency entry: 1239483489
- Sigstore integration time:
-
Permalink:
gersonrs/experionml@b11a6e5ba8a643d5e5bdaf369fe654a06fb8e4f2 -
Branch / Tag:
refs/tags/v1.3.0 - Owner: https://github.com/gersonrs
-
Access:
public
-
Token Issuer:
https://token.actions.githubusercontent.com -
Runner Environment:
github-hosted -
Publication workflow:
publish-to-pypi.yml@b11a6e5ba8a643d5e5bdaf369fe654a06fb8e4f2 -
Trigger Event:
release
-
Statement type: