A modern, yaml-driven ML pipeline for multiple models.

These details have not been verified by PyPI

Project links

Project description

Modern ML Pipeline

YAML 설정 기반의 머신러닝 파이프라인 CLI 도구입니다.

코드를 수정하지 않고 YAML 설정 파일만으로 모델 학습부터 API 서빙까지 처리합니다. 프로젝트 생성(mmp init)부터 실험, Docker 이미지 빌드, 컨테이너 레지스트리(GCR/ECR) 푸시까지 일관된 워크플로우를 제공합니다.

주요 특징

설정 기반 (Config-driven): YAML만으로 실험을 정의하고 환경 간 이식 가능
단일 이미지 배포: 학습, 추론, API 서빙을 하나의 Docker 이미지로 지원 (GCR/ECR 푸시까지)
클라우드 데이터 연동: GCS/S3/BigQuery에서 직접 데이터 로드
자동 실험 추적: MLflow와 연동되어 모든 실험 결과와 모델이 자동 저장
Data Leakage 방지: Train/Validation/Test/Calibration 4단계 분할 자동 처리
즉시 서빙: 학습 완료 후 명령어 한 줄로 REST API 서버 기동

빠른 시작

1. 설치

요구사항: Python 3.10, 3.11, 3.12, 또는 3.13

기본 설치

pip install modern-ml-pipeline        # pip
pipx install modern-ml-pipeline       # pipx (CLI 전역 설치, 권장)

시나리오별 추가 설치

기본 설치 후 필요한 extras를 추가합니다:

시나리오	pip	pipx inject
BigQuery/GCS/S3	`pip install 'modern-ml-pipeline[cloud-extras]'`	`pipx inject modern-ml-pipeline 'modern-ml-pipeline[cloud-extras]' --force`
LightGBM, CatBoost	`pip install 'modern-ml-pipeline[ml-extras]'`	`pipx inject modern-ml-pipeline 'modern-ml-pipeline[ml-extras]' --force`
PyTorch (LSTM 등)	`pip install 'modern-ml-pipeline[torch-extras]'`	`pipx inject modern-ml-pipeline 'modern-ml-pipeline[torch-extras]' --force`
전체 기능	`pip install 'modern-ml-pipeline[all]'`	`pipx inject modern-ml-pipeline 'modern-ml-pipeline[all]' --force`

상세 설치 옵션은 환경 설정 가이드를 참고하세요.

2. 프로젝트 생성

mmp init my-project
cd my-project

생성되는 디렉토리 구조:

my-project/
├── configs/             # 환경별 설정 (dev.yaml, prod.yaml)
├── recipes/             # 실험 레시피
├── data/                # 데이터 파일 (CSV, SQL)
├── Dockerfile           # 프로덕션 배포용 (학습/추론/서빙 통합)
├── docker-compose.yml   # 로컬 실행 및 테스트
└── ...

Tip: Dockerfile과 docker-compose.yml이 기본 포함되어, 로컬 개발부터 클라우드 배포까지 동일한 환경에서 실행할 수 있습니다.

3. 설정 파일 생성

Config 파일 (인프라 설정)

mmp get-config

대화형 인터페이스를 통해 MLflow, 스토리지, DB 연결 등을 설정하고 configs/{env}.yaml 파일을 생성합니다.

Recipe 파일 (실험 설정)

mmp get-recipe

Task, 모델, 전처리 등을 선택하고 recipes/{name}.yaml 파일을 생성합니다. 생성된 파일에서 데이터 컬럼 정보만 수정하면 됩니다:

# recipes/my-recipe.yaml
task_choice: classification

data:
  data_interface:
    entity_columns: [user_id]      # [필수] ID 컬럼
    target_column: is_fraud        # [필수] 예측 대상

model:
  class_path: xgboost.XGBClassifier

상세 옵션은 Task 가이드, 설정 스키마를 참고하세요.

4. 학습

로컬 실행

# CSV 파일로 학습
mmp train -c configs/dev.yaml -r recipes/my-recipe.yaml -d data/train.csv

# SQL 파일로 학습 (BigQuery/PostgreSQL 등)
mmp train -c configs/dev.yaml -r recipes/my-recipe.yaml -d data/query.sql

Docker 실행

# 이미지 빌드 (최초 1회)
docker build -t my-model:latest .

# Docker로 학습 실행
docker-compose run --rm train

학습 완료 시 출력되는 run_id를 추론/서빙에 사용합니다.

5. 추론

배치 추론

대량의 데이터를 한 번에 예측합니다.

# 로컬 실행
mmp batch-inference -c configs/dev.yaml --run-id <run_id> -d data/test.csv

# Docker 실행
MODEL_RUN_ID=<run_id> INFERENCE_DATA_PATH=data/test.csv docker-compose run --rm inference

실시간 API 서빙

REST API 서버를 기동하여 실시간 예측 요청을 처리합니다.

# 로컬 실행
mmp serve-api -c configs/dev.yaml --run-id <run_id>

# Docker 실행
MODEL_RUN_ID=<run_id> docker-compose up api

# API 호출
curl -X POST http://localhost:8000/predict \
  -H "Content-Type: application/json" \
  -d '{"feature_1": 0.5, "feature_2": 100}'

API 엔드포인트 상세는 API 서빙 가이드를 참고하세요.

6. 배포

MMP는 프로젝트 생성부터 컨테이너 레지스트리 푸시까지 지원합니다.

# 이미지 빌드 및 레지스트리 푸시
docker build -t gcr.io/my-project/mmp:v1 .
docker push gcr.io/my-project/mmp:v1

빌드된 이미지는 단일 이미지로 학습, 추론, API 서빙을 모두 지원합니다. Kubernetes에서 실행 시 command만 다르게 지정합니다:

mmp serve-api --run-id <run_id> -c configs/prod.yaml           # API 서빙
mmp batch-inference --run-id <run_id> -d gs://bucket/data.csv  # 배치 추론
mmp train -r recipes/model.yaml -d gs://bucket/train.csv       # 학습

MMP의 범위: 프로젝트 생성 → 실험 → 이미지 빌드 → GCR/ECR 푸시

MMP 범위 외: Kubernetes 매니페스트(Deployment, CronJob, ConfigMap 등)는 조직의 GitOps 레포지토리에서 플랫폼팀이 별도 관리합니다.

상세 배포 가이드는 배포 가이드를 참고하세요.

지원 Task

Task	설명	활용 사례
Classification	범주형 분류	사기 탐지, 이탈 예측
Regression	연속값 예측	집값 예측, 매출 예측
Timeseries	시계열 예측	일별 매출, 트래픽 예측
Clustering	비지도 군집화	고객 세분화
Causal	인과 추론	프로모션 효과 분석

각 Task별 데이터 형식과 모델 설정은 Task 가이드를 참고하세요.

지원 모델

라이브러리	모델
Scikit-learn	RandomForest, LogisticRegression, KMeans 등
XGBoost	XGBClassifier, XGBRegressor
LightGBM	LGBMClassifier, LGBMRegressor
CatBoost	CatBoostClassifier, CatBoostRegressor
PyTorch	LSTM, TabNet
statsmodels	ARIMA, ExponentialSmoothing
CausalML	T-Learner, S-Learner

mmp list models   # 사용 가능한 모델 목록
mmp list metrics  # 사용 가능한 메트릭 목록

문서

사용자 문서

순서	문서	설명
1	환경 설정 가이드	설치, DB 연결, Cloud 설정
2	Task 가이드	Task별 데이터 형식, 모델, Recipe 설정
3	설정 스키마	Config/Recipe YAML 작성법
4	CLI 레퍼런스	명령어 상세 옵션
5	API 서빙 가이드	REST API 서버 사용법
6	배포 가이드	Docker 이미지 빌드, GCR/ECR 푸시
7	전처리 레퍼런스	전처리 상세 (선택)
8	로컬 개발 환경	Docker 기반 로컬 개발 (선택)

개발자 문서

시스템 확장이나 기여를 원하시면 개발자 문서를 참고하세요.

도움말

mmp --help              # 전체 명령어 도움말
mmp train --help        # 특정 명령어 사용법

Version: 1.1.22 | License: Apache 2.0 | Python: 3.10 - 3.13

Project details

These details have not been verified by PyPI

Project links

Release history Release notifications | RSS feed

1.5.0

Mar 31, 2026

1.4.8

Mar 31, 2026

1.4.7

Mar 31, 2026

1.4.6

Mar 31, 2026

1.4.5

Mar 30, 2026

1.4.4

Mar 30, 2026

1.4.3

Mar 30, 2026

1.4.2

Mar 30, 2026

1.4.1

Mar 30, 2026

1.4.0

Mar 25, 2026

1.3.0

Mar 24, 2026

1.2.1

Jan 9, 2026

1.2.0

Jan 9, 2026

1.1.26

Jan 9, 2026

1.1.25

Jan 9, 2026

1.1.24

Jan 9, 2026

1.1.23

Jan 9, 2026

This version

1.1.22

Jan 8, 2026

1.1.21

Jan 8, 2026

1.1.20

Jan 8, 2026

1.1.19

Jan 8, 2026

1.1.18

Jan 8, 2026

1.1.17

Jan 8, 2026

1.1.16

Jan 8, 2026

1.1.15

Jan 8, 2026

1.1.14

Jan 8, 2026

1.1.13

Jan 8, 2026

1.1.12

Jan 8, 2026

1.1.11

Jan 8, 2026

1.1.10

Jan 8, 2026

1.1.8

Jan 8, 2026

1.1.7

Jan 8, 2026

1.1.6

Jan 8, 2026

1.1.5

Jan 8, 2026

1.1.4

Jan 8, 2026

1.1.3

Jan 8, 2026

1.1.2

Jan 8, 2026

1.1.1

Jan 8, 2026

1.1.0

Jan 8, 2026

1.0.9

Jan 8, 2026

1.0.8

Jan 8, 2026

1.0.7

Jan 8, 2026

1.0.6

Jan 7, 2026

1.0.5

Jan 7, 2026

1.0.4

Jan 7, 2026

1.0.3

Jan 7, 2026

1.0.2

Jan 7, 2026

1.0.1

Jan 7, 2026

1.0.0

Jan 7, 2026

Download files

Download the file for your platform. If you're not sure which to choose, learn more about installing packages.

Source Distribution

modern_ml_pipeline-1.1.22.tar.gz (740.0 kB view details)

Uploaded Jan 8, 2026 Source

Built Distribution

If you're not sure about the file name format, learn more about wheel file names.

The dropdown lists show the available interpreters, ABIs, and platforms. Enable javascript to be able to filter the list of wheel files.

modern_ml_pipeline-1.1.22-py3-none-any.whl (297.4 kB view details)

Uploaded Jan 8, 2026 Python 3

File details

Details for the file modern_ml_pipeline-1.1.22.tar.gz.

File metadata

Download URL: modern_ml_pipeline-1.1.22.tar.gz
Upload date: Jan 8, 2026
Size: 740.0 kB
Tags: Source
Uploaded using Trusted Publishing? No
Uploaded via: twine/6.2.0 CPython/3.11.14

File hashes

Hashes for modern_ml_pipeline-1.1.22.tar.gz
Algorithm	Hash digest
SHA256	`c86694447e272256792459edd83037993a1ffb8da1f9f3621a26b880355ab4bc`
MD5	`00dee976ec255b14ce55db627e5b6416`
BLAKE2b-256	`adf85d628b68a4d41042332cbb50012b441508c44f9e11dc46fea4ade0f8fa5b`

See more details on using hashes here.

File details

Details for the file modern_ml_pipeline-1.1.22-py3-none-any.whl.

File metadata

Download URL: modern_ml_pipeline-1.1.22-py3-none-any.whl
Upload date: Jan 8, 2026
Size: 297.4 kB
Tags: Python 3
Uploaded using Trusted Publishing? No
Uploaded via: twine/6.2.0 CPython/3.11.14

File hashes

Hashes for modern_ml_pipeline-1.1.22-py3-none-any.whl
Algorithm	Hash digest
SHA256	`dc8e685b78360101009f19359a73c696eb60f877b37472d6dcb7526828f9fc97`
MD5	`7ee12cfdccc7d674d92c30f249255be3`
BLAKE2b-256	`a9d5ba688cf2f8c206d8dcbb7207255447631352aae9f97fc469dfc6e9f87e9b`

See more details on using hashes here.

modern-ml-pipeline 1.1.22

Navigation

Verified details

Maintainers

Unverified details

Project links

Meta

Classifiers

Project description

Modern ML Pipeline

주요 특징

빠른 시작

1. 설치

기본 설치

시나리오별 추가 설치

2. 프로젝트 생성

3. 설정 파일 생성

Config 파일 (인프라 설정)

Recipe 파일 (실험 설정)

4. 학습

로컬 실행

Docker 실행

5. 추론

배치 추론

실시간 API 서빙

6. 배포

지원 Task

지원 모델

문서

사용자 문서

개발자 문서

도움말

Project details

Verified details

Maintainers

Unverified details

Project links

Meta

Classifiers

Release history Release notifications | RSS feed

Download files

Source Distribution

Built Distribution

File details

File metadata

File hashes

File details

File metadata

File hashes