A modern, yaml-driven ML pipeline for multiple models.

These details have not been verified by PyPI

Project links

Project description

Modern ML Pipeline

YAML 설정 기반의 머신러닝 파이프라인 CLI 도구입니다.

코드를 수정하지 않고 YAML 설정 파일만으로 모델 학습부터 API 서빙까지 처리합니다. 프로젝트 생성(mmp init)부터 실험, Docker 이미지 빌드, 컨테이너 레지스트리(GCR/ECR) 푸시까지 일관된 워크플로우를 제공합니다.

주요 특징

설정 기반 (Config-driven): YAML만으로 실험을 정의하고 환경 간 이식 가능
단일 이미지 배포: 학습, 추론, API 서빙을 하나의 Docker 이미지로 지원 (GCR/ECR 푸시까지)
클라우드 데이터 연동: GCS/S3/BigQuery에서 직접 데이터 로드
자동 실험 추적: MLflow와 연동되어 모든 실험 결과와 모델이 자동 저장
Data Leakage 방지: Train/Validation/Test/Calibration 4단계 분할 자동 처리
즉시 서빙: 학습 완료 후 명령어 한 줄로 REST API 서버 기동

빠른 시작

1. 설치

요구사항: Python 3.10, 3.11, 3.12, 또는 3.13

기본 설치

pip install modern-ml-pipeline        # pip
pipx install modern-ml-pipeline       # pipx (CLI 전역 설치, 권장)

시나리오별 추가 설치

기본 설치 후 필요한 extras를 추가합니다:

시나리오	pip	pipx inject
BigQuery/GCS/S3	`pip install 'modern-ml-pipeline[cloud-extras]'`	`pipx inject modern-ml-pipeline 'modern-ml-pipeline[cloud-extras]' --force`
LightGBM, CatBoost	`pip install 'modern-ml-pipeline[ml-extras]'`	`pipx inject modern-ml-pipeline 'modern-ml-pipeline[ml-extras]' --force`
PyTorch (LSTM 등)	`pip install 'modern-ml-pipeline[torch-extras]'`	`pipx inject modern-ml-pipeline 'modern-ml-pipeline[torch-extras]' --force`
전체 기능	`pip install 'modern-ml-pipeline[all]'`	`pipx inject modern-ml-pipeline 'modern-ml-pipeline[all]' --force`

상세 설치 옵션은 환경 설정 가이드를 참고하세요.

2. 프로젝트 생성

mmp init my-project
cd my-project

생성되는 디렉토리 구조:

my-project/
├── configs/             # 환경별 설정 (dev.yaml, prod.yaml)
├── recipes/             # 실험 레시피
├── data/                # 데이터 파일 (CSV, SQL)
├── Dockerfile           # 프로덕션 배포용 (학습/추론/서빙 통합)
├── docker-compose.yml   # 로컬 실행 및 테스트
└── ...

Tip: Dockerfile과 docker-compose.yml이 기본 포함되어, 로컬 개발부터 클라우드 배포까지 동일한 환경에서 실행할 수 있습니다.

3. 학습 전 준비

3-1. 데이터 준비

학습 데이터를 data/ 디렉토리에 CSV 또는 SQL 파일로 준비합니다.

Task별 데이터 형식은 Task 가이드를 참고하세요.

3-2. Config 파일 생성 (인프라 설정)

mmp get-config

대화형 인터페이스를 통해 MLflow, 스토리지, DB 연결 등을 설정하고 configs/{env}.yaml 파일을 생성합니다.

3-3. Recipe 파일 생성 (실험 설정)

mmp get-recipe

Task, 모델, 전처리 등을 선택하고 recipes/{name}.yaml 파일을 생성합니다. 생성된 파일에서 데이터 컬럼 정보만 수정하면 됩니다:

# recipes/my-recipe.yaml
task_choice: classification

data:
  data_interface:
    entity_columns: [user_id]      # [필수] ID 컬럼
    target_column: is_fraud        # [필수] 예측 대상

model:
  class_path: xgboost.XGBClassifier

상세 옵션은 Task 가이드, 설정 스키마를 참고하세요.

3-4. 환경변수 (.env)

mmp get-config 실행 시 .env.{env_name}.template 파일이 함께 생성됩니다. 이 템플릿을 복사하여 실제 값을 입력합니다:

# 템플릿 파일을 복사하여 실제 환경변수 파일 생성
cp .env.local.template .env.local

# .env.local 파일 편집하여 값 입력

# .env.local 예시
GOOGLE_APPLICATION_CREDENTIALS=/path/to/credentials.json
AWS_ACCESS_KEY_ID=AKIA...
AWS_SECRET_ACCESS_KEY=...

CLI 명령어(train, batch-inference, serve-api)는 Config 파일명에서 환경 이름을 추출하여 대응되는 .env.{env_name} 파일을 자동으로 로드합니다:

Config 파일	자동 로드되는 .env 파일
`configs/local.yaml`	`.env.local`
`configs/dev.yaml`	`.env.dev`
`configs/prod.yaml`	`.env.prod`

Note: 모델 서빙/추론 시 run_id는 CLI --run-id 인자로 전달합니다. Docker 실행 시에는 MODEL_RUN_ID 환경변수를 사용합니다.

4. 학습 및 실험

Recipe 파일을 여러 개 만들어 다양한 모델과 하이퍼파라미터를 실험할 수 있습니다. MLflow가 설정되어 있다면 모든 실험 결과가 자동으로 기록되어 mlflow ui 명령어로 성능 비교가 가능합니다. 상세 설정은 MLflow 가이드를 참고하세요.

로컬 실행

# CSV 파일로 학습
mmp train -c configs/dev.yaml -r recipes/my-recipe.yaml -d data/train.csv

# SQL 파일로 학습 (BigQuery/PostgreSQL 등)
mmp train -c configs/dev.yaml -r recipes/my-recipe.yaml -d data/query.sql

# SQL에 Jinja 변수 사용 시
mmp train -c configs/dev.yaml -r recipes/my-recipe.yaml -d data/query.sql -p '{"start_date": "2024-01-01", "end_date": "2024-12-31"}'

Docker 실행

# 이미지 빌드 (최초 1회)
docker build -t my-model:latest .

# Docker로 학습 실행
docker-compose run --rm train

학습 완료 시 출력되는 run_id를 추론/서빙에 사용합니다.

5. 추론

배치 추론

대량의 데이터를 한 번에 예측합니다.

mmp batch-inference -c configs/dev.yaml --run-id <run_id> -d data/test.csv

# 결과 파일 경로 직접 지정 (날짜별 디렉토리, CSV/JSON 포맷 지원)
mmp batch-inference --run-id <run_id> -o gs://bucket/2025/01/09/result.parquet

실시간 API 서빙

REST API 서버를 기동하여 실시간 예측 요청을 처리합니다.

# 기본 포트 8000
mmp serve-api -c configs/dev.yaml --run-id <run_id>

# 포트/호스트 지정
mmp serve-api -c configs/dev.yaml --run-id <run_id> --host 0.0.0.0 --port 8080

# API 호출
curl -X POST http://localhost:8000/predict \
  -H "Content-Type: application/json" \
  -d '{"feature_1": 0.5, "feature_2": 100}'

API 엔드포인트 상세는 API 서빙 가이드를 참고하세요.

6. 배포 및 운영

배포 흐름

mmp init → 실험 → docker build → (( CI/CD로 GCR/ECR 푸시 → k8s에서 실행 ))

# 이미지 빌드 및 푸시 (CI/CD에서 자동화)
docker build -t gcr.io/my-project/mmp:v1 .
docker push gcr.io/my-project/mmp:v1

MMP의 범위: 프로젝트 생성 → 실험 → 이미지 빌드

MMP 범위 외: CI/CD, k8s 매니페스트, ConfigMap은 각 조직에서 별도 구성

상세 가이드는 배포 및 운영 가이드를 참고하세요.

지원 Task

Task	설명	활용 사례
Classification	범주형 분류	사기 탐지, 이탈 예측
Regression	연속값 예측	집값 예측, 매출 예측
Timeseries	시계열 예측	일별 매출, 트래픽 예측
Clustering	비지도 군집화	고객 세분화
Causal	인과 추론	프로모션 효과 분석

각 Task별 데이터 형식과 모델 설정은 Task 가이드를 참고하세요.

지원 모델

라이브러리	모델
Scikit-learn	RandomForest, LogisticRegression, KMeans 등
XGBoost	XGBClassifier, XGBRegressor
LightGBM	LGBMClassifier, LGBMRegressor
CatBoost	CatBoostClassifier, CatBoostRegressor
PyTorch	LSTM, TabNet
statsmodels	ARIMA, ExponentialSmoothing
CausalML	T-Learner, S-Learner

mmp list models   # 사용 가능한 모델 목록
mmp list metrics  # 사용 가능한 메트릭 목록

문서

사용자 문서

순서	문서	설명
1	환경 설정 가이드	설치, DB 연결, Cloud 설정
2	Task 가이드	Task별 데이터 형식, 모델, Recipe 설정
3	설정 스키마	Config/Recipe YAML 작성법
4	CLI 레퍼런스	명령어 상세 옵션
5	MLflow 가이드	실험 추적, UI 설정
6	API 서빙 가이드	REST API 서버 사용법
7	배포 및 운영 가이드	이미지 빌드, CI/CD, 운영 설정
8	전처리 레퍼런스	전처리 상세 (선택)
9	로컬 개발 환경	Docker 기반 로컬 개발 (선택)

개발자 문서

시스템 확장이나 기여를 원하시면 개발자 문서를 참고하세요.

도움말

mmp --help              # 전체 명령어 도움말
mmp train --help        # 특정 명령어 사용법

Version: 1.1.25 | License: Apache 2.0 | Python: 3.10 - 3.13

Project details

These details have not been verified by PyPI

Project links

Release history Release notifications | RSS feed

1.5.0

Mar 31, 2026

1.4.8

Mar 31, 2026

1.4.7

Mar 31, 2026

1.4.6

Mar 31, 2026

1.4.5

Mar 30, 2026

1.4.4

Mar 30, 2026

1.4.3

Mar 30, 2026

1.4.2

Mar 30, 2026

1.4.1

Mar 30, 2026

1.4.0

Mar 25, 2026

1.3.0

Mar 24, 2026

1.2.1

Jan 9, 2026

1.2.0

Jan 9, 2026

1.1.26

Jan 9, 2026

This version

1.1.25

Jan 9, 2026

1.1.24

Jan 9, 2026

1.1.23

Jan 9, 2026

1.1.22

Jan 8, 2026

1.1.21

Jan 8, 2026

1.1.20

Jan 8, 2026

1.1.19

Jan 8, 2026

1.1.18

Jan 8, 2026

1.1.17

Jan 8, 2026

1.1.16

Jan 8, 2026

1.1.15

Jan 8, 2026

1.1.14

Jan 8, 2026

1.1.13

Jan 8, 2026

1.1.12

Jan 8, 2026

1.1.11

Jan 8, 2026

1.1.10

Jan 8, 2026

1.1.8

Jan 8, 2026

1.1.7

Jan 8, 2026

1.1.6

Jan 8, 2026

1.1.5

Jan 8, 2026

1.1.4

Jan 8, 2026

1.1.3

Jan 8, 2026

1.1.2

Jan 8, 2026

1.1.1

Jan 8, 2026

1.1.0

Jan 8, 2026

1.0.9

Jan 8, 2026

1.0.8

Jan 8, 2026

1.0.7

Jan 8, 2026

1.0.6

Jan 7, 2026

1.0.5

Jan 7, 2026

1.0.4

Jan 7, 2026

1.0.3

Jan 7, 2026

1.0.2

Jan 7, 2026

1.0.1

Jan 7, 2026

1.0.0

Jan 7, 2026

Download files

Download the file for your platform. If you're not sure which to choose, learn more about installing packages.

Source Distribution

modern_ml_pipeline-1.1.25.tar.gz (747.3 kB view details)

Uploaded Jan 9, 2026 Source

Built Distribution

If you're not sure about the file name format, learn more about wheel file names.

The dropdown lists show the available interpreters, ABIs, and platforms. Enable javascript to be able to filter the list of wheel files.

modern_ml_pipeline-1.1.25-py3-none-any.whl (303.9 kB view details)

Uploaded Jan 9, 2026 Python 3

File details

Details for the file modern_ml_pipeline-1.1.25.tar.gz.

File metadata

Download URL: modern_ml_pipeline-1.1.25.tar.gz
Upload date: Jan 9, 2026
Size: 747.3 kB
Tags: Source
Uploaded using Trusted Publishing? No
Uploaded via: twine/6.2.0 CPython/3.11.14

File hashes

Hashes for modern_ml_pipeline-1.1.25.tar.gz
Algorithm	Hash digest
SHA256	`a56d4207afa6f2569fc54ad784e607a00ac409556b95501b53130acd05a9e0ea`
MD5	`3dbad8f5f08a02a2302108e60cb2a04b`
BLAKE2b-256	`bb926acaf0c2c3f5fd13b06435d3ab12a5971d5063a296b0b4c94d23e904a6d3`

See more details on using hashes here.

File details

Details for the file modern_ml_pipeline-1.1.25-py3-none-any.whl.

File metadata

Download URL: modern_ml_pipeline-1.1.25-py3-none-any.whl
Upload date: Jan 9, 2026
Size: 303.9 kB
Tags: Python 3
Uploaded using Trusted Publishing? No
Uploaded via: twine/6.2.0 CPython/3.11.14

File hashes

Hashes for modern_ml_pipeline-1.1.25-py3-none-any.whl
Algorithm	Hash digest
SHA256	`f5b23ae43460b6349050b6ea85575ae386c521749132bdc2fba7e9dc96f712ea`
MD5	`9c3c7339da6aae6580bd97ea898b265a`
BLAKE2b-256	`b9ef3f2bf539010cb598b3fc45791223c1274c7ca4cead79421e702506cbcccc`

See more details on using hashes here.

modern-ml-pipeline 1.1.25

Navigation

Verified details

Maintainers

Unverified details

Project links

Meta

Classifiers

Project description

Modern ML Pipeline

주요 특징

빠른 시작

1. 설치

기본 설치

시나리오별 추가 설치

2. 프로젝트 생성

3. 학습 전 준비

3-1. 데이터 준비

3-2. Config 파일 생성 (인프라 설정)

3-3. Recipe 파일 생성 (실험 설정)

3-4. 환경변수 (.env)

4. 학습 및 실험

로컬 실행

Docker 실행

5. 추론

배치 추론

실시간 API 서빙

6. 배포 및 운영

배포 흐름

지원 Task

지원 모델

문서

사용자 문서

개발자 문서

도움말

Project details

Verified details

Maintainers

Unverified details

Project links

Meta

Classifiers

Release history Release notifications | RSS feed

Download files

Source Distribution

Built Distribution

File details

File metadata

File hashes

File details

File metadata

File hashes