Inference utilities for keynet - Triton Inference Server integration

These details have not been verified by PyPI

Project links

Project description

keynet-inference

OpenWhisk 런타임 및 Triton Inference Server 통합을 위한 추론 라이브러리입니다.

주요 기능

OpenWhisk 런타임 배포: @keynet_function 데코레이터로 Python 함수를 OpenWhisk 런타임으로 배포
Triton 추론: MLflow와 Triton Inference Server 연동하여 추론 API 실행
통합 CLI: keynet-inference 명령어로 로그인, 푸시, 배포 관리

설치

pip install keynet-inference

CLI 사용법

OpenWhisk 런타임 푸시

# 기본 사용
keynet-inference push function.py

# Base image 지정
keynet-inference push function.py --base-image openwhisk/action-python-v3.11:latest

자세한 사용법은 Push 명령어 가이드를 참고하세요.

로그아웃

keynet-inference logout

주요 개념

keynet-inference는 추론 파이프라인을 구성하는 몇 가지 핵심 컴포넌트를 제공합니다.

@keynet_function(name): 일반 Python 함수를 Keynet 추론 워크플로우의 **진입점(entrypoint)**으로 만들어주는 데코레이터입니다. 이 데코레이터는 다음과 같은 역할을 자동으로 처리합니다.
- 함수 실행에 필요한 환경변수 로드
- 사용자 입력을 UserInput 싱글톤 객체에 설정
- 함수의 시그니처 및 반환 값 검증
UserInput: 추론 실행 시 사용자가 전달한 입력 파라미터에 안전하게 접근할 수 있는 싱글톤(Singleton) 객체입니다. UserInput.get("param_name", default_value) 형태로 사용하며, 환경변수와 분리되어 사용자 입력만을 명확하게 관리할 수 있습니다.
TritonPlugin: MLflow 모델 레지스트리에 등록된 모델을 사용하여 Triton Inference Server에 추론 요청을 보내는 클라이언트입니다. 복잡한 Triton API 호출을 단순화하여, 모델 이름과 입력 데이터만으로 쉽게 예측을 수행할 수 있습니다.
Storage: S3, MinIO 등 오브젝트 스토리지와의 파일 상호작용을 추상화한 인터페이스입니다. 추론에 필요한 이미지나 데이터를 다운로드하거나, 결과 파일을 업로드하는 작업을 간편하게 처리합니다.

사용 예제

전체 추론 파이프라인

다음은 Storage에서 이미지를 다운로드하고, 전처리한 뒤 Triton으로 추론하고, 결과를 다시 Storage에 업로드하는 전체 워크플로우 예제입니다.

참고: 아래 예제에서 main 함수는 args 파라미터를 받지만, 실제 사용자 입력값은 UserInput.get() 메소드를 통해 접근하는 것을 권장합니다. @keynet_function 데코레이터가 args를 사용하여 UserInput 싱글톤을 내부적으로 초기화하므로, 코드의 명확성과 일관성을 위해 UserInput을 사용하세요.

import numpy as np
from PIL import Image
from io import BytesIO
from keynet_inference import keynet_function, UserInput, TritonPlugin, Storage

# 1. @keynet_function으로 추론 함수 정의
# "image-detection"은 이 함수의 고유 이름으로 사용됩니다.
@keynet_function("image-detection")
def main(args: dict):
    # Storage 및 TritonPlugin 클라이언트 초기화
    # 관련 설정(예: 엔드포인트, 자격 증명)은 환경변수에서 자동으로 로드됩니다.
    storage = Storage()
    triton = TritonPlugin()

    # 2. 사용자 입력 파라미터 가져오기
    # UserInput.get()을 사용하여 안전하게 입력에 접근합니다.
    image_url = UserInput.get("image_url")
    threshold = UserInput.get("threshold", 0.5)  # 기본값 0.5 설정

    # 3. 입력 데이터 처리 (Storage에서 다운로드)
    image_buffer = storage.get(image_url)
    image = Image.open(image_buffer).convert("RGB")

    # 4. 모델 추론을 위한 전처리
    input_tensor = preprocess(image, size=(640, 640))

    # 5. Triton Inference Server로 추론 요청
    outputs = triton.predict(
        df={"input_0": input_tensor}
    )

    # 6. 추론 결과 후처리
    result_image_buffer = postprocess(outputs["output_0"], image, threshold)

    # 7. 결과물을 Storage에 업로드
    url = storage.put(result_image_buffer)

    # 8. 결과 반환 (JSON 직렬화 가능해야 함)
    return {"url": url}

def preprocess(image: Image.Image, size: tuple) -> np.ndarray:
    """이미지를 모델 입력 형식에 맞게 전처리합니다."""
    resized = image.resize(size)
    array = np.array(resized, dtype=np.float32) / 255.0
    array = array.transpose(2, 0, 1)  # HWC -> CHW
    return np.expand_dims(array, axis=0)

def postprocess(outputs: np.ndarray, original_image: Image.Image, threshold: float) -> BytesIO:
    """추론 결과를 원본 이미지에 시각화하고 이미지 버퍼를 반환합니다."""
    # 예시: threshold를 사용한 바운딩 박스 필터링 및 그리기 로직
    # (실제 구현은 모델 출력에 따라 달라집니다)
    # ...

    buffer = BytesIO()
    original_image.save(buffer, format="PNG")
    buffer.seek(0)
    return buffer

Python 버전 지원

Python 3.9, 3.10, 3.11, 3.12

라이선스

MIT License

Project details

These details have not been verified by PyPI

Project links

Release history Release notifications | RSS feed

0.8.5

Nov 19, 2025

This version

0.8.4

Nov 19, 2025

0.8.3

Nov 19, 2025

0.8.2

Nov 19, 2025

0.8.1

Nov 19, 2025

0.8.0

Nov 19, 2025

0.7.4

Nov 17, 2025

0.7.3

Nov 13, 2025

0.7.2

Nov 12, 2025

0.7.1

Nov 12, 2025

0.7.0

Nov 12, 2025

0.6.1

Nov 10, 2025

0.6.0

Nov 10, 2025

0.5.6

Nov 10, 2025

0.5.5

Nov 10, 2025

0.5.4

Nov 10, 2025

0.5.3

Nov 10, 2025

0.5.2

Nov 10, 2025

0.5.1

Nov 10, 2025

0.5.0

Nov 10, 2025

0.5.0.dev2 pre-release

Nov 10, 2025

0.5.0.dev1 pre-release

Nov 10, 2025

0.5.0.dev0 pre-release

Nov 7, 2025

0.4.1

Nov 5, 2025

0.4.0

Nov 1, 2025

0.3.1

Oct 31, 2025

0.3.0

Oct 30, 2025

0.2.0

Jul 7, 2025

0.2.0.dev1 pre-release

Jul 7, 2025

0.2.0.dev0 pre-release

Jul 7, 2025

0.1.0

Jul 4, 2025

0.0.2

Jul 4, 2025

0.0.2.dev0 pre-release

Jul 4, 2025

0.0.1.dev7 pre-release

Jul 4, 2025

0.0.1.dev6 pre-release

Jul 3, 2025

0.0.1.dev5 pre-release

Jul 3, 2025

0.0.1.dev4 pre-release

Jul 3, 2025

0.0.1.dev3 pre-release

Jul 3, 2025

0.0.1.dev2 pre-release

Jul 3, 2025

0.0.1.dev1 pre-release

Jul 3, 2025

0.0.1.dev0 pre-release

Jul 3, 2025

Download files

Download the file for your platform. If you're not sure which to choose, learn more about installing packages.

Source Distribution

keynet_inference-0.8.4.tar.gz (56.5 kB view details)

Uploaded Nov 19, 2025 Source

Built Distribution

If you're not sure about the file name format, learn more about wheel file names.

The dropdown lists show the available interpreters, ABIs, and platforms. Enable javascript to be able to filter the list of wheel files.

keynet_inference-0.8.4-py3-none-any.whl (39.8 kB view details)

Uploaded Nov 19, 2025 Python 3

File details

Details for the file keynet_inference-0.8.4.tar.gz.

File metadata

Download URL: keynet_inference-0.8.4.tar.gz
Upload date: Nov 19, 2025
Size: 56.5 kB
Tags: Source
Uploaded using Trusted Publishing? No
Uploaded via: python-httpx/0.28.1

File hashes

Hashes for keynet_inference-0.8.4.tar.gz
Algorithm	Hash digest
SHA256	`e35a3f59bb3cb1406cda796a3993e00af1b890ca1d541eb50d8c87a2c4bd7aee`
MD5	`aeb8395e82659a3d53529206b03f0c77`
BLAKE2b-256	`40f28a46039a18a6255d65d3d1b54e53959840b8cc2901291264a4b61b42ff95`

See more details on using hashes here.

File details

Details for the file keynet_inference-0.8.4-py3-none-any.whl.

File metadata

Download URL: keynet_inference-0.8.4-py3-none-any.whl
Upload date: Nov 19, 2025
Size: 39.8 kB
Tags: Python 3
Uploaded using Trusted Publishing? No
Uploaded via: python-httpx/0.28.1

File hashes

Hashes for keynet_inference-0.8.4-py3-none-any.whl
Algorithm	Hash digest
SHA256	`5e953785078f1e6e984ff65ef6f3c94dc08ab976dc00bfe553a72349cd923e30`
MD5	`430b888c42b4b0187e8e29df01dc342e`
BLAKE2b-256	`af2b6c1a665060248f189e26843d65a406c0fa7c94cc5632d627ddda60bf6b2b`

See more details on using hashes here.

keynet-inference 0.8.4

Navigation

Verified details

Maintainers

Meta

Unverified details

Project links

Meta

Classifiers

Project description

keynet-inference

주요 기능

설치

CLI 사용법

로그인

OpenWhisk 런타임 푸시

로그아웃

주요 개념

사용 예제

전체 추론 파이프라인

Python 버전 지원

라이선스

Project details

Verified details

Maintainers

Meta

Unverified details

Project links

Meta

Classifiers

Release history Release notifications | RSS feed

Download files

Source Distribution

Built Distribution

File details

File metadata

File hashes

File details

File metadata

File hashes