rekcurd

A Python gRPC framework for serving a machine learning module written in Python.

These details have not been verified by PyPI

Project links

Homepage

GitHub Statistics

View statistics for this project via Libraries.io, or by using our public dataset on Google BigQuery

Project description

# Drucker

[![Build Status](https://travis-ci.com/drucker/drucker.svg?branch=master)](https://travis-ci.com/drucker/drucker)
[![PyPI version](https://badge.fury.io/py/drucker.svg)](https://badge.fury.io/py/drucker)
[![codecov](https://codecov.io/gh/drucker/drucker/branch/master/graph/badge.svg)](https://codecov.io/gh/drucker/drucker "Non-generated packages only")
[![pypi supported versions](https://img.shields.io/pypi/pyversions/drucker.svg)](https://pypi.python.org/pypi/drucker)

Drucker is a framework of serving machine learning module. Drucker makes it easy to serve, manage and integrate your ML models into your existing services. Moreover, Drucker can be used on Kubernetes.

## Parent Project
https://github.com/drucker/drucker-parent

## Components
- [Drucker](https://github.com/drucker/drucker) (here): Serving framework for a machine learning module.
- [Drucker-dashboard](https://github.com/drucker/drucker-dashboard): Management web service for the machine learning models to the drucker service.
- [Drucker-client](https://github.com/drucker/drucker-client): SDK for accessing a drucker service.
- [Drucker-example](https://github.com/drucker/drucker-example): Example of how to use drucker.

## Installation
From source:

```
git clone --recursive https://github.com/drucker/drucker.git
cd drucker
python setup.py install
```

From [PyPi](https://pypi.org/project/drucker/) directly:

```
pip install drucker
```

## Example
Example is available [here](https://github.com/drucker/drucker-example).

### Create settings.yml (Not necessary)
Write your server configurations. The spec details are [here](./template/settings.yml)

### Create app.py
Implement `Drucker` class.

Necessity methods are following.

#### load_model
ML model loading method.

```python
def load_model(self) -> None:
try:
self.predictor = joblib.load(self.model_path)
except Exception as e:
self.logger.error(str(e))
self.logger.error(traceback.format_exc())
self.predictor = None
if not self.is_first_boot():
os._exit(-1)
```

If you need to load more than two files to your ML module, you need to create a compressed file which includes the files it requires. You can load the file like the below.

```python
def joblib_load_from_zip(self, zip_name: str, file_name: str):
with zipfile.ZipFile(zip_name, 'r') as zf:
with zf.open(file_name, 'r') as zipmodel:
return joblib.load(io.BufferedReader(io.BytesIO(zipmodel.read())))

def load_model(self) -> None:
try:
file_name = 'default.model'
self.predictor = self.joblib_load_from_zip(self.model_path, file_name)
except Exception as e:
self.logger.error(str(e))
self.logger.error(traceback.format_exc())
self.predictor = None
if not self.is_first_boot():
os._exit(-1)
```

#### predict
Predicting/inferring method.

```python
def predict(self, input: PredictLabel, option: dict = None) -> PredictResult:
try:
label_predict = self.predictor.predict(
np.array([input], dtype='float64')).tolist()
return PredictResult(label_predict, [1] * len(label_predict), option={})
except Exception as e:
self.logger.error(str(e))
self.logger.error(traceback.format_exc())
raise e
```

Input/output specs are below.

##### Input format
*V* is the length of feature vector.

|Field |Type |Description |
|:---|:---|:---|
|input (required) |One of below - string - bytes - string[*V*] - int[*V*] - double[*V*] |Input data for inference. - "Nice weather." for a sentiment analysis. - PNG file for an image transformation. - ["a", "b"] for a text summarization. - [1, 2] for a sales forcast. - [0.9, 0.1] for mnist data. |
|option |string| Option field. Must be json format. |

The "option" field needs to be a json format. Any style is Ok but we have some reserved fields below.

|Field |Type |Description |
|:---|:---|:---|
|suppress_log_input |bool |True: NOT print the input and output to the log message. False (default): Print the input and outpu to the log message.

##### Output format
*M* is the number of classes. If your algorithm is a binary classifier, you set *M* to 1. If your algorithm is a multi-class classifier, you set *M* to the number of classes.

|Field |Type |Description |
|:---|:---|:---|
|label (required) |One of below -string -bytes -string[*M*] -int[*M*] -double[*M*] |Result of inference. -"positive" for a sentiment analysis. -PNG file for an image transformation. -["a", "b"] for a multi-class classification. -[1, 2] for a multi-class classification. -[0.9, 0.1] for a multi-class classification. |
|score (required) |One of below -double -double[*M*] |Score of result. -0.98 for a binary classification. -[0.9, 0.1] for a multi-class classification. |
|option |string |Option field. Must be json format. |

#### evaluate (TODO)
Evaluating method.

This method is under construction.

##### Input format
|Field |Type |Description |
|:---|:---|:---|
|file (required) |bytes |Data for performance check |

##### Output format
*N* is the number of evaluation data. *M* is the number of classes. If your algorithm is a binary classifier, you set *M* to 1. If your algorithm is a multi-class classifier, you set *M* to the number of classes.

|Field |Type |Description |
|:---|:---|:---|
|num (required)|int |Number of evaluation data. |
|accuracy (required) |double |Accuracy. |
|precision (required) |double[*N*][*M*] |Precision. |
|recall (required) |double[*N*][*M*] |Recall. |
|fvalue (required) |double[*N*][*M*] |F1 value. |

### Create server.py
Create a boot script.

```python
from concurrent import futures
import grpc
import time

from drucker import DruckerDashboardServicer, DruckerWorkerServicer
from drucker.logger import JsonSystemLogger, JsonServiceLogger
from drucker.protobuf import drucker_pb2_grpc
from app import MyApp

_ONE_DAY_IN_SECONDS = 60 * 60 * 24

def serve():
app = MyApp("./settings.yml")
system_logger = JsonSystemLogger(app.config)
service_logger = JsonServiceLogger(app.config)
system_logger.info("Wake-up drucker worker.")

server = grpc.server(futures.ThreadPoolExecutor(max_workers=10))

drucker_pb2_grpc.add_DruckerDashboardServicer_to_server(
DruckerDashboardServicer(logger=system_logger, app=app), server)
drucker_pb2_grpc.add_DruckerWorkerServicer_to_server(
DruckerWorkerServicer(logger=service_logger, app=app), server)
server.add_insecure_port("[::]:{0}".format(app.config.SERVICE_PORT))
server.start()
try:
while True:
time.sleep(_ONE_DAY_IN_SECONDS)
except KeyboardInterrupt:
system_logger.info("Shutdown drucker worker.")
server.stop(0)

if __name__ == '__main__':
serve()
```

### Create logger (Not necessary)
If you want to use your own format logger, please implement the drucker [logger interface class](./drucker/logger/logger_interface.py).

### Create start.sh
Create a boot script.

```sh
#!/usr/bin/env bash

ECHO_PREFIX="[drucker example]: "

set -e
set -u

echo "$ECHO_PREFIX Start.."

pip install -r requirements.txt
python ./server.py

```

### Run
```
$ sh start.sh
```

### Test
```
$ python -m unittest drucker/test/test_worker_servicer.py
$ python -m unittest drucker/test/test_dashboard_servicer.py
```

## Drucker on Kubernetes
Drucker can be run on Kubernetes and can be managed by Drucker dashboard.

You must read the followings.

1. https://github.com/drucker/drucker-parent/tree/master/docs/Installation.md
1. https://github.com/drucker/drucker-dashboard/README.md

Project details

These details have not been verified by PyPI

Project links

Homepage

GitHub Statistics

View statistics for this project via Libraries.io, or by using our public dataset on Google BigQuery

Release history Release notifications | RSS feed

1.0.2a0 pre-release

Jul 31, 2019

1.0.1.post1

Jul 31, 2019

1.0.1

Jul 31, 2019

1.0.1a2 pre-release

Jul 29, 2019

1.0.1a0 pre-release

Apr 26, 2019

1.0.0

Apr 26, 2019

1.0.0a0 pre-release

Apr 26, 2019

0.5.0a7 pre-release

Apr 18, 2019

0.5.0a6 pre-release

Mar 11, 2019

0.5.0a5 pre-release

Mar 7, 2019

0.5.0a4 pre-release

Feb 28, 2019

0.5.0a3 pre-release

Feb 27, 2019

0.5.0a2 pre-release

Feb 21, 2019

0.5.0a1 pre-release

Feb 8, 2019

0.5.0a0 pre-release

Feb 5, 2019

0.4.5

Jan 30, 2019

0.4.4

Jan 15, 2019

0.4.3

Dec 26, 2018

This version

0.4.2

Nov 28, 2018

Download files

Download the file for your platform. If you're not sure which to choose, learn more about installing packages.

Source Distribution

rekcurd-0.4.2.tar.gz (20.9 kB view hashes)

Uploaded Nov 28, 2018 Source

Built Distribution

rekcurd-0.4.2-py2.py3-none-any.whl (28.8 kB view hashes)

Uploaded Nov 28, 2018 Python 2 Python 3

Hashes for rekcurd-0.4.2.tar.gz

Hashes for rekcurd-0.4.2.tar.gz
Algorithm	Hash digest
SHA256	`139fd3c06e9445d214136e7ec5a77ec8f1f7ecea8b84c90be0873487bbee6e4b`
MD5	`3617e0cc4b888aa35b2a5b45e438814b`
BLAKE2b-256	`b9f824276ba46b30a8540685288b3ebd0ee7ec4ba30434224797060109b01a48`

Hashes for rekcurd-0.4.2-py2.py3-none-any.whl

Hashes for rekcurd-0.4.2-py2.py3-none-any.whl
Algorithm	Hash digest
SHA256	`79c21c523e085ece0b0e13e26030d82374e202190399b4067f61294eb9c551cf`
MD5	`2e7c9ee1986cf0c201738070e900068b`
BLAKE2b-256	`5696d987a71edca05765b96b08cea3de5eaf2bc99eeef93ccbc2bbf25f69cf2b`