tfserver

Tensor Flow Model Server

These details have not been verified by PyPI

Project links

Development Status
- 4 - Beta
Intended Audience
- Developers
License
- OSI Approved :: MIT License
Programming Language
- Python
- Python :: 3
Topic
- Scientific/Engineering :: Artificial Intelligence

Project description

tfserver is an example for serving Tensorflow model with Skitai App Engine.

It can be accessed by gRPC and JSON RESTful API.

This project is inspired by issue #176.

Saving Tensorflow Model

See tf.saved_model.builder.SavedModelBuilder, but for example:

import tensorflow as tf

# your own neural network
class DNN:
  ...

net = DNN (phase_train=False)

sess = tf.Session()
sess.run (tf.global_variables_initializer())

# restoring checkpoint
saver = tf.train.Saver (tf.global_variables())
saver.restore (sess, "./models/model.cpkt-1000")

# save model with builder
builder = tf.saved_model.builder.SavedModelBuilder ("exported/1/")

prediction_signature = (
  tf.saved_model.signature_def_utils.build_signature_def(
    inputs = {'x': tf.saved_model.utils.build_tensor_info (net.x)},
    outputs = {'y': tf.saved_model.utils.build_tensor_info (net.predict)])},
    method_name = tf.saved_model.signature_constants.PREDICT_METHOD_NAME)
)
# Remember 'x', 'y' for I/O

legacy_init_op = tf.group (tf.tables_initializer (), name = 'legacy_init_op')
builder.add_meta_graph_and_variables(
  sess,
  [ tf.saved_model.tag_constants.SERVING ],
  signature_def_map = {'predict': prediction_signature},
  legacy_init_op = legacy_init_op
)
# Remember 'signature_def_name'

builder.save()

Run Tensorflow Server

Example of api.py

import tfserver
import skitai
import tensorflow as tf

pref = skitai.pref ()
pref.max_client_body_size = 100 * 1024 * 1024 # 100 MB

# we want to serve 2 models:
# alias and (model_dir, optional session config)
pref.config.tf_models ["model1"] = "exported/2"
pref.config.tf_models ["model2"] = (
      "exported/3",
      tf.ConfigProto(
        gpu_options=tf.GPUOptions (per_process_gpu_memory_fraction = 0.2),
        log_device_placement = False
  )
)

# If you want to activate gRPC, should mount on '/'
skitai.mount ("/", tfserver, pref = pref)
skitai.run (port = 5000)

And run,

python3 api.py

gRPC Client

Using grpcio library,

from tfserver import cli
from tensorflow.python.framework import tensor_util
import numpy as np

stub = cli.Server ("http://localhost:5000")
problem = np.array ([1.0, 2.0])

resp = stub.predict (
  'model1', #alias for model
  'predict', #signature_def_name
  x = tensor_util.make_tensor_proto(problem.astype('float32'), shape=problem.shape)
)
# then get 'y'
resp.y
>> np.ndarray ([-1.5, 1.6])

Using aquests for async request,

import aquests
from tfserver import cli
from tensorflow.python.framework import tensor_util
import numpy as np

def print_result (resp):
  cli.Response (resp.data).y
  >> np.ndarray ([-1.5, 1.6])

stub = aquests.grpc ("http://localhost:5000/tensorflow.serving.PredictionService", callback = print_result)
problem = np.array ([1.0, 2.0])

request = cli.build_request (
  'model1',
  'predict',
  x = problem
)
stub.Predict (request, 10.0)

aquests.fetchall ()

RESTful API

Using requests,

import requests

problem = np.array ([1.0, 2.0])
api = requests.session ()
resp = api.post (
  "http://localhost:5000/predict",
  json.dumps ({"x": problem.astype ("float32").tolist()}),
  headers = {"Content-Type": "application/json"}
)
data = json.loads (resp.text)
data ["y"]
>> [-1.5, 1.6]

Another,

from aquests.lib import siesta

problem = np.array ([1.0, 2.0])
api = siesta.API ("http://localhost:5000")
resp = api.predict.post ({"x": problem.astype ("float32").tolist()})
resp.data.y
>> [-1.5, 1.6]

Performance Note Comparing with Proto Buffer and JSON

Test Environment

Input:
- dtype: Float 32
- shape: Various, From (50, 1025) To (300, 1025), Prox. Average (100, 1025)
Output:
- dtype: Float 32
- shape: (60,)
Request Threads: 16
Requests Per Thread: 100
Total Requests: 1,600

Results

Average of 3 runs,

gRPC with Proto Buffer:
- Use grpcio
- 11.58 seconds
RESTful API with JSON
- Use requests
- 216.66 seconds

Proto Buffer is 20 times faster than JSON…

Release History

0.1b8 (2018. 4.13): fix grpc trailers, skitai upgrade is required
0.1b6 (2018. 3.19): found works only grpcio 1.4.0
0.1b3 (2018. 2. 4): add @app.umounted decorator for clearing resource
0.1b2: remove self.tfsess.run (tf.global_variables_initializer())
0.1b1 (2018. 1. 28): Beta release
0.1a (2018. 1. 4): Alpha release

Project details

These details have not been verified by PyPI

Project links

Development Status
- 4 - Beta
Intended Audience
- Developers
License
- OSI Approved :: MIT License
Programming Language
- Python
- Python :: 3
Topic
- Scientific/Engineering :: Artificial Intelligence

Release history Release notifications | RSS feed

0.4.11

Nov 2, 2023

0.4.10

Apr 18, 2023

0.4.9

Nov 25, 2022

0.4.8

Oct 1, 2022

0.4.7

Oct 1, 2022

0.4.6

Oct 1, 2022

0.4.5.6

Jul 16, 2022

0.4.5.5

Jul 16, 2022

0.4.5.4

Oct 6, 2021

0.4.5.3

Sep 3, 2021

0.4.5.2

Sep 3, 2021

0.4.5.1

May 3, 2021

0.4.5

May 3, 2021

0.4.4

May 2, 2021

0.4.3

May 1, 2021

0.4.2

Apr 24, 2021

0.4.1

Apr 22, 2021

0.4.0

Apr 16, 2021

0.4b2 pre-release

Apr 16, 2021

0.4b1 pre-release

Apr 16, 2021

0.3.10

Mar 18, 2021

0.3.9

Dec 2, 2020

0.3.8.3

Nov 15, 2020

0.3.8.2

Oct 22, 2020

0.3.8.1

Sep 1, 2020

0.3.8

Jul 6, 2020

0.3.7

Jul 4, 2020

0.3.6

Jul 4, 2020

0.3.5.10

Jul 3, 2020

0.3.5.9

Jul 2, 2020

0.3.5.8

Jul 1, 2020

0.3.5.7

Jul 1, 2020

0.3.5.6

Jun 30, 2020

0.3.5.5

Jun 30, 2020

0.3.5.4

Jun 30, 2020

0.3.5.3

Jun 30, 2020

0.3.5.2

Jun 30, 2020

0.3.5.1

Jun 30, 2020

0.3.5

Jun 30, 2020

0.3.3

Jun 29, 2020

0.3.2

Jun 29, 2020

0.3.1.1

Jun 29, 2020

0.3.1

Jun 29, 2020

0.3.0

Jun 29, 2020

0.2.0.15

Jun 23, 2020

0.2.0.12

Oct 25, 2019

0.2.0.11

Oct 20, 2019

0.2.0.10

Oct 20, 2019

0.2.0.9

Jul 21, 2019

0.2.0.8

Jul 21, 2019

0.2.0.7

Jul 21, 2019

0.2.0.6

Jul 21, 2019

0.2.0.5

Apr 8, 2019

0.2.0.4

Jan 27, 2019

0.2.0.3

Jan 16, 2019

0.2.0.2

Jan 8, 2019

0.2.0.1

Dec 1, 2018

0.2

Dec 1, 2018

This version

0.2a3 pre-release

Jun 24, 2018

0.2a2 pre-release

Jun 24, 2018

0.2a1 pre-release

Jun 17, 2018

0.1

Apr 20, 2018

0.1b9 pre-release

Apr 12, 2018

0.1b8 pre-release

Apr 9, 2018

0.1b7 pre-release

Mar 21, 2018

0.1b6 pre-release

Mar 19, 2018

0.1b5 pre-release

Feb 10, 2018

0.1b4 pre-release

Feb 10, 2018

0.1b3 pre-release

Feb 4, 2018

0.1b2 pre-release

Jan 30, 2018

0.1b1 pre-release

Jan 28, 2018

0.1a32 pre-release

Jan 27, 2018

0.1a31 pre-release

Jan 25, 2018

0.1a30 pre-release

Jan 24, 2018

0.1a29 pre-release

Jan 7, 2018

0.1a28 pre-release

Jan 7, 2018

0.1a27 pre-release

Jan 6, 2018

0.1a26 pre-release

Jan 6, 2018

0.1a25 pre-release

Jan 6, 2018

0.1a24 pre-release

Jan 6, 2018

0.1a23 pre-release

Jan 6, 2018

0.1a22 pre-release

Jan 6, 2018

0.1a21 pre-release

Jan 6, 2018

0.1a20 pre-release

Jan 6, 2018

0.1a19 pre-release

Jan 6, 2018

0.1a18 pre-release

Jan 6, 2018

0.1a17 pre-release

Jan 6, 2018

0.1a16 pre-release

Jan 6, 2018

0.1a15 pre-release

Jan 6, 2018

0.1a14 pre-release

Jan 6, 2018

0.1a13 pre-release

Jan 6, 2018

0.1a12 pre-release

Jan 6, 2018

0.1a11 pre-release

Jan 6, 2018

0.1a10 pre-release

Jan 5, 2018

0.1a9 pre-release

Jan 5, 2018

0.1a8 pre-release

Jan 5, 2018

0.1a7 pre-release

Jan 5, 2018

0.1a6 pre-release

Jan 5, 2018

0.1a5 pre-release

Jan 5, 2018

0.1a4 pre-release

Jan 5, 2018

0.1a3 pre-release

Jan 5, 2018

0.1a2 pre-release

Jan 5, 2018

0.1a1 pre-release

Jan 3, 2018

Download files

Download the file for your platform. If you're not sure which to choose, learn more about installing packages.

Source Distribution

tfserver-0.2a3.tar.gz (9.3 kB view hashes)

Uploaded Jun 24, 2018 Source

Hashes for tfserver-0.2a3.tar.gz

Hashes for tfserver-0.2a3.tar.gz
Algorithm	Hash digest
SHA256	`604c403cfed2dc7c24c6867ad6223ca8e20d3dbd04ddaa072588daacf64eb8dd`
MD5	`75e8ecf67ac0ff80a7b34bd44adff096`
BLAKE2b-256	`edf68436ab28808b8946b44de807fcffd6676bb17d53ccc2482ae47925dd7581`