Merge pull request GoogleCloudPlatform#9 from lukmanr/lukmanr-patch-1

ksalama · web-flow · commit e7938c0d73d6 · 2018-11-01T19:55:55.000Z
Updates for Keras code in Optimizing TF Serving post
diff --git a/00_Miscellaneous/model_optimisation/Tutorial - TensorFlow Model Optimisation for Serving - MNIST with Keras.ipynb b/00_Miscellaneous/model_optimisation/Tutorial - TensorFlow Model Optimisation for Serving - MNIST with Keras.ipynb
@@ -396,7 +396,9 @@
     "if tf.gfile.Exists(model_dir):\n",
     "    print(\"Removing previous artifacts...\")\n",
     "    tf.gfile.DeleteRecursively(model_dir)\n",
-    "    \n",
+    "\n",
+    "os.makedirs(model_dir)\n",
+    "\n",
     "estimator = run_experiment(params, run_config)"
    ]
   },
@@ -586,7 +588,8 @@
     }
    ],
    "source": [
-    "saved_model_dir = os.path.join(export_dir, os.listdir(export_dir)[-1]) \n",
+    "saved_model_dir = os.path.join(\n",
+    "    export_dir, [f for f in os.listdir(export_dir) if f.isdigit()][0])\n",
     "print(saved_model_dir)\n",
     "inference_test(saved_model_dir)"
    ]
diff --git a/00_Miscellaneous/model_optimisation/graph_keras.png b/00_Miscellaneous/model_optimisation/graph_keras.png
diff --git a/00_Miscellaneous/model_optimisation/inference_test.py b/00_Miscellaneous/model_optimisation/inference_test.py
@@ -39,6 +39,7 @@
     discoveryServiceUrl=DISCOVERY_URL
 )
 
+
 def load_mnist_data():
   mnist = tf.contrib.learn.datasets.load_dataset('mnist')
   train_data = mnist.train.images
@@ -48,6 +49,11 @@ def load_mnist_data():
   return train_data, train_labels, eval_data, eval_labels
 
 
+def load_mnist_keras():
+  (train_data, train_labels), (eval_data, eval_labels) = tf.keras.datasets.mnist.load_data()
+  return train_data, train_labels, eval_data, eval_labels
+
+
 def inference_tfserving(eval_data, batch=BATCH_SIZE, repeat=10, signature='predict'):
   url = 'http://localhost:8501/v1/models/mnist_classifier:predict'
 
@@ -57,7 +63,10 @@ def inference_tfserving(eval_data, batch=BATCH_SIZE, repeat=10, signature='predi
                   'instances': instances}
 
   time_start = datetime.utcnow()
-  for i in range(repeat):
+  response = requests.post(url, data=json.dumps(request_data))
+  if response.status_code != 200:
+    raise Exception("Bad response status from TF Serving instance: %d" % response.status_code)
+  for i in range(repeat-1):
     response = requests.post(url, data=json.dumps(request_data))
   time_end = datetime.utcnow()
   time_elapsed_sec = (time_end - time_start).total_seconds()
diff --git a/00_Miscellaneous/model_optimisation/optimize_graph.py b/00_Miscellaneous/model_optimisation/optimize_graph.py
@@ -107,7 +107,7 @@ def _metric_fn(labels, predictions):
 
 #### Run Experiment
 
-def run_experiment(hparams, train_data, train_labels, run_config):
+def run_experiment(hparams, train_data, train_labels, run_config, create_estimator_fn=create_estimator):
   train_spec = tf.estimator.TrainSpec(
       input_fn = tf.estimator.inputs.numpy_input_fn(
           x={'input_image': train_data},
@@ -134,7 +134,7 @@ def run_experiment(hparams, train_data, train_labels, run_config):
   print('Experiment started at {}'.format(time_start.strftime('%H:%M:%S')))
   print('.......................................')
 
-  estimator = create_estimator(hparams, run_config)
+  estimator = create_estimator_fn(hparams, run_config)
 
   tf.estimator.train_and_evaluate(
       estimator=estimator,
@@ -219,7 +219,8 @@ def describe_graph(graph_def, show_nodes=False):
   print('')
   print('Unused Nodes: {}'.format([node.name for node in graph_def.node if 'unused'  in node.name]))
   print('')
-  print('Output Nodes: {}'.format( [node.name for node in graph_def.node if 'predictions' in node.name]))
+  print('Output Nodes: {}'.format(
+      [node.name for node in graph_def.node if ('predictions' in node.name or 'softmax' in node.name)]))
   print('')
   print('Quantization Nodes: {}'.format( [node.name for node in graph_def.node if 'quant' in node.name]))
   print('')
@@ -285,7 +286,9 @@ def optimize_graph(model_dir, graph_filename, transforms, output_node):
                       logdir=model_dir,
                       as_text=False,
                       name='optimized_model.pb')
+  print('****************************************')
   print('Graph optimized!')
+  print('****************************************')
 
 
 def freeze_model(saved_model_dir, output_node_names, output_filename):
@@ -306,10 +309,12 @@ def freeze_model(saved_model_dir, output_node_names, output_filename):
       clear_devices=False,
       input_meta_graph=False,
   )
+  print('****************************************')
   print('graph freezed!')
+  print('****************************************')
 
 
-def convert_graph_def_to_saved_model(export_dir, graph_filepath):
+def convert_graph_def_to_saved_model(export_dir, graph_filepath, output_key, output_node_name):
   if tf.gfile.Exists(export_dir):
     tf.gfile.DeleteRecursively(export_dir)
   graph_def = get_graph_def_from_file(graph_filepath)
@@ -322,10 +327,12 @@ def convert_graph_def_to_saved_model(export_dir, graph_filepath):
             node.name: session.graph.get_tensor_by_name(
                 '{}:0'.format(node.name))
             for node in graph_def.node if node.op=='Placeholder'},
-        outputs={'class_ids': session.graph.get_tensor_by_name(
-            'head/predictions/class_ids:0')}
+        outputs={output_key: session.graph.get_tensor_by_name(
+            output_node_name)}
     )
+    print('****************************************')
     print('Optimized graph converted to SavedModel!')
+    print('****************************************')
 
 
 def setup_model():
@@ -405,7 +412,8 @@ def main(args):
 
     # convert to saved model and output metagraph again
     optimized_export_dir = os.path.join(export_dir, 'optimized')
-    convert_graph_def_to_saved_model(optimized_export_dir, optimized_filepath)
+    convert_graph_def_to_saved_model(optimized_export_dir, optimized_filepath, 'class_ids',
+                                     'head/predictions/class_ids:0')
     get_size(optimized_export_dir, 'saved_model.pb')
     get_metagraph(optimized_export_dir)
 
diff --git a/00_Miscellaneous/model_optimisation/optimize_graph_keras.py b/00_Miscellaneous/model_optimisation/optimize_graph_keras.py
@@ -0,0 +1,207 @@
+# Copyright 2018 Google Inc. All Rights Reserved.
+#
+# Licensed under the Apache License, Version 2.0 (the "License");
+# you may not use this file except in compliance with the License.
+# You may obtain a copy of the License at
+#
+#     http://www.apache.org/licenses/LICENSE-2.0
+#
+# Unless required by applicable law or agreed to in writing, software
+# distributed under the License is distributed on an "AS IS" BASIS,
+# WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
+# See the License for the specific language governing permissions and
+# limitations under the License.
+
+""" Extract from notebook for Serving Optimization on Keras """
+
+from __future__ import print_function
+
+from datetime import datetime
+import os
+import sh
+import sys
+import tensorflow as tf
+from tensorflow import data
+from tensorflow.python.saved_model import tag_constants
+from tensorflow.python.tools import freeze_graph
+from tensorflow.python import ops
+from tensorflow.tools.graph_transforms import TransformGraph
+
+from inference_test import inference_test, load_mnist_keras
+from optimize_graph import (run_experiment, get_graph_def_from_saved_model,
+    describe_graph, get_size, get_metagraph, get_graph_def_from_file,
+    convert_graph_def_to_saved_model, freeze_model, optimize_graph, TRANSFORMS)
+
+NUM_CLASSES = 10
+MODELS_LOCATION = 'models/mnist'
+MODEL_NAME = 'keras_classifier'
+
+
+def keras_model_fn(params):
+
+  inputs = tf.keras.layers.Input(shape=(28, 28), name='input_image')
+  input_layer = tf.keras.layers.Reshape(target_shape=(28, 28, 1), name='reshape')(inputs)
+
+  # convolutional layers
+  conv_inputs = input_layer
+  for i in range(params.num_conv_layers):
+    filters = params.init_filters * (2**i)
+    conv = tf.keras.layers.Conv2D(kernel_size=3, filters=filters, strides=1, padding='SAME', activation='relu')(conv_inputs)
+    max_pool = tf.keras.layers.MaxPool2D(pool_size=2, strides=2, padding='SAME')(conv)
+    batch_norm = tf.keras.layers.BatchNormalization()(max_pool)
+    conv_inputs = batch_norm
+
+  flatten = tf.keras.layers.Flatten(name='flatten')(conv_inputs)
+
+  # fully-connected layers
+  dense_inputs = flatten
+  for i in range(len(params.hidden_units)):
+    dense = tf.keras.layers.Dense(units=params.hidden_units[i], activation='relu')(dense_inputs)
+    dropout = tf.keras.layers.Dropout(params.dropout)(dense)
+    dense_inputs = dropout
+
+  # softmax classifier
+  logits = tf.keras.layers.Dense(units=NUM_CLASSES, name='logits')(dense_inputs)
+  softmax = tf.keras.layers.Activation('softmax', name='softmax')(logits)
+
+  # keras model
+  model = tf.keras.models.Model(inputs, softmax)
+  return model
+
+
+def create_estimator_keras(params, run_config):
+
+  keras_model = keras_model_fn(params)
+  print(keras_model.summary())
+
+  optimizer = tf.keras.optimizers.Adam(lr=params.learning_rate)
+  keras_model.compile(loss='sparse_categorical_crossentropy', optimizer='adam', metrics=['accuracy'])
+  mnist_classifier = tf.keras.estimator.model_to_estimator(
+      keras_model=keras_model,
+      config=run_config
+  )
+
+  return mnist_classifier
+
+
+#### Train and Export Model
+
+def train_and_export_model(train_data, train_labels):
+  model_dir = os.path.join(MODELS_LOCATION, MODEL_NAME)
+
+  hparams  = tf.contrib.training.HParams(
+      batch_size=100,
+      hidden_units=[512, 512],
+      num_conv_layers=3,
+      init_filters=64,
+      dropout=0.2,
+      max_training_steps=50,
+      eval_throttle_secs=10,
+      learning_rate=1e-3,
+      debug=True
+  )
+
+  run_config = tf.estimator.RunConfig(
+      tf_random_seed=19830610,
+      save_checkpoints_steps=1000,
+      keep_checkpoint_max=3,
+      model_dir=model_dir
+  )
+
+  if tf.gfile.Exists(model_dir):
+      print('Removing previous artifacts...')
+      tf.gfile.DeleteRecursively(model_dir)
+
+  os.makedirs(model_dir)
+
+  estimator = run_experiment(hparams, train_data, train_labels, run_config, create_estimator_keras)
+
+  def make_serving_input_receiver_fn():
+      inputs = {'input_image': tf.placeholder(
+          shape=[None,28,28], dtype=tf.float32, name='serving_input_image')}
+      return tf.estimator.export.build_raw_serving_input_receiver_fn(inputs)
+
+  export_dir = os.path.join(model_dir, 'export')
+
+  if tf.gfile.Exists(export_dir):
+      tf.gfile.DeleteRecursively(export_dir)
+
+  estimator.export_savedmodel(
+      export_dir_base=export_dir,
+      serving_input_receiver_fn=make_serving_input_receiver_fn()
+  )
+
+  return export_dir
+
+
+def setup_model():
+  train_data, train_labels, eval_data, eval_labels = load_mnist_keras()
+  export_dir = train_and_export_model(train_data, train_labels)
+  return export_dir, eval_data
+
+
+NUM_TRIALS = 10
+
+def main(args):
+  if len(args) > 1 and args[1] == '--inference':
+    export_dir = args[2]
+    _, _, eval_data, _ = load_mnist_keras()
+
+    total_load_time = 0.0
+    total_serve_time = 0.0
+    saved_model_dir = os.path.join(
+        export_dir, [f for f in os.listdir(export_dir) if f.isdigit()][0])
+    for i in range(0, NUM_TRIALS):
+      load_time, serving_time = inference_test(saved_model_dir, eval_data, repeat=10000)
+      total_load_time += load_time
+      total_serve_time += serving_time
+
+    print("****************************************")
+    print("*** Load time on original model: {:.2f}".format(total_load_time / NUM_TRIALS))
+    print("*** Serve time on original model: {:.2f}".format(total_serve_time / NUM_TRIALS))
+    print("****************************************")
+
+    total_load_time = 0.0
+    total_serve_time = 0.0
+    optimized_export_dir = os.path.join(export_dir, 'optimized')
+    for i in range(0, NUM_TRIALS):
+      load_time, serving_time = inference_test(optimized_export_dir, eval_data,
+                                               signature='serving_default',
+                                               repeat=10000)
+      total_load_time += load_time
+      total_serve_time += serving_time
+    print("****************************************")
+    print("*** Load time on optimized model: {:.2f}".format(total_load_time / NUM_TRIALS))
+    print("*** Serve time on optimized model: {:.2f}".format(total_serve_time / NUM_TRIALS))
+    print("****************************************")
+
+  else:
+    # generate and output original model
+    export_dir, eval_data = setup_model()
+    saved_model_dir = os.path.join(export_dir, os.listdir(export_dir)[-1])
+    describe_graph(get_graph_def_from_saved_model(saved_model_dir))
+    get_size(saved_model_dir, 'saved_model.pb')
+    get_metagraph(saved_model_dir)
+
+    # freeze model and describe it
+    freeze_model(saved_model_dir, 'softmax/Softmax', 'frozen_model.pb')
+    frozen_filepath = os.path.join(saved_model_dir, 'frozen_model.pb')
+    describe_graph(get_graph_def_from_file(frozen_filepath))
+    get_size(saved_model_dir, 'frozen_model.pb', include_vars=False)
+
+    # optimize model and describe it
+    optimize_graph(saved_model_dir, 'frozen_model.pb', TRANSFORMS, 'softmax/Softmax')
+    optimized_filepath = os.path.join(saved_model_dir, 'optimized_model.pb')
+    describe_graph(get_graph_def_from_file(optimized_filepath))
+    get_size(saved_model_dir, 'optimized_model.pb', include_vars=False)
+
+    # convert to saved model and output metagraph again
+    optimized_export_dir = os.path.join(export_dir, 'optimized')
+    convert_graph_def_to_saved_model(optimized_export_dir, optimized_filepath,
+                                     'softmax', 'softmax/Softmax:0')
+    get_size(optimized_export_dir, 'saved_model.pb')
+    get_metagraph(optimized_export_dir)
+
+
+if __name__ == '__main__':
+  main(sys.argv)
diff --git a/00_Miscellaneous/model_optimisation/tfserving.sh b/00_Miscellaneous/model_optimisation/tfserving.sh
@@ -17,7 +17,7 @@
 rm -rf /tmp/tfserving
 mkdir -p /tmp/tfserving
 
-saved_models_base=models/mnist/cnn_classifier/export
+saved_models_base=models/mnist/keras_classifier/export
 
 if [[ $# == 0 ]]; then
   saved_model_dir=${saved_models_base}/$(ls ${saved_models_base} | head -n 1)
diff --git a/INSTALL.md b/INSTALL.md
@@ -20,8 +20,11 @@ https://cloud.google.com/compute/quotas
 
 ### If you have P100 quota and wish to use GPUs
 
+```
 export IMAGE_NAME="tf-latest-cu92"
+```
 
+```
 gcloud beta compute instances create ${HOST_NAME} \
  --project=${PROJECT} \
  --zone=${ZONE} \
@@ -39,8 +42,11 @@ gcloud beta compute instances create ${HOST_NAME} \
 
 ### If you don't have quota, or don't want to use GPUs
 
+```
 export IMAGE_NAME="tf-latest-cpu"
+```
 
+```
 gcloud beta compute instances create ${HOST_NAME} \
  --project=${PROJECT} \
  --zone=${ZONE} \