Got FC network stable on 3 bigger layers

Andy Zhang · Andy Zhang · commit 78a1dfb246eb · 2016-01-26T03:11:41.000-08:00
diff --git a/tensorflow/examples/udacity/3_regularization.ipynb b/tensorflow/examples/udacity/3_regularization.ipynb
@@ -20,7 +20,7 @@
   },
   {
    "cell_type": "code",
-   "execution_count": 2,
+   "execution_count": 1,
    "metadata": {
     "cellView": "both",
     "colab": {
@@ -54,7 +54,7 @@
   },
   {
    "cell_type": "code",
-   "execution_count": 3,
+   "execution_count": 2,
    "metadata": {
     "cellView": "both",
     "colab": {
@@ -131,7 +131,7 @@
   },
   {
    "cell_type": "code",
-   "execution_count": 4,
+   "execution_count": 3,
    "metadata": {
     "cellView": "both",
     "colab": {
@@ -196,7 +196,7 @@
   },
   {
    "cell_type": "code",
-   "execution_count": 5,
+   "execution_count": 4,
    "metadata": {
     "cellView": "both",
     "colab": {
@@ -589,75 +589,220 @@
    "cell_type": "code",
    "execution_count": 12,
    "metadata": {
-    "collapsed": false
+    "collapsed": false,
+    "scrolled": false
    },
    "outputs": [
     {
      "name": "stdout",
      "output_type": "stream",
      "text": [
       "Initialized\n",
-      "Minibatch loss at step 0 : 34718.1\n",
-      "Minibatch accuracy: 15.6%\n",
-      "Validation accuracy: 9.4%\n",
-      "Minibatch loss at step 1000 : 2.31229\n",
-      "Minibatch accuracy: 10.9%\n",
-      "Validation accuracy: 10.4%\n",
-      "Minibatch loss at step 2000 : 2.3071\n",
-      "Minibatch accuracy: 9.4%\n",
-      "Validation accuracy: 10.4%\n",
-      "Minibatch loss at step 3000 : 2.29897\n",
-      "Minibatch accuracy: 12.5%\n",
-      "Validation accuracy: 10.4%\n",
-      "Minibatch loss at step 4000 : 2.30373\n",
-      "Minibatch accuracy: 7.0%\n",
-      "Validation accuracy: 10.4%\n",
-      "Minibatch loss at step 5000 : 2.30152\n",
+      "Minibatch loss at step 0 : 58.3308\n",
       "Minibatch accuracy: 9.4%\n",
-      "Validation accuracy: 10.4%\n",
-      "Minibatch loss at step 6000 : 2.30267\n",
-      "Minibatch accuracy: 12.5%\n",
-      "Validation accuracy: 10.1%\n",
-      "Minibatch loss at step 7000 : 2.30219\n",
-      "Minibatch accuracy: 15.6%\n",
-      "Validation accuracy: 10.4%\n",
-      "Minibatch loss at step 8000 : 2.3031\n",
-      "Minibatch accuracy: 10.9%\n",
-      "Validation accuracy: 10.1%\n",
-      "Minibatch loss at step 9000 : 2.30252\n",
-      "Minibatch accuracy: 7.8%\n",
-      "Validation accuracy: 10.4%\n",
-      "Minibatch loss at step 10000 : 2.30177\n",
-      "Minibatch accuracy: 10.2%\n",
-      "Validation accuracy: 9.8%\n",
-      "Minibatch loss at step 11000 : 2.30296\n",
-      "Minibatch accuracy: 10.2%\n",
-      "Validation accuracy: 10.4%\n",
-      "Minibatch loss at step 12000 : 2.30295\n",
-      "Minibatch accuracy: 10.9%\n",
-      "Validation accuracy: 9.8%\n"
-     ]
-    },
-    {
-     "ename": "KeyboardInterrupt",
-     "evalue": "",
-     "output_type": "error",
-     "traceback": [
-      "\u001b[1;31m---------------------------------------------------------------------------\u001b[0m",
-      "\u001b[1;31mKeyboardInterrupt\u001b[0m                         Traceback (most recent call last)",
-      "\u001b[1;32m<ipython-input-12-6e5cff3f9f17>\u001b[0m in \u001b[0;36m<module>\u001b[1;34m()\u001b[0m\n\u001b[0;32m     73\u001b[0m     \u001b[0mfeed_dict\u001b[0m \u001b[1;33m=\u001b[0m \u001b[1;33m{\u001b[0m\u001b[0mtf_train_dataset\u001b[0m \u001b[1;33m:\u001b[0m \u001b[0mbatch_data\u001b[0m\u001b[1;33m,\u001b[0m \u001b[0mtf_train_labels\u001b[0m \u001b[1;33m:\u001b[0m \u001b[0mbatch_labels\u001b[0m\u001b[1;33m}\u001b[0m\u001b[1;33m\u001b[0m\u001b[0m\n\u001b[0;32m     74\u001b[0m     _, l, predictions = session.run(\n\u001b[1;32m---> 75\u001b[1;33m       [optimizer, loss, train_prediction], feed_dict=feed_dict)\n\u001b[0m\u001b[0;32m     76\u001b[0m     \u001b[1;32mif\u001b[0m \u001b[1;33m(\u001b[0m\u001b[0mstep\u001b[0m \u001b[1;33m%\u001b[0m \u001b[1;36m1000\u001b[0m \u001b[1;33m==\u001b[0m \u001b[1;36m0\u001b[0m\u001b[1;33m)\u001b[0m\u001b[1;33m:\u001b[0m\u001b[1;33m\u001b[0m\u001b[0m\n\u001b[0;32m     77\u001b[0m       \u001b[1;32mprint\u001b[0m \u001b[1;34m\"Minibatch loss at step\"\u001b[0m\u001b[1;33m,\u001b[0m \u001b[0mstep\u001b[0m\u001b[1;33m,\u001b[0m \u001b[1;34m\":\"\u001b[0m\u001b[1;33m,\u001b[0m \u001b[0ml\u001b[0m\u001b[1;33m\u001b[0m\u001b[0m\n",
-      "\u001b[1;32m/usr/local/lib/python2.7/dist-packages/tensorflow/python/client/session.pyc\u001b[0m in \u001b[0;36mrun\u001b[1;34m(self, fetches, feed_dict)\u001b[0m\n\u001b[0;32m    383\u001b[0m \u001b[1;33m\u001b[0m\u001b[0m\n\u001b[0;32m    384\u001b[0m     \u001b[1;31m# Run request and get response.\u001b[0m\u001b[1;33m\u001b[0m\u001b[1;33m\u001b[0m\u001b[0m\n\u001b[1;32m--> 385\u001b[1;33m     \u001b[0mresults\u001b[0m \u001b[1;33m=\u001b[0m \u001b[0mself\u001b[0m\u001b[1;33m.\u001b[0m\u001b[0m_do_run\u001b[0m\u001b[1;33m(\u001b[0m\u001b[0mtarget_list\u001b[0m\u001b[1;33m,\u001b[0m \u001b[0munique_fetch_targets\u001b[0m\u001b[1;33m,\u001b[0m \u001b[0mfeed_dict_string\u001b[0m\u001b[1;33m)\u001b[0m\u001b[1;33m\u001b[0m\u001b[0m\n\u001b[0m\u001b[0;32m    386\u001b[0m \u001b[1;33m\u001b[0m\u001b[0m\n\u001b[0;32m    387\u001b[0m     \u001b[1;31m# User may have fetched the same tensor multiple times, but we\u001b[0m\u001b[1;33m\u001b[0m\u001b[1;33m\u001b[0m\u001b[0m\n",
-      "\u001b[1;32m/usr/local/lib/python2.7/dist-packages/tensorflow/python/client/session.pyc\u001b[0m in \u001b[0;36m_do_run\u001b[1;34m(self, target_list, fetch_list, feed_dict)\u001b[0m\n\u001b[0;32m    443\u001b[0m \u001b[1;33m\u001b[0m\u001b[0m\n\u001b[0;32m    444\u001b[0m       return tf_session.TF_Run(self._session, feed_dict, fetch_list,\n\u001b[1;32m--> 445\u001b[1;33m                                target_list)\n\u001b[0m\u001b[0;32m    446\u001b[0m \u001b[1;33m\u001b[0m\u001b[0m\n\u001b[0;32m    447\u001b[0m     \u001b[1;32mexcept\u001b[0m \u001b[0mtf_session\u001b[0m\u001b[1;33m.\u001b[0m\u001b[0mStatusNotOK\u001b[0m \u001b[1;32mas\u001b[0m \u001b[0me\u001b[0m\u001b[1;33m:\u001b[0m\u001b[1;33m\u001b[0m\u001b[0m\n",
-      "\u001b[1;31mKeyboardInterrupt\u001b[0m: "
+      "Validation accuracy: 11.2%\n",
+      "Minibatch loss at step 1000 : 2.46086\n",
+      "Minibatch accuracy: 23.4%\n",
+      "Validation accuracy: 37.1%\n",
+      "Minibatch loss at step 2000 : 1.79268\n",
+      "Minibatch accuracy: 35.9%\n",
+      "Validation accuracy: 49.8%\n",
+      "Minibatch loss at step 3000 : 1.76012\n",
+      "Minibatch accuracy: 44.5%\n",
+      "Validation accuracy: 56.3%\n",
+      "Minibatch loss at step 4000 : 1.49048\n",
+      "Minibatch accuracy: 50.0%\n",
+      "Validation accuracy: 60.7%\n",
+      "Minibatch loss at step 5000 : 1.35661\n",
+      "Minibatch accuracy: 53.1%\n",
+      "Validation accuracy: 64.0%\n",
+      "Minibatch loss at step 6000 : 1.53\n",
+      "Minibatch accuracy: 50.0%\n",
+      "Validation accuracy: 66.7%\n",
+      "Minibatch loss at step 7000 : 1.16328\n",
+      "Minibatch accuracy: 63.3%\n",
+      "Validation accuracy: 69.6%\n",
+      "Minibatch loss at step 8000 : 1.34582\n",
+      "Minibatch accuracy: 63.3%\n",
+      "Validation accuracy: 70.1%\n",
+      "Minibatch loss at step 9000 : 1.13307\n",
+      "Minibatch accuracy: 60.2%\n",
+      "Validation accuracy: 72.8%\n",
+      "Minibatch loss at step 10000 : 1.1888\n",
+      "Minibatch accuracy: 63.3%\n",
+      "Validation accuracy: 73.5%\n",
+      "Minibatch loss at step 11000 : 1.30667\n",
+      "Minibatch accuracy: 54.7%\n",
+      "Validation accuracy: 75.2%\n",
+      "Minibatch loss at step 12000 : 1.19186\n",
+      "Minibatch accuracy: 65.6%\n",
+      "Validation accuracy: 76.1%\n",
+      "Minibatch loss at step 13000 : 1.23864\n",
+      "Minibatch accuracy: 64.8%\n",
+      "Validation accuracy: 76.9%\n",
+      "Minibatch loss at step 14000 : 1.00669\n",
+      "Minibatch accuracy: 69.5%\n",
+      "Validation accuracy: 77.0%\n",
+      "Minibatch loss at step 15000 : 0.854794\n",
+      "Minibatch accuracy: 72.7%\n",
+      "Validation accuracy: 77.7%\n",
+      "Minibatch loss at step 16000 : 0.820268\n",
+      "Minibatch accuracy: 78.9%\n",
+      "Validation accuracy: 78.0%\n",
+      "Minibatch loss at step 17000 : 0.841344\n",
+      "Minibatch accuracy: 74.2%\n",
+      "Validation accuracy: 78.8%\n",
+      "Minibatch loss at step 18000 : 0.783495\n",
+      "Minibatch accuracy: 77.3%\n",
+      "Validation accuracy: 78.8%\n",
+      "Minibatch loss at step 19000 : 0.999198\n",
+      "Minibatch accuracy: 71.1%\n",
+      "Validation accuracy: 79.2%\n",
+      "Minibatch loss at step 20000 : 0.834015\n",
+      "Minibatch accuracy: 72.7%\n",
+      "Validation accuracy: 79.7%\n",
+      "Minibatch loss at step 21000 : 0.929157\n",
+      "Minibatch accuracy: 71.9%\n",
+      "Validation accuracy: 79.8%\n",
+      "Minibatch loss at step 22000 : 0.705838\n",
+      "Minibatch accuracy: 77.3%\n",
+      "Validation accuracy: 80.4%\n",
+      "Minibatch loss at step 23000 : 0.806978\n",
+      "Minibatch accuracy: 73.4%\n",
+      "Validation accuracy: 80.6%\n",
+      "Minibatch loss at step 24000 : 0.700855\n",
+      "Minibatch accuracy: 78.1%\n",
+      "Validation accuracy: 80.8%\n",
+      "Minibatch loss at step 25000 : 0.850926\n",
+      "Minibatch accuracy: 76.6%\n",
+      "Validation accuracy: 80.8%\n",
+      "Minibatch loss at step 26000 : 0.92411\n",
+      "Minibatch accuracy: 71.9%\n",
+      "Validation accuracy: 81.1%\n",
+      "Minibatch loss at step 27000 : 0.870534\n",
+      "Minibatch accuracy: 73.4%\n",
+      "Validation accuracy: 81.2%\n",
+      "Minibatch loss at step 28000 : 0.655592\n",
+      "Minibatch accuracy: 79.7%\n",
+      "Validation accuracy: 81.5%\n",
+      "Minibatch loss at step 29000 : 0.650673\n",
+      "Minibatch accuracy: 79.7%\n",
+      "Validation accuracy: 81.7%\n",
+      "Minibatch loss at step 30000 : 0.575677\n",
+      "Minibatch accuracy: 79.7%\n",
+      "Validation accuracy: 81.9%\n",
+      "Minibatch loss at step 31000 : 0.754482\n",
+      "Minibatch accuracy: 77.3%\n",
+      "Validation accuracy: 81.6%\n",
+      "Minibatch loss at step 32000 : 0.647639\n",
+      "Minibatch accuracy: 80.5%\n",
+      "Validation accuracy: 82.2%\n",
+      "Minibatch loss at step 33000 : 0.6582\n",
+      "Minibatch accuracy: 80.5%\n",
+      "Validation accuracy: 82.4%\n",
+      "Minibatch loss at step 34000 : 0.517049\n",
+      "Minibatch accuracy: 85.2%\n",
+      "Validation accuracy: 82.3%\n",
+      "Minibatch loss at step 35000 : 0.555218\n",
+      "Minibatch accuracy: 83.6%\n",
+      "Validation accuracy: 82.5%\n",
+      "Minibatch loss at step 36000 : 0.674287\n",
+      "Minibatch accuracy: 82.0%\n",
+      "Validation accuracy: 82.6%\n",
+      "Minibatch loss at step 37000 : 0.54334\n",
+      "Minibatch accuracy: 85.2%\n",
+      "Validation accuracy: 82.7%\n",
+      "Minibatch loss at step 38000 : 0.626048\n",
+      "Minibatch accuracy: 79.7%\n",
+      "Validation accuracy: 82.9%\n",
+      "Minibatch loss at step 39000 : 0.651072\n",
+      "Minibatch accuracy: 77.3%\n",
+      "Validation accuracy: 83.0%\n",
+      "Minibatch loss at step 40000 : 0.625448\n",
+      "Minibatch accuracy: 84.4%\n",
+      "Validation accuracy: 83.2%\n",
+      "Minibatch loss at step 41000 : 0.689314\n",
+      "Minibatch accuracy: 77.3%\n",
+      "Validation accuracy: 83.3%\n",
+      "Minibatch loss at step 42000 : 0.657324\n",
+      "Minibatch accuracy: 80.5%\n",
+      "Validation accuracy: 83.3%\n",
+      "Minibatch loss at step 43000 : 0.774549\n",
+      "Minibatch accuracy: 75.0%\n",
+      "Validation accuracy: 83.3%\n",
+      "Minibatch loss at step 44000 : 0.592654\n",
+      "Minibatch accuracy: 83.6%\n",
+      "Validation accuracy: 83.7%\n",
+      "Minibatch loss at step 45000 : 0.635808\n",
+      "Minibatch accuracy: 78.1%\n",
+      "Validation accuracy: 83.8%\n",
+      "Minibatch loss at step 46000 : 0.401504\n",
+      "Minibatch accuracy: 86.7%\n",
+      "Validation accuracy: 83.6%\n",
+      "Minibatch loss at step 47000 : 0.561845\n",
+      "Minibatch accuracy: 81.2%\n",
+      "Validation accuracy: 83.7%\n",
+      "Minibatch loss at step 48000 : 0.55333\n",
+      "Minibatch accuracy: 80.5%\n",
+      "Validation accuracy: 83.8%\n",
+      "Minibatch loss at step 49000 : 0.649688\n",
+      "Minibatch accuracy: 81.2%\n",
+      "Validation accuracy: 84.0%\n",
+      "Minibatch loss at step 50000 : 0.565368\n",
+      "Minibatch accuracy: 82.8%\n",
+      "Validation accuracy: 84.0%\n",
+      "Minibatch loss at step 51000 : 0.391173\n",
+      "Minibatch accuracy: 89.1%\n",
+      "Validation accuracy: 84.1%\n",
+      "Minibatch loss at step 52000 : 0.459594\n",
+      "Minibatch accuracy: 85.9%\n",
+      "Validation accuracy: 84.1%\n",
+      "Minibatch loss at step 53000 : 0.576485\n",
+      "Minibatch accuracy: 78.1%\n",
+      "Validation accuracy: 84.3%\n",
+      "Minibatch loss at step 54000 : 0.572356\n",
+      "Minibatch accuracy: 85.2%\n",
+      "Validation accuracy: 84.3%\n",
+      "Minibatch loss at step 55000 : 0.581976\n",
+      "Minibatch accuracy: 82.8%\n",
+      "Validation accuracy: 84.4%\n",
+      "Minibatch loss at step 56000 : 0.526539\n",
+      "Minibatch accuracy: 83.6%\n",
+      "Validation accuracy: 84.5%\n",
+      "Minibatch loss at step 57000 : 0.366597\n",
+      "Minibatch accuracy: 88.3%\n",
+      "Validation accuracy: 84.4%\n",
+      "Minibatch loss at step 58000 : 0.413548\n",
+      "Minibatch accuracy: 85.9%\n",
+      "Validation accuracy: 84.5%\n",
+      "Minibatch loss at step 59000 : 0.522779\n",
+      "Minibatch accuracy: 84.4%\n",
+      "Validation accuracy: 84.6%\n",
+      "Minibatch loss at step 60000 : 0.474158\n",
+      "Minibatch accuracy: 88.3%\n",
+      "Validation accuracy: 84.7%\n",
+      "Minibatch loss at step 61000 : 0.493542\n",
+      "Minibatch accuracy: 85.9%\n",
+      "Validation accuracy: 84.6%\n",
+      "Minibatch loss at step 62000 : 0.655646\n",
+      "Minibatch accuracy: 79.7%\n",
+      "Validation accuracy: 84.8%\n",
+      "Minibatch loss at step 63000 : 0.410069\n",
+      "Minibatch accuracy: 85.9%\n",
+      "Validation accuracy: 84.9%\n",
+      "Minibatch loss at step 64000 : 0.577193\n",
+      "Minibatch accuracy: 80.5%\n",
+      "Validation accuracy: 84.9%\n",
+      "Test accuracy: 91.6%\n"
      ]
     }
    ],
    "source": [
     "num_steps = 64001\n",
     "batch_size = 128\n",
-    "hidden_size_1 = 1024\n",
-    "hidden_size_2 = 300\n",
-    "hidden_size_3 = 50\n",
+    "hidden_size_1 = 256\n",
+    "hidden_size_2 = 128\n",
+    "hidden_size_3 = 64\n",
     "reg_term=0.001\n",
     "keep_prob=0.8\n",
     "\n",
@@ -683,17 +828,16 @@
     "\n",
     "  # Training computation.\n",
     "  def multi_layer_logit(input_dataset, keep_prob=keep_prob):\n",
-    "    hidden_1 = tf.nn.dropout(tf.nn.relu(tf.matmul(input_dataset, weights_h_1) + biases_h_1), keep_prob)\n",
-    "    hidden_2 = tf.nn.dropout(tf.nn.relu(tf.matmul(hidden_1, weights_h_2) + biases_h_2), keep_prob)\n",
-    "    hidden_3 = tf.nn.dropout(tf.nn.relu(tf.matmul(hidden_2, weights_h_3) + biases_h_3), keep_prob)      \n",
+    "    hidden_1 = tf.nn.dropout(tf.nn.relu6(tf.matmul(input_dataset, weights_h_1) + biases_h_1), keep_prob)\n",
+    "    hidden_2 = tf.nn.dropout(tf.nn.relu6(tf.matmul(hidden_1, weights_h_2) + biases_h_2), keep_prob)\n",
+    "    hidden_3 = tf.nn.dropout(tf.nn.relu6(tf.matmul(hidden_2, weights_h_3) + biases_h_3), keep_prob)      \n",
     "\n",
     "    logits = tf.matmul(hidden_3, weights_y) + biases_y\n",
     "    return logits\n",
     "\n",
-    "  logits = multi_layer_logit(tf_train_dataset, keep_prob=0.5)\n",
-    "  epsilon = 1e-9\n",
+    "  logits = multi_layer_logit(tf_train_dataset, keep_prob=keep_prob)\n",
     "  loss = tf.reduce_mean(\n",
-    "    tf.nn.softmax_cross_entropy_with_logits(logits + epsilon, tf_train_labels))\n",
+    "    tf.nn.softmax_cross_entropy_with_logits(logits + 1e-12, tf_train_labels))\n",
     "  \n",
     "  loss_with_reg = loss + reg_term * (\n",
     "        tf.nn.l2_loss(weights_h_1) +\n",
@@ -704,7 +848,7 @@
     "\n",
     "  # Optimizer.\n",
     "  global_step = tf.Variable(0)\n",
-    "  learning_rate = tf.train.exponential_decay(0.01, global_step, 10000, 0.95)\n",
+    "  learning_rate = tf.train.exponential_decay(0.05, global_step, 1000, 0.98)\n",
     "  optimizer = tf.train.GradientDescentOptimizer(learning_rate).minimize(loss_with_reg, global_step=global_step)\n",
     "\n",
     "  # Predictions for the training, validation, and test data.\n",