upload fc

L1aoXingyu · L1aoXingyu · commit 3e647e756b7e · 2017-07-13T21:12:56.000+08:00
diff --git a/.gitignore b/.gitignore
@@ -3,3 +3,4 @@ __pycache__
 .ipynb_checkpoints
 img
 data
+chapter3_MLP/3_Neural_Network/.desktop
diff --git a/chapter3_MLP/3_Neural_Network/net.py b/chapter3_MLP/3_Neural_Network/net.py
@@ -0,0 +1,49 @@
+from torch import nn
+
+
+class simpleNet(nn.Module):
+    def __init__(self, in_dim, n_hidden_1, n_hidden_2, out_dim):
+        super(simpleNet, self).__init__()
+        self.layer1 = nn.Linear(in_dim, n_hidden_1)
+        self.layer2 = nn.Linear(n_hidden_1, n_hidden_2)
+        self.layer3 = nn.Linear(n_hidden_2, out_dim)
+
+    def forward(self, x):
+        x = self.layer1(x)
+        x = self.layer2(x)
+        x = self.layer3(x)
+        return x
+
+
+class Activation_Net(nn.Module):
+    def __init__(self, in_dim, n_hidden_1, n_hidden_2, out_dim):
+        super(NeuralNetwork, self).__init__()
+        self.layer1 = nn.Sequential(
+            nn.Linear(in_dim, n_hidden_1), nn.ReLU(True))
+        self.layer2 = nn.Sequential(
+            nn.Linear(n_hidden_1, n_hidden_2), nn.ReLU(True))
+        self.layer3 = nn.Sequential(nn.Linear(n_hidden_2, out_dim))
+
+    def forward(self, x):
+        x = self.layer1(x)
+        x = self.layer2(x)
+        x = self.layer3(x)
+        return x
+
+
+class Batch_Net(nn.Module):
+    def __init__(self, in_dim, n_hidden_1, n_hidden_2, out_dim):
+        super(Batch_Net, self).__init__()
+        self.layer1 = nn.Sequential(
+            nn.Linear(in_dim, n_hidden_1),
+            nn.ReLU(True), nn.BatchNorm1d(n_hidden_1))
+        self.layer2 = nn.Sequential(
+            nn.Linear(n_hidden_1, n_hidden_2),
+            nn.ReLU(True), nn.BatchNorm1d(n_hidden_2))
+        self.layer3 = nn.Sequential(nn.Linear(n_hidden_2, out_dim))
+
+    def forward(self, x):
+        x = self.layer1(x)
+        x = self.layer2(x)
+        x = self.layer3(x)
+        return x
diff --git a/chapter3_MLP/3_Neural_Network/train.py b/chapter3_MLP/3_Neural_Network/train.py
@@ -0,0 +1,96 @@
+__author__ = 'SherlockLiao'
+
+import torch
+from torch import nn, optim
+from torch.autograd import Variable
+from torch.utils.data import DataLoader
+from torchvision import datasets, transforms
+
+import net
+
+# 超参数(Hyperparameters)
+batch_size = 64
+learning_rate = 1e-2
+num_epoches = 20
+
+# 数据预处理
+data_tf = transforms.Compose([
+    transforms.ToTensor(),
+    transforms.Normalize([0.5, 0.5, 0.5], [0.5, 0.5, 0.5])
+])
+# 下载训练集 MNIST 手写数字训练集
+train_dataset = datasets.MNIST(
+    root='./data', train=True, transform=data_tf, download=True)
+
+test_dataset = datasets.MNIST(root='./data', train=False, transform=data_tf)
+
+train_loader = DataLoader(train_dataset, batch_size=batch_size, shuffle=True)
+test_loader = DataLoader(test_dataset, batch_size=batch_size, shuffle=False)
+
+model = net.Batch_Net(28 * 28, 300, 100, 10)
+if torch.cuda.is_available():
+    model = model.cuda()
+
+criterion = nn.CrossEntropyLoss()
+optimizer = optim.SGD(model.parameters(), lr=learning_rate)
+
+for epoch in range(num_epoches):
+    print('epoch {}'.format(epoch + 1))
+    print('*' * 10)
+    running_loss = 0.0
+    running_acc = 0.0
+    for i, data in enumerate(train_loader, 1):
+        img, label = data
+        img = img.view(img.size(0), -1)
+        if torch.cuda.is_available():
+            img = Variable(img).cuda()
+            label = Variable(label).cuda()
+        else:
+            img = Variable(img)
+            label = Variable(label)
+        # 向前传播
+        out = model(img)
+        loss = criterion(out, label)
+        running_loss += loss.data[0] * label.size(0)
+        _, pred = torch.max(out, 1)
+        num_correct = (pred == label).sum()
+        running_acc += num_correct.data[0]
+        # 向后传播
+        optimizer.zero_grad()
+        loss.backward()
+        optimizer.step()
+
+        if i % 300 == 0:
+            print('[{}/{}] Loss: {:.6f}, Acc: {:.6f}'.format(
+                i,
+                len(train_loader), running_loss / (batch_size * i), running_acc
+                / (batch_size * i)))
+    print('Finish {} epoch, Loss: {:.6f}, Acc: {:.6f}'.format(
+        epoch + 1, running_loss / (len(train_dataset)), running_acc / (len(
+            train_dataset))))
+
+model.eval()
+eval_loss = 0
+eval_acc = 0
+for data in test_loader:
+    img, label = data
+    img = img.view(img.size(0), -1)
+    if torch.cuda.is_available():
+        img = Variable(img, volatile=True).cuda()
+        label = Variable(label, volatile=True).cuda()
+    else:
+        img = Variabel(img, volatile=True)
+        label = Variable(label, volatile=True)
+    out = model(img)
+    loss = criterion(out, label)
+    eval_loss += loss.data[0] * label.size(0)
+    _, pred = torch.max(out, 1)
+    num_correct = (pred == label).sum()
+    eval_acc += num_correct.data[0]
+print('Test Loss: {:.6f}, Acc: {:.6f}'.format(eval_loss / (len(test_dataset)),
+                                              eval_acc / (len(test_dataset))))
+print('save model ...')
+
+# 保存模型
+torch.save(model.state_dict(), './neural_network.pth')
+print('model saved!')