Created repo

M-J-Murray · Oct 28, 2018 · ae39e62 · ae39e62
commit ae39e62
Show file tree

Hide file tree

Showing 19 changed files with 699 additions and 0 deletions.
diff --git a/Datasets.py b/Datasets.py
@@ -0,0 +1,31 @@
+import numpy as np
+from enum import Enum
+
+
+class Dataset(Enum):
+    CIRCLE = "circle",
+    SPIRAL = "spiral"
+
+
+def get_circle_dataset(points: int, min_range: float, max_range: float, radius: float):
+    # generating labelled training data
+    range_ = max_range-min_range
+    N = points
+    X = (np.random.rand(N, 2) * range_) + min_range
+    y = np.sqrt(np.sum(np.multiply(X, X), axis=1)) > radius
+    return np.stack((X[:, 0], X[:, 1], y), axis=1)
+
+
+def get_spiral_dataset(points: int, classes: int):
+    N = points  # number of points per class
+    D = 2  # dimensionality
+    K = classes  # number of classes
+    X = np.zeros((N * K, D))  # data matrix (each row = single example)
+    y = np.zeros(N * K, dtype='uint8')  # class labels
+    for j in range(K):
+        ix = range(N * j, N * (j + 1))
+        r = np.linspace(0.0, 1, N)  # radius
+        t = np.linspace(j * 4, (j + 1) * 4, N) + np.random.randn(N) * 0.2  # theta
+        X[ix] = np.c_[r * np.sin(t), r * np.cos(t)]
+        y[ix] = j
+    return np.stack((X[:, 0], X[:, 1], y), axis=1)
diff --git a/NetworkUtils.py b/NetworkUtils.py
@@ -0,0 +1,167 @@
+import os
+import numpy as np
+
+from Datasets import Dataset
+from RunningStats import RunningStats
+
+
+def shuffle_dataset(dataset: np.ndarray) -> (np.ndarray, np.ndarray, np.ndarray, np.ndarray):
+    np.random.shuffle(dataset)
+    size = int(dataset.shape[0]*0.1)
+    train_set = dataset[size:, :-1]
+    train_labels = dataset[size:, -1].astype("int32")
+    test_set = dataset[:size, :-1]
+    test_labels = dataset[:size, -1].astype("int32")
+
+    return train_set, train_labels, test_set, test_labels
+
+
+def sigmoid(x: np.ndarray) -> np.ndarray:
+    return 1.0 / (1.0 + np.exp(-x))
+
+
+def softmax(f: np.ndarray) -> np.ndarray:
+    exp_f = np.exp(f)
+    return exp_f / np.sum(exp_f, axis=1, keepdims=True)
+
+
+def xw_plus_b(x: np.ndarray, w: np.ndarray, b: np.ndarray) -> np.ndarray:
+    return np.matmul(x, w) + b
+
+
+def select_neurons(network, p1_enabled) -> (np.ndarray, np.ndarray, np.ndarray, np.ndarray):
+    if p1_enabled:
+        w1 = np.stack([network["W1"][:, i] for i in range(network["W1"].shape[1]) if i in p1_enabled], axis=1)
+        b1 = np.stack([network["b1"][:, i] for i in range(network["b1"].shape[1]) if i in p1_enabled], axis=1)
+        w2 = np.stack([network["W2"][i, :] for i in range(network["W2"].shape[0]) if i in p1_enabled], axis=0)
+        b2 = network["b2"]
+    else:
+        w1 = network["W1"]
+        b1 = network["b1"]
+        w2 = network["W2"]
+        b2 = network["b2"]
+
+    return w1, b1, w2, b2
+
+
+def forward(inputs, network, dataset: Dataset, p1_enabled=None, precision=None, squeeze=False):
+    w1, b1, w2, b2 = select_neurons(network, p1_enabled)
+    out1 = xw_plus_b(inputs, w1, b1)
+    out2 = np.maximum(out1, 0)
+    if squeeze and dataset is Dataset.CIRCLE:
+        out3 = np.squeeze(xw_plus_b(out2, w2, b2), axis=1)
+    else:
+        out3 = xw_plus_b(out2, w2, b2)
+    if dataset is Dataset.CIRCLE:
+        out4 = sigmoid(out3)
+    elif dataset is Dataset.SPIRAL:
+        out4 = softmax(out3)
+    else:
+        raise Exception("Invalid dataset type")
+    if not precision:
+        return out1, out2, out3, out4
+    else:
+        return np.reshape(out1, newshape=[precision, precision, -1]), \
+               np.reshape(out2, newshape=[precision, precision, -1]), \
+               np.reshape(out3, newshape=[precision, precision, -1]), \
+               np.reshape(out4, newshape=[precision, precision, -1])
+
+
+def train_network_sigmoid(dataset: np.ndarray, learning_rate: float, units: int, window_size: int, log_freq=100):
+    stats = RunningStats(window_size)
+
+    network = {
+        "W1": np.random.randn(2, units).astype("float32"),
+        "b1": np.zeros((1, units)).astype("float32"),
+        "W2": np.random.randn(units, 1).astype("float32"),
+        "b2": np.zeros((1, 1)).astype("float32")
+    }
+
+    episode = 0
+    while not stats.finished_window() or stats.window_improved():
+        episode += 1
+
+        train_set, train_labels, test_set, test_labels = shuffle_dataset(dataset)
+
+        _, train_out2, _, train_predictions = forward(train_set, network, Dataset.CIRCLE, squeeze=True)
+        d = -(np.subtract(train_labels, train_predictions))
+        network["W1"] -= learning_rate * np.dot(np.multiply(d, np.multiply(train_out2.T > 0, network["W2"])), train_set).T
+        network["b1"] -= learning_rate * np.sum(np.multiply(d, np.multiply(train_out2.T > 0, network["W2"])), axis=1)
+        network["W2"] -= learning_rate * np.reshape(np.dot(d, np.maximum(train_out2, 0)), [units, 1])
+        network["b2"] -= learning_rate * np.reshape(np.sum(d), [1, 1])
+
+        _, _, _, test_predictions = forward(test_set, network, Dataset.CIRCLE)
+        test_accuracy = (len(np.where((test_predictions[:, 0] > 0.5) == (test_labels == 1))[0]) / len(test_labels)) * 100
+        stats.insert(test_accuracy)
+
+        if log_freq and episode % log_freq:
+            print(f"Episode: {episode}, Test Accuracy: {test_accuracy:6.2f}, Running Avg: {stats.get_average():6.3f}")
+
+    return network
+
+
+def train_network_softmax(dataset: np.ndarray, learning_rate: float, units: int, window_size: int, log=True):
+    stats = RunningStats(window_size)
+
+    reg = 1e-3
+    network = {
+        "W1": np.random.randn(2, units).astype("float32"),
+        "b1": np.zeros((1, units)).astype("float32"),
+        "W2": np.random.randn(units, 2).astype("float32"),
+        "b2": np.zeros((1, 2)).astype("float32")
+    }
+
+    num_examples = int(dataset.shape[0]*0.9)
+    episode = 0
+    while not stats.finished_window() or stats.window_improved():
+        episode += 1
+
+        train_set, train_labels, test_set, test_labels = shuffle_dataset(dataset)
+
+        _, train_out2, _, train_predictions = forward(train_set, network, Dataset.SPIRAL, squeeze=True)
+
+        dscores = train_predictions
+        dscores[range(num_examples), train_labels] -= 1
+        dscores /= num_examples
+
+        dhidden = np.dot(dscores, network["W2"].T)
+        dhidden[train_out2 <= 0] = 0
+        network["W1"] -= learning_rate * reg * np.dot(train_set.T, dhidden)
+        network["b1"] -= learning_rate * np.sum(dhidden, axis=0, keepdims=True)
+        network["W2"] -= learning_rate * reg * np.dot(train_out2.T, dscores)
+        network["b2"] -= learning_rate * np.sum(dscores, axis=0, keepdims=True)
+
+        _, _, _, test_predictions = forward(test_set, network, Dataset.SPIRAL)
+        test_accuracy = (len(np.where((test_predictions[:, 0] > 0.5) == (test_labels == 0))[0]) / len(test_labels)) * 100
+        stats.insert(test_accuracy)
+
+        if log:
+            print(f"Episode: {episode}, Test Accuracy: {test_accuracy:6.2f}, Running Avg: {stats.get_average():6.3f}")
+
+    return network
+
+
+def save_network(network: dict, dataset: Dataset, path: str):
+    units = network["W1"].shape[1]
+    if not os.path.isdir(f"{path}/dataset_{dataset.name}"):
+        os.mkdir(f"{path}/dataset_{dataset.name}")
+    os.mkdir(f"{path}/dataset_{dataset.name}/units_{units}")
+    for key in network.keys():
+        with open(f"{path}/dataset_{dataset.name}/units_{units}/{key}", "wb+") as file:
+            file.write(network[key].tobytes())
+
+
+def check_saved_network(units: int, dataset: Dataset, path: str):
+    return os.path.isdir(f"{path}/dataset_{dataset.name}/units_{units}")
+
+
+def load_network(units: int, dataset: Dataset, path: str, dtype="float32"):
+    classes = 1 if dataset is Dataset.CIRCLE else 2
+    network = {"W1": [2, units], "b1": [1, units], "W2": [units, classes], "b2": [1, classes]}
+    for key in network.keys():
+        with open(f"{path}/dataset_{dataset.name}/units_{units}/{key}", "rb") as file:
+            data = file.read(len(np.zeros(shape=network[key], dtype=dtype).tobytes()))
+            network[key] = np.reshape(np.frombuffer(data, dtype=dtype), network[key])
+            network[key].setflags(write=True)
+
+    return network