fukuball
diff --git a/Diff for: ‎FukuML/MLBase.py
+75-6 b/Diff for: ‎FukuML/MLBase.py
+75-6
diff --git a/Diff for: ‎FukuML/PLA.py
+5-53 b/Diff for: ‎FukuML/PLA.py
+5-53
diff --git a/Diff for: ‎FukuML/PocketPLA.py
+5-53 b/Diff for: ‎FukuML/PocketPLA.py
+5-53
diff --git a/Diff for: ‎FukuML/Utility.py
+17-8 b/Diff for: ‎FukuML/Utility.py
+17-8
diff --git a/Diff for: ‎FukuML/__init__.py
+1 b/Diff for: ‎FukuML/__init__.py
+1
@@ -1,6 +1,5 @@
 #encoding=utf8
 
-import pickle
 from abc import ABCMeta, abstractmethod
 
 
@@ -19,14 +18,84 @@ class Learner(object):
 
     @abstractmethod
     def __init__(self):
-        """init"""
         return
 
     @abstractmethod
     def load_train_data(self, input_data_file=''):
-        """Load train data"""
         return
 
-    def serialize(self):
-        """serialize"""
-        return pickle.dumps(self, protocol=0)
+    @abstractmethod
+    def load_test_data(self, input_data_file=''):
+        return
+
+    @abstractmethod
+    def init_W(self):
+        return
+
+    @abstractmethod
+    def score_function(self, x, W):
+        return
+
+    @abstractmethod
+    def error_function(self, y_prediction, y_truth):
+        return
+
+    def calculate_avg_error(self, X, Y, W):
+
+        '''
+        Calculate avg error from X, Y, W
+        '''
+
+        data_num = len(Y)
+        error_num = 0
+
+        for i in range(data_num):
+            error_num = error_num + self.error_function(self.score_function(X[i], W), Y[i])
+
+        avg_error = error_num / float(data_num)
+
+        return avg_error
+
+    def calculate_test_data_avg_error(self):
+
+        '''
+        Calculate test data avg error
+        '''
+
+        avg_error = self.calculate_avg_error(self.test_X, self.test_Y, self.W)
+
+        return avg_error
+
+    @abstractmethod
+    def train(self, updates=50, mode='random', alpha=1):
+        return
+
+    def prediction(self, input_data='', mode='test_data'):
+
+        '''
+        Make prediction
+        input test data
+        output the prediction
+        '''
+
+        prediction = 0
+
+        if (self.status != 'train'):
+            print("Please load train data and init W then train the W first.")
+            return prediction
+
+        if (input_data == ''):
+            print("Please input test data for prediction.")
+            return prediction
+
+        if mode == 'future_data':
+            data = input_data.split()
+            input_data_x = [1] + [float(v) for v in data]
+            prediction = self.score_function(input_data_x, self.W)
+            return {"input_data_x": input_data_x, "input_data_y": None, "prediction": prediction}
+        else:
+            data = input_data.split()
+            input_data_x = [1] + [float(v) for v in data[:-1]]
+            input_data_y = float(data[-1])
+            prediction = self.score_function(input_data_x, self.W)
+            return {"input_data_x": input_data_x, "input_data_y": input_data_y, "prediction": prediction}
@@ -41,8 +41,7 @@ def load_train_data(self, input_data_file=''):
                 print("Please make sure input_data_file path is correct.")
                 return self.train_X, self.train_Y
 
-        dataset_loader = utility.DatasetLoader()
-        self.train_X, self.train_Y = dataset_loader.load(input_data_file)
+        self.train_X, self.train_Y = utility.DatasetLoader.load(input_data_file)
 
         return self.train_X, self.train_Y
 
@@ -62,8 +61,7 @@ def load_test_data(self, input_data_file=''):
                 print("Please make sure input_data_file path is correct.")
                 return self.test_X, self.test_Y
 
-        dataset_loader = utility.DatasetLoader()
-        self.test_X, self.test_Y = dataset_loader.load(input_data_file)
+        self.test_X, self.test_Y = utility.DatasetLoader.load(input_data_file)
 
         return self.test_X, self.test_Y
 
@@ -110,32 +108,12 @@ def error_function(self, y_prediction, y_truth):
             return 0
 
     def calculate_avg_error(self, X, Y, W):
-        # need refector
-
-        '''
-        Calculate avg error from X, Y, W
-        '''
-
-        data_num = len(Y)
-        error_num = 0
 
-        for i in range(data_num):
-            error_num = error_num + self.error_function(self.score_function(X[i], W), Y[i])
-
-        avg_error = error_num / float(data_num)
-
-        return avg_error
+        return super(BinaryClassifier, self).calculate_avg_error(X, Y, W)
 
     def calculate_test_data_avg_error(self):
-        # need refector
 
-        '''
-        Calculate test data avg error
-        '''
-
-        avg_error = self.calculate_avg_error(self.test_X, self.test_Y, self.W)
-
-        return avg_error
+        return super(BinaryClassifier, self).calculate_avg_error()
 
     def train(self, mode='naive_cycle', alpha=1):
 
@@ -187,30 +165,4 @@ def train(self, mode='naive_cycle', alpha=1):
 
     def prediction(self, input_data='', mode='test_data'):
 
-        '''
-        Make prediction
-        input test data
-        output the prediction
-        '''
-
-        prediction = 0
-
-        if (self.status != 'train'):
-            print("Please load train data and init W then train the W first.")
-            return prediction
-
-        if (input_data == ''):
-            print("Please input test data for prediction.")
-            return prediction
-
-        if mode == 'future_data':
-            data = input_data.split()
-            input_data_x = [1] + [float(v) for v in data]
-            prediction = self.score_function(input_data_x, self.W)
-            return {"input_data_x": input_data_x, "prediction": prediction}
-        else:
-            data = input_data.split()
-            input_data_x = [1] + [float(v) for v in data[:-1]]
-            input_data_y = float(data[-1])
-            prediction = self.score_function(input_data_x, self.W)
-            return {"input_data_x": input_data_x, "input_data_y": input_data_y, "prediction": prediction}
+        return super(BinaryClassifier, self).prediction(input_data, mode)
@@ -47,8 +47,7 @@ def load_train_data(self, input_data_file=''):
                 print("Please make sure input_data_file path is correct.")
                 return self.train_X, self.train_Y
 
-        dataset_loader = utility.DatasetLoader()
-        self.train_X, self.train_Y = dataset_loader.load(input_data_file)
+        self.train_X, self.train_Y = utility.DatasetLoader.load(input_data_file)
 
         return self.train_X, self.train_Y
 
@@ -68,8 +67,7 @@ def load_test_data(self, input_data_file=''):
                 print("Please make sure input_data_file path is correct.")
                 return self.test_X, self.test_Y
 
-        dataset_loader = utility.DatasetLoader()
-        self.test_X, self.test_Y = dataset_loader.load(input_data_file)
+        self.test_X, self.test_Y = utility.DatasetLoader.load(input_data_file)
 
         return self.test_X, self.test_Y
 
@@ -116,32 +114,12 @@ def error_function(self, y_prediction, y_truth):
             return 0
 
     def calculate_avg_error(self, X, Y, W):
-        # need refector
-
-        '''
-        Calculate avg error from X, Y, W
-        '''
-
-        data_num = len(Y)
-        error_num = 0
 
-        for i in range(data_num):
-            error_num = error_num + self.error_function(self.score_function(X[i], W), Y[i])
-
-        avg_error = error_num / float(data_num)
-
-        return avg_error
+        return super(BinaryClassifier, self).calculate_avg_error(X, Y, W)
 
     def calculate_test_data_avg_error(self):
-        # need refector
 
-        '''
-        Calculate test data avg error
-        '''
-
-        avg_error = self.calculate_avg_error(self.test_X, self.test_Y, self.W)
-
-        return avg_error
+        return super(BinaryClassifier, self).calculate_avg_error()
 
     def train(self, updates=50, mode='random', alpha=1):
 
@@ -187,30 +165,4 @@ def train(self, updates=50, mode='random', alpha=1):
 
     def prediction(self, input_data='', mode='test_data'):
 
-        '''
-        Make prediction
-        input test data
-        output the prediction
-        '''
-
-        prediction = 0
-
-        if (self.status != 'train'):
-            print("Please load train data and init W then train the W first.")
-            return prediction
-
-        if (input_data == ''):
-            print("Please input test data for prediction.")
-            return prediction
-
-        if mode == 'future_data':
-            data = input_data.split()
-            input_data_x = [1] + [float(v) for v in data]
-            prediction = self.score_function(input_data_x, self.W)
-            return {"input_data_x": input_data_x, "input_data_y": None, "prediction": prediction}
-        else:
-            data = input_data.split()
-            input_data_x = [1] + [float(v) for v in data[:-1]]
-            input_data_y = float(data[-1])
-            prediction = self.score_function(input_data_x, self.W)
-            return {"input_data_x": input_data_x, "input_data_y": input_data_y, "prediction": prediction}
+        return super(BinaryClassifier, self).prediction(input_data, mode)
@@ -1,18 +1,14 @@
 #encoding=utf8
 
 import numpy as np
+import pickle
 
 
 class DatasetLoader(object):
 
-    status = 'empty'
-
-    def __init__(self):
-
-        self.status = 'empty'
-
-    def load(self, input_data_file=''):
-
+    @staticmethod
+    def load(input_data_file=''):
+        """load file"""
         X = []
         Y = []
         with open(input_data_file) as f:
@@ -23,3 +19,16 @@ def load(self, input_data_file=''):
                 Y.append(float(data[-1]))
 
         return np.array(X), np.array(Y)
+
+
+class Serializer(object):
+
+    @staticmethod
+    def serialize(need_serialize=''):
+        """serialize"""
+        return pickle.dumps(need_serialize, protocol=0)
+
+    @staticmethod
+    def deserialize(pickle_serialized=''):
+        """ddserialize"""
+        return pickle.loads(pickle_serialized)
@@ -2,6 +2,7 @@
 
 __version__ = '0.0.3'
 __all__ = [
+    'MLBase',
     'PLA',
     'PLA.BinaryClassifier',
     'PocketPLA',