Update notebook files and modules

Adn-thkim · Adn-thkim · commit ef2ec144267d · 2023-06-16T11:12:41.000+09:00
diff --git a/dataAnalysis/notebook/get_js_dict.ipynb b/dataAnalysis/notebook/get_js_dict.ipynb
@@ -196,7 +196,7 @@
     "    '''\n",
     "    \n",
     "    df = df.loc[df['module'].isna()]  # 메서드, 함수 사용 데이터 추출\n",
-    "    df = df[df['function_method'] != 'None']  # 메서드, 함수 미사용 데이터 제거\n",
+    "    df = df[df['function_method'] != 'FunctionNotUsed']  # 메서드, 함수 미사용 데이터 제거\n",
     "    df[\"problem_name\"] = df[\"problem_name\"].apply(lambda x: re.sub(\"\\(1\\)|\\s\", \"\", x))  # 문제이름(1)과 문제이름 => 동일 문제 처리\n",
     "\n",
     "    # 중복 풀이된 고유 문제이름 리스트\n",
@@ -352,7 +352,7 @@
    "name": "python",
    "nbconvert_exporter": "python",
    "pygments_lexer": "ipython3",
-   "version": "3.9.12"
+   "version": "3.11.0"
   },
   "vscode": {
    "interpreter": {
diff --git a/dataAnalysis/notebook/get_py_dict.ipynb b/dataAnalysis/notebook/get_py_dict.ipynb
@@ -196,7 +196,7 @@
     "    '''\n",
     "    \n",
     "    df = df.loc[df['module'].isna()]  # 메서드, 함수 사용 데이터 추출\n",
-    "    df = df[df['function_method'] != 'None']  # 메서드, 함수 미사용 데이터 제거\n",
+    "    df = df[df['function_method'] != 'FunctionNotUsed']  # 메서드, 함수 미사용 데이터 제거\n",
     "    df[\"problem_name\"] = df[\"problem_name\"].apply(lambda x: re.sub(\"\\(1\\)|\\s\", \"\", x))  # 문제이름(1)과 문제이름 => 동일 문제 처리\n",
     "\n",
     "    # 중복 풀이된 고유 문제이름 리스트\n",
@@ -381,7 +381,7 @@
    "name": "python",
    "nbconvert_exporter": "python",
    "pygments_lexer": "ipython3",
-   "version": "3.9.12"
+   "version": "3.11.0"
   }
  },
  "nbformat": 4,
diff --git a/dataAnalysis/notebook/visualize_data/_json_to_dataframe.py b/dataAnalysis/notebook/visualize_data/_json_to_dataframe.py
@@ -34,8 +34,7 @@ def unicode_err(df, column):  # 회사명, 문제유형, 문제이름 중복 오
     '''
     unicodedata.normalize() 함수는 문자열에 있는 유니코드 문자를 
     NFKC형식(문자열을 표준 호환성(KC) 형식으로 정규화)으로 정규화합니다.
-    problem_name, problem_type, company_name 컬럼의 값 중 같은 값을 
-    파이썬에서 다르게 인식하는 문제를 해결합니다.
+    컬럼의 값 중 같은 값을 파이썬에서 다르게 인식하는 문제를 해결합니다.
     
     Args:
         data : (DataFrame | Series)
@@ -134,7 +133,7 @@ def json_to_df(json_file):  # methodcount 와 method명을 분리하기 위함
     for file_name in data_json.keys():
         temp_df = pd.DataFrame(data_json[file_name])
         temp_df = temp_df.reset_index()
-        df = pd.concat([df, temp_df], axis = 0) 
+        df = pd.concat([df, temp_df], axis = 0)
 
         temp_df_len = len(temp_df)  # countmethod가 0인 파일 사전 처리 후 concat
         if temp_df_len == 0:
@@ -175,9 +174,8 @@ def json_to_df(json_file):  # methodcount 와 method명을 분리하기 위함
             for i in index_dict[index_key]:
                 # df["problem_type"][i] = ptype
                 df.loc[i, "problem_type"] = ptype
-                
-     
-    df.loc[df["function_method"] == 0, "function_method"] = df.loc[df["function_method"] == 0, "function_method"].apply(lambda x: str(x).replace("0", "None")) # module 혹은 method를 사용하지 않은 경우 "None" 으로 대체
+
+    df.loc[df["function_method"] == 0, "function_method"] = df.loc[df["function_method"] == 0, "function_method"].apply(lambda x: str(x).replace("0", "FunctionNotUsed")) # module 혹은 method를 사용하지 않은 경우 "FunctionNotUsed" 으로 대체
 
     
     return df
diff --git a/dataAnalysis/notebook/visualize_data/js_get_dict.py b/dataAnalysis/notebook/visualize_data/js_get_dict.py
@@ -182,7 +182,7 @@ def drop_duplicated_solution(df):
     '''
     
     df = df.loc[df['module'].isna()]  # 메서드, 함수 사용 데이터 추출
-    df = df[df['function_method'] != 'None']  # 메서드, 함수 미사용 데이터 제거
+    df = df[df['function_method'] != 'FunctionNotUsed']  # 메서드, 함수 미사용 데이터 제거
     df["problem_name"] = df["problem_name"].apply(lambda x: re.sub("\(1\)|\s", "", x))  # 문제이름(1)과 문제이름 => 동일 문제 처리
 
     # 중복 풀이된 고유 문제이름 리스트
diff --git a/dataAnalysis/notebook/visualize_data/py_get_dict.py b/dataAnalysis/notebook/visualize_data/py_get_dict.py
@@ -194,7 +194,7 @@ def drop_duplicated_solution(df):
 
     df = df[df['problem_type'] != '구현']
     df = df.loc[df['module'].isna()]  # 메서드, 함수 사용 데이터 추출
-    df = df[df['function_method'] != 'None']  # 메서드, 함수 미사용 데이터 제거
+    df = df[df['function_method'] != 'FunctionNotUsed']  # 메서드, 함수 미사용 데이터 제거
     df["problem_name"] = df["problem_name"].apply(lambda x: re.sub("\(1\)|\s", "", x))  # 문제이름(1)과 문제이름 => 동일 문제 처리
 
     # 중복 풀이된 고유 문제이름 리스트