open-compass
diff --git a/Diff for: ‎configs/datasets/needlebench/needlebench.py
-11 b/Diff for: ‎configs/datasets/needlebench/needlebench.py
-11
diff --git a/Diff for: ‎configs/datasets/needlebench/needlebench_1000k/needlebench.py
-18 b/Diff for: ‎configs/datasets/needlebench/needlebench_1000k/needlebench.py
-18
diff --git a/Diff for: ‎configs/datasets/needlebench/needlebench_1000k/needlebench_1000k.py
+18 b/Diff for: ‎configs/datasets/needlebench/needlebench_1000k/needlebench_1000k.py
+18
diff --git a/Diff for: ‎configs/datasets/needlebench/needlebench_1000k/needlebench_multi_reasoning.py renamed to ‎configs/datasets/needlebench/needlebench_1000k/needlebench_multi_reasoning_1000k.py
+16-16 b/Diff for: ‎configs/datasets/needlebench/needlebench_1000k/needlebench_multi_reasoning.py renamed to ‎configs/datasets/needlebench/needlebench_1000k/needlebench_multi_reasoning_1000k.py
+16-16
diff --git a/Diff for: ‎configs/datasets/needlebench/needlebench_1000k/needlebench_multi_retrieval.py renamed to ‎configs/datasets/needlebench/needlebench_1000k/needlebench_multi_retrieval_1000k.py
+4-4 b/Diff for: ‎configs/datasets/needlebench/needlebench_1000k/needlebench_multi_retrieval.py renamed to ‎configs/datasets/needlebench/needlebench_1000k/needlebench_multi_retrieval_1000k.py
+4-4
diff --git a/Diff for: ‎configs/datasets/needlebench/needlebench_1000k/needlebench_single.py renamed to ‎configs/datasets/needlebench/needlebench_1000k/needlebench_single_1000k.py
+4-4 b/Diff for: ‎configs/datasets/needlebench/needlebench_1000k/needlebench_single.py renamed to ‎configs/datasets/needlebench/needlebench_1000k/needlebench_single_1000k.py
+4-4
diff --git a/Diff for: ‎configs/datasets/needlebench/needlebench_128k/needlebench.py
-18 b/Diff for: ‎configs/datasets/needlebench/needlebench_128k/needlebench.py
-18
diff --git a/Diff for: ‎configs/datasets/needlebench/needlebench_128k/needlebench_128k.py
+18 b/Diff for: ‎configs/datasets/needlebench/needlebench_128k/needlebench_128k.py
+18
diff --git a/Diff for: ‎configs/datasets/needlebench/needlebench_128k/needlebench_multi_reasoning.py renamed to ‎configs/datasets/needlebench/needlebench_128k/needlebench_multi_reasoning_128k.py
+16-16 b/Diff for: ‎configs/datasets/needlebench/needlebench_128k/needlebench_multi_reasoning.py renamed to ‎configs/datasets/needlebench/needlebench_128k/needlebench_multi_reasoning_128k.py
+16-16
diff --git a/Diff for: ‎configs/datasets/needlebench/needlebench_128k/needlebench_multi_retrieval.py renamed to ‎configs/datasets/needlebench/needlebench_128k/needlebench_multi_retrieval_128k.py
+4-4 b/Diff for: ‎configs/datasets/needlebench/needlebench_128k/needlebench_multi_retrieval.py renamed to ‎configs/datasets/needlebench/needlebench_128k/needlebench_multi_retrieval_128k.py
+4-4
@@ -0,0 +1,18 @@
+from mmengine.config import read_base
+
+with read_base():
+    from .needlebench_multi_reasoning_1000k import needlebench_2needle_en_datasets as needlebench_multi_2needle_en_datasets
+    from .needlebench_multi_reasoning_1000k import needlebench_3needle_en_datasets as needlebench_multi_3needle_en_datasets
+    from .needlebench_multi_reasoning_1000k import needlebench_4needle_en_datasets as needlebench_multi_4needle_en_datasets
+    from .needlebench_multi_reasoning_1000k import needlebench_5needle_en_datasets as needlebench_multi_5needle_en_datasets
+    from .needlebench_multi_reasoning_1000k import needlebench_2needle_zh_datasets as needlebench_multi_2needle_zh_datasets
+    from .needlebench_multi_reasoning_1000k import needlebench_3needle_zh_datasets as needlebench_multi_3needle_zh_datasets
+    from .needlebench_multi_reasoning_1000k import needlebench_4needle_zh_datasets as needlebench_multi_4needle_zh_datasets
+    from .needlebench_multi_reasoning_1000k import needlebench_5needle_zh_datasets as needlebench_multi_5needle_zh_datasets
+
+    from .needlebench_single_1000k import needlebench_en_datasets as needlebench_origin_en_datasets
+    from .needlebench_single_1000k import needlebench_zh_datasets as needlebench_origin_zh_datasets
+    from .needlebench_multi_retrieval_1000k import needlebench_en_datasets as needlebench_parallel_en_datasets
+    from .needlebench_multi_retrieval_1000k import needlebench_zh_datasets as needlebench_parallel_zh_datasets
+
+needlebench_datasets = sum((v for k, v in locals().items() if k.endswith('_datasets')), [])
@@ -62,7 +62,7 @@ def generate_depth_percents(intervals, interval_type):
 needle_file_name = 'multi_needle_reasoning_en.json'
 diff = 10
 num_needles = 2
-needlebench_datasets_2needle_en = []
+needlebench_2needle_en_datasets = []
 language = 'English'
 
 for original_context_length in context_lengths:
@@ -87,10 +87,10 @@ def generate_depth_percents(intervals, interval_type):
             'infer_cfg': needlebench_infer_cfg,
             'eval_cfg': needlebench_eval_cfg
         }
-        needlebench_datasets_2needle_en.append(dataset_dict)
+        needlebench_2needle_en_datasets.append(dataset_dict)
 
 num_needles = 3
-needlebench_datasets_3needle_en = []
+needlebench_3needle_en_datasets = []
 
 for original_context_length in context_lengths:
     for depth_percent in depths_list:
@@ -114,10 +114,10 @@ def generate_depth_percents(intervals, interval_type):
             'infer_cfg': needlebench_infer_cfg,
             'eval_cfg': needlebench_eval_cfg
         }
-        needlebench_datasets_3needle_en.append(dataset_dict)
+        needlebench_3needle_en_datasets.append(dataset_dict)
 
 num_needles = 4
-needlebench_datasets_4needle_en = []
+needlebench_4needle_en_datasets = []
 
 for original_context_length in context_lengths:
     for depth_percent in depths_list:
@@ -141,10 +141,10 @@ def generate_depth_percents(intervals, interval_type):
             'infer_cfg': needlebench_infer_cfg,
             'eval_cfg': needlebench_eval_cfg
         }
-        needlebench_datasets_4needle_en.append(dataset_dict)
+        needlebench_4needle_en_datasets.append(dataset_dict)
 
 num_needles = 5
-needlebench_datasets_5needle_en = []
+needlebench_5needle_en_datasets = []
 
 for original_context_length in context_lengths:
     for depth_percent in depths_list:
@@ -168,7 +168,7 @@ def generate_depth_percents(intervals, interval_type):
             'infer_cfg': needlebench_infer_cfg,
             'eval_cfg': needlebench_eval_cfg
         }
-        needlebench_datasets_5needle_en.append(dataset_dict)
+        needlebench_5needle_en_datasets.append(dataset_dict)
 
 # ----------Chinese Version----------
 base_path = './data/needlebench'
@@ -177,7 +177,7 @@ def generate_depth_percents(intervals, interval_type):
 needle_file_name = 'multi_needle_reasoning_zh.json'
 diff = 10
 num_needles = 2
-needlebench_datasets_2needle_zh = []
+needlebench_2needle_zh_datasets = []
 language = 'Chinese'
 
 for original_context_length in context_lengths:
@@ -202,10 +202,10 @@ def generate_depth_percents(intervals, interval_type):
             'infer_cfg': needlebench_infer_cfg,
             'eval_cfg': needlebench_eval_cfg
         }
-        needlebench_datasets_2needle_zh.append(dataset_dict)
+        needlebench_2needle_zh_datasets.append(dataset_dict)
 
 num_needles = 3
-needlebench_datasets_3needle_zh = []
+needlebench_3needle_zh_datasets = []
 
 for original_context_length in context_lengths:
     for depth_percent in depths_list:
@@ -229,10 +229,10 @@ def generate_depth_percents(intervals, interval_type):
             'infer_cfg': needlebench_infer_cfg,
             'eval_cfg': needlebench_eval_cfg
         }
-        needlebench_datasets_3needle_zh.append(dataset_dict)
+        needlebench_3needle_zh_datasets.append(dataset_dict)
 
 num_needles = 4
-needlebench_datasets_4needle_zh = []
+needlebench_4needle_zh_datasets = []
 
 for original_context_length in context_lengths:
     for depth_percent in depths_list:
@@ -256,10 +256,10 @@ def generate_depth_percents(intervals, interval_type):
             'infer_cfg': needlebench_infer_cfg,
             'eval_cfg': needlebench_eval_cfg
         }
-        needlebench_datasets_4needle_zh.append(dataset_dict)
+        needlebench_4needle_zh_datasets.append(dataset_dict)
 
 num_needles = 5
-needlebench_datasets_5needle_zh = []
+needlebench_5needle_zh_datasets = []
 
 for original_context_length in context_lengths:
     for depth_percent in depths_list:
@@ -283,4 +283,4 @@ def generate_depth_percents(intervals, interval_type):
             'infer_cfg': needlebench_infer_cfg,
             'eval_cfg': needlebench_eval_cfg
         }
-        needlebench_datasets_5needle_zh.append(dataset_dict)
+        needlebench_5needle_zh_datasets.append(dataset_dict)
@@ -58,7 +58,7 @@ def generate_depth_percents(intervals, interval_type):
 
 base_path = './data/needlebench'
 file_list = ['PaulGrahamEssays.jsonl']
-needlebench_datasets_en = []
+needlebench_en_datasets = []
 needle_file_name = 'needles.jsonl'
 depths = [0, 10, 21, 31, 42, 52, 63, 73, 84, 94, 100]
 
@@ -81,10 +81,10 @@ def generate_depth_percents(intervals, interval_type):
         'infer_cfg': needlebench_infer_cfg,
         'eval_cfg': needlebench_eval_cfg
     }
-    needlebench_datasets_en.append(dataset_dict)
+    needlebench_en_datasets.append(dataset_dict)
 
 file_list = ['zh_finance.jsonl']
-needlebench_datasets_zh = []
+needlebench_zh_datasets = []
 
 for original_context_length in context_lengths:
     dataset_dict = {
@@ -105,4 +105,4 @@ def generate_depth_percents(intervals, interval_type):
         'infer_cfg': needlebench_infer_cfg,
         'eval_cfg': needlebench_eval_cfg
     }
-    needlebench_datasets_zh.append(dataset_dict)
+    needlebench_zh_datasets.append(dataset_dict)
@@ -57,7 +57,7 @@ def generate_depth_percents(intervals, interval_type):
 
 base_path = './data/needlebench'
 file_list = ['PaulGrahamEssays.jsonl']
-needlebench_datasets_en = []
+needlebench_en_datasets = []
 needle_file_name = 'needles.jsonl'
 
 for original_context_length in context_lengths:
@@ -80,10 +80,10 @@ def generate_depth_percents(intervals, interval_type):
             'infer_cfg': needlebench_infer_cfg,
             'eval_cfg': needlebench_eval_cfg
         }
-        needlebench_datasets_en.append(dataset_dict)
+        needlebench_en_datasets.append(dataset_dict)
 
 file_list = ['zh_finance.jsonl']
-needlebench_datasets_zh = []
+needlebench_zh_datasets = []
 needle_file_name = 'needles.jsonl'
 
 for original_context_length in context_lengths:
@@ -106,4 +106,4 @@ def generate_depth_percents(intervals, interval_type):
             'infer_cfg': needlebench_infer_cfg,
             'eval_cfg': needlebench_eval_cfg
         }
-        needlebench_datasets_zh.append(dataset_dict)
+        needlebench_zh_datasets.append(dataset_dict)
@@ -0,0 +1,18 @@
+from mmengine.config import read_base
+
+with read_base():
+    from .needlebench_multi_reasoning_128k import needlebench_2needle_en_datasets as needlebench_multi_2needle_en_datasets
+    from .needlebench_multi_reasoning_128k import needlebench_3needle_en_datasets as needlebench_multi_3needle_en_datasets
+    from .needlebench_multi_reasoning_128k import needlebench_4needle_en_datasets as needlebench_multi_4needle_en_datasets
+    from .needlebench_multi_reasoning_128k import needlebench_5needle_en_datasets as needlebench_multi_5needle_en_datasets
+    from .needlebench_multi_reasoning_128k import needlebench_2needle_zh_datasets as needlebench_multi_2needle_zh_datasets
+    from .needlebench_multi_reasoning_128k import needlebench_3needle_zh_datasets as needlebench_multi_3needle_zh_datasets
+    from .needlebench_multi_reasoning_128k import needlebench_4needle_zh_datasets as needlebench_multi_4needle_zh_datasets
+    from .needlebench_multi_reasoning_128k import needlebench_5needle_zh_datasets as needlebench_multi_5needle_zh_datasets
+
+    from .needlebench_single_128k import needlebench_en_datasets as needlebench_origin_en_datasets
+    from .needlebench_single_128k import needlebench_zh_datasets as needlebench_origin_zh_datasets
+    from .needlebench_multi_retrieval_128k import needlebench_en_datasets as needlebench_parallel_en_datasets
+    from .needlebench_multi_retrieval_128k import needlebench_zh_datasets as needlebench_parallel_zh_datasets
+
+needlebench_datasets = sum((v for k, v in locals().items() if k.endswith('_datasets')), [])
@@ -64,7 +64,7 @@ def generate_depth_percents(intervals, interval_type):
 needle_file_name = 'multi_needle_reasoning_en.json'
 diff = 10
 num_needles = 2
-needlebench_datasets_2needle_en = []
+needlebench_2needle_en_datasets = []
 language = 'English'
 
 for original_context_length in context_lengths:
@@ -89,10 +89,10 @@ def generate_depth_percents(intervals, interval_type):
             'infer_cfg': needlebench_infer_cfg,
             'eval_cfg': needlebench_eval_cfg
         }
-        needlebench_datasets_2needle_en.append(dataset_dict)
+        needlebench_2needle_en_datasets.append(dataset_dict)
 
 num_needles = 3
-needlebench_datasets_3needle_en = []
+needlebench_3needle_en_datasets = []
 
 for original_context_length in context_lengths:
     for depth_percent in depths_list:
@@ -116,10 +116,10 @@ def generate_depth_percents(intervals, interval_type):
             'infer_cfg': needlebench_infer_cfg,
             'eval_cfg': needlebench_eval_cfg
         }
-        needlebench_datasets_3needle_en.append(dataset_dict)
+        needlebench_3needle_en_datasets.append(dataset_dict)
 
 num_needles = 4
-needlebench_datasets_4needle_en = []
+needlebench_4needle_en_datasets = []
 
 for original_context_length in context_lengths:
     for depth_percent in depths_list:
@@ -143,10 +143,10 @@ def generate_depth_percents(intervals, interval_type):
             'infer_cfg': needlebench_infer_cfg,
             'eval_cfg': needlebench_eval_cfg
         }
-        needlebench_datasets_4needle_en.append(dataset_dict)
+        needlebench_4needle_en_datasets.append(dataset_dict)
 
 num_needles = 5
-needlebench_datasets_5needle_en = []
+needlebench_5needle_en_datasets = []
 
 for original_context_length in context_lengths:
     for depth_percent in depths_list:
@@ -170,7 +170,7 @@ def generate_depth_percents(intervals, interval_type):
             'infer_cfg': needlebench_infer_cfg,
             'eval_cfg': needlebench_eval_cfg
         }
-        needlebench_datasets_5needle_en.append(dataset_dict)
+        needlebench_5needle_en_datasets.append(dataset_dict)
 
 # ----------Chinese Version----------
 base_path = './data/needlebench'
@@ -179,7 +179,7 @@ def generate_depth_percents(intervals, interval_type):
 needle_file_name = 'multi_needle_reasoning_zh.json'
 diff = 10
 num_needles = 2
-needlebench_datasets_2needle_zh = []
+needlebench_2needle_zh_datasets = []
 language = 'Chinese'
 
 for original_context_length in context_lengths:
@@ -204,10 +204,10 @@ def generate_depth_percents(intervals, interval_type):
             'infer_cfg': needlebench_infer_cfg,
             'eval_cfg': needlebench_eval_cfg
         }
-        needlebench_datasets_2needle_zh.append(dataset_dict)
+        needlebench_2needle_zh_datasets.append(dataset_dict)
 
 num_needles = 3
-needlebench_datasets_3needle_zh = []
+needlebench_3needle_zh_datasets = []
 
 for original_context_length in context_lengths:
     for depth_percent in depths_list:
@@ -231,10 +231,10 @@ def generate_depth_percents(intervals, interval_type):
             'infer_cfg': needlebench_infer_cfg,
             'eval_cfg': needlebench_eval_cfg
         }
-        needlebench_datasets_3needle_zh.append(dataset_dict)
+        needlebench_3needle_zh_datasets.append(dataset_dict)
 
 num_needles = 4
-needlebench_datasets_4needle_zh = []
+needlebench_4needle_zh_datasets = []
 
 for original_context_length in context_lengths:
     for depth_percent in depths_list:
@@ -258,10 +258,10 @@ def generate_depth_percents(intervals, interval_type):
             'infer_cfg': needlebench_infer_cfg,
             'eval_cfg': needlebench_eval_cfg
         }
-        needlebench_datasets_4needle_zh.append(dataset_dict)
+        needlebench_4needle_zh_datasets.append(dataset_dict)
 
 num_needles = 5
-needlebench_datasets_5needle_zh = []
+needlebench_5needle_zh_datasets = []
 
 for original_context_length in context_lengths:
     for depth_percent in depths_list:
@@ -285,4 +285,4 @@ def generate_depth_percents(intervals, interval_type):
             'infer_cfg': needlebench_infer_cfg,
             'eval_cfg': needlebench_eval_cfg
         }
-        needlebench_datasets_5needle_zh.append(dataset_dict)
+        needlebench_5needle_zh_datasets.append(dataset_dict)
@@ -58,7 +58,7 @@ def generate_depth_percents(intervals, interval_type):
 
 base_path = './data/needlebench'
 file_list = ['PaulGrahamEssays.jsonl']
-needlebench_datasets_en = []
+needlebench_en_datasets = []
 needle_file_name = 'needles.jsonl'
 depths = [0, 10, 21, 31, 42, 52, 63, 73, 84, 94, 100]
 
@@ -81,10 +81,10 @@ def generate_depth_percents(intervals, interval_type):
         'infer_cfg': needlebench_infer_cfg,
         'eval_cfg': needlebench_eval_cfg
     }
-    needlebench_datasets_en.append(dataset_dict)
+    needlebench_en_datasets.append(dataset_dict)
 
 file_list = ['zh_finance.jsonl']
-needlebench_datasets_zh = []
+needlebench_zh_datasets = []
 
 for original_context_length in context_lengths:
     dataset_dict = {
@@ -105,4 +105,4 @@ def generate_depth_percents(intervals, interval_type):
         'infer_cfg': needlebench_infer_cfg,
         'eval_cfg': needlebench_eval_cfg
     }
-    needlebench_datasets_zh.append(dataset_dict)
+    needlebench_zh_datasets.append(dataset_dict)