nf-core
diff --git a/‎.github/workflows/template_version_comment.yml
Lines changed: 1 addition & 1 deletion b/‎.github/workflows/template_version_comment.yml
Lines changed: 1 addition & 1 deletion
diff --git a/‎assets/datavzrd/happy.datavzrd.template.yaml
Lines changed: 45 additions & 0 deletions b/‎assets/datavzrd/happy.datavzrd.template.yaml
Lines changed: 45 additions & 0 deletions
diff --git a/‎assets/datavzrd/rtgtools.datavzrd.template.yaml
Lines changed: 27 additions & 0 deletions b/‎assets/datavzrd/rtgtools.datavzrd.template.yaml
Lines changed: 27 additions & 0 deletions
diff --git a/‎assets/datavzrd/sompy.datavzrd.template.yaml
Lines changed: 27 additions & 0 deletions b/‎assets/datavzrd/sompy.datavzrd.template.yaml
Lines changed: 27 additions & 0 deletions
diff --git a/‎assets/datavzrd/svbenchmark.datavzrd.template.yaml
Lines changed: 25 additions & 0 deletions b/‎assets/datavzrd/svbenchmark.datavzrd.template.yaml
Lines changed: 25 additions & 0 deletions
diff --git a/‎assets/datavzrd/truvari.datavzrd.template.yaml
Lines changed: 25 additions & 0 deletions b/‎assets/datavzrd/truvari.datavzrd.template.yaml
Lines changed: 25 additions & 0 deletions
diff --git a/‎assets/datavzrd/wittyer.datavzrd.template.yaml
Lines changed: 19 additions & 0 deletions b/‎assets/datavzrd/wittyer.datavzrd.template.yaml
Lines changed: 19 additions & 0 deletions
diff --git a/‎bin/merge_reports.py
Lines changed: 43 additions & 26 deletions b/‎bin/merge_reports.py
Lines changed: 43 additions & 26 deletions
diff --git a/‎conf/modules.config
Lines changed: 9 additions & 1 deletion b/‎conf/modules.config
Lines changed: 9 additions & 1 deletion
diff --git a/‎modules.json
Lines changed: 5 additions & 0 deletions b/‎modules.json
Lines changed: 5 additions & 0 deletions
diff --git a/‎modules/local/create_datavzrd_input/main.nf
Lines changed: 17 additions & 0 deletions b/‎modules/local/create_datavzrd_input/main.nf
Lines changed: 17 additions & 0 deletions
diff --git a/‎modules/nf-core/datavzrd/environment.yml
Lines changed: 5 additions & 0 deletions b/‎modules/nf-core/datavzrd/environment.yml
Lines changed: 5 additions & 0 deletions
@@ -12,7 +12,7 @@ jobs:
         uses: actions/checkout@0ad4b8fadaa221de15dcec353f45205ec38ea70b # v4
 
       - name: Read template version from .nf-core.yml
-        uses: pietrobolcato/action-read-yaml@1.0.0
+        uses: pietrobolcato/action-read-yaml@1.1.0
         id: read_yml
         with:
           config: ${{ github.workspace }}/.nf-core.yml
 
@@ -0,0 +1,45 @@
+datasets:
+  report:
+    path: CSVPATH #happy.sv.summary.csv
+    separator: ","
+views:
+  test:
+    dataset: report
+    render-table:
+      columns:
+        Tool:
+          display-mode: normal
+        Type:
+          display-mode: normal
+        Filter:
+          display-mode: normal
+        TP_base:
+          display-mode: normal
+        FN:
+          display-mode: normal
+        TP_call:
+          display-mode: normal
+        FP:
+          display-mode: normal
+        UNK:
+          display-mode: normal
+        Precision:
+          display-mode: normal
+        Recall:
+          display-mode: normal
+        F1:
+          display-mode: normal
+        FP_gt:
+          display-mode: normal
+        FP_al:
+          display-mode: normal
+        Frac_NA:
+          display-mode: normal
+        TRUTH_TiTv_ratio:
+          display-mode: normal
+        QUERY_TiTv_ratio:
+          display-mode: normal
+        TRUTH_het_hom_ratio:
+          display-mode: normal
+        QUERY_het_hom_ratio:
+          display-mode: normal
@@ -0,0 +1,27 @@
+datasets:
+  report:
+    path: CSVPATH #rtgtools.sv.summary.csv
+    separator: ","
+views:
+  test:
+    dataset: report
+    render-table:
+      columns:
+        Tool:
+          display-mode: normal
+        Threshold:
+          display-mode: normal
+        TP_base:
+          display-mode: normal
+        FN:
+          display-mode: normal
+        TP_call:
+          display-mode: normal
+        FP:
+          display-mode: normal
+        Precision:
+          display-mode: normal
+        Recall:
+          display-mode: normal
+        F1:
+          display-mode: normal
@@ -0,0 +1,27 @@
+datasets:
+  report:
+    path: CSVPATH #sompy.sv.summary.csv
+    separator: ","
+views:
+  test:
+    dataset: report
+    render-table:
+      columns:
+        Tool:
+          display-mode: normal
+        Threshold:
+          display-mode: normal
+        TP_base:
+          display-mode: normal
+        FN:
+          display-mode: normal
+        TP_call:
+          display-mode: normal
+        FP:
+          display-mode: normal
+        Precision:
+          display-mode: normal
+        Recall:
+          display-mode: normal
+        F1:
+          display-mode: normal
@@ -0,0 +1,25 @@
+datasets:
+  report:
+    path: CSVPATH #svbenchmark.sv.summary.csv
+    separator: ","
+views:
+  test:
+    dataset: report
+    render-table:
+      columns:
+        Tool:
+          display-mode: normal
+        TP_base:
+          display-mode: normal
+        FN:
+          display-mode: normal
+        TP_comp:
+          display-mode: normal
+        FP:
+          display-mode: normal
+        Precision:
+          display-mode: normal
+        Recall:
+          display-mode: normal
+        F1:
+          display-mode: normal
@@ -0,0 +1,25 @@
+datasets:
+  report:
+    path: CSVPATH #truvari.sv.summary.csv
+    separator: ","
+views:
+  test:
+    dataset: report
+    render-table:
+      columns:
+        Tool:
+          display-mode: normal
+        TP_base:
+          display-mode: normal
+        FN:
+          display-mode: normal
+        TP_comp:
+          display-mode: normal
+        FP:
+          display-mode: normal
+        Precision:
+          display-mode: normal
+        Recall:
+          display-mode: normal
+        F1:
+          display-mode: normal
@@ -0,0 +1,19 @@
+datasets:
+  report:
+    path: CSVPATH #wittyer.sv.summary.csv
+    separator: ","
+views:
+  test:
+    dataset: report
+    render-table:
+      columns:
+        Tool:
+          display-mode: normal
+        TP_base:
+          display-mode: normal
+        FN:
+          display-mode: normal
+        TP_comp:
+          display-mode: normal
+        FP:
+          display-mode: normal
@@ -56,17 +56,17 @@ def get_svbenchmark_resuls(file_paths):
 		# Initialize a dictionary to store the data
 		data = {
 			'Tool': [filename.split(".")[0]],
-			'TP_base': [DTP_match.group(1) if DTP_match else 'NA'],
-			'FP': [FP_match.group(1) if FP_match else 'NA'],
-			'TP_comp': [DTP_match.group(1) if DTP_match else 'NA'],
-			'FN': [FN_match.group(1) if FN_match else 'NA'],
+			'TP_base': [int(DTP_match.group(1)) if DTP_match else 'NA'],
+			'FP': [int(FP_match.group(1)) if FP_match else 'NA'],
+			'TP_comp': [int(DTP_match.group(1)) if DTP_match else 'NA'],
+			'FN': [int(FN_match.group(1)) if FN_match else 'NA'],
 			'Recall': [float(recall_match.group(1))/100 if recall_match else 'NA'],
 			'Precision': [float(precision_match.group(1))/100 if precision_match else 'NA'],
 			'F1': [float(f1_match.group(1)) if f1_match else 'NA']}
 
 		df = pd.DataFrame(data)
 
-		merged_df = pd.concat([merged_df, df])
+		merged_df = pd.concat([merged_df, df], ignore_index=True)
 
 	return merged_df
 
@@ -85,24 +85,23 @@ def get_truvari_resuls(file_paths):
 
 			relevant_data = {
 				"Tool": filename.split(".")[0],
-				"TP_base": data["TP-base"].iloc[0],
-				"TP_comp": data["TP-comp"].iloc[0],
-				"FP": data["FP"].iloc[0],
-				"FN": data["FN"].iloc[0],
-				"Precision": data["precision"].iloc[0],
-				"Recall": data["recall"].iloc[0],
-				"F1": data["f1"].iloc[0]}
+				"TP_base": int(data["TP-base"].iloc[0]),
+				"TP_comp": int(data["TP-comp"].iloc[0]),
+				"FP": int(data["FP"].iloc[0]),
+				"FN": int(data["FN"].iloc[0]),
+				"Precision": float(data["precision"].iloc[0]),
+				"Recall": float(data["recall"].iloc[0]),
+				"F1": float(data["f1"].iloc[0])}
 
 		df = pd.DataFrame([relevant_data])
-		merged_df = pd.concat([merged_df, df])
+		merged_df = pd.concat([merged_df, df], ignore_index=True)
 
 	return merged_df
 
 def get_wittyer_resuls(file_paths):
 	# Initialize an empty DataFrame to store the merged data
 	merged_df = pd.DataFrame()
 
-	# Iterate over each table file
 	for file in file_paths:
 	# Read the json into a DataFrame
 		filename = os.path.basename(file)
@@ -115,17 +114,17 @@ def get_wittyer_resuls(file_paths):
 					relevant_data.append({
 						"Tool": filename.split(".")[0],
 						"StatsType": stats["StatsType"],
-						"TP_base": stats["TruthTpCount"],
-						"TP_comp": stats["QueryTpCount"],
-						"FP": stats["QueryFpCount"],
-						"FN": stats["TruthFnCount"],
-						"Precision": stats["Precision"],
-						"Recall": stats["Recall"],
-						"F1": stats["Fscore"]}
-					)
+						"TP_base": int(stats["TruthTpCount"]) if pd.notna(stats["TruthTpCount"]) else 0,
+						"TP_comp": int(stats["QueryTpCount"]) if pd.notna(stats["QueryTpCount"]) else 0,
+						"FP": int(stats["QueryFpCount"]) if pd.notna(stats["QueryFpCount"]) else 0,
+						"FN": int(stats["TruthFnCount"]) if pd.notna(stats["TruthFnCount"]) else 0,
+						"Precision": float(stats["Precision"]) if pd.notna(stats["Precision"]) else float('nan'),
+						"Recall": float(stats["Recall"]) if pd.notna(stats["Recall"]) else float('nan'),
+						"F1": float(stats["Fscore"]) if pd.notna(stats["Fscore"]) else float('nan')
+					})
 
 		df = pd.DataFrame(relevant_data)
-		merged_df = pd.concat([merged_df, df])
+		merged_df = pd.concat([merged_df, df], ignore_index=True)
 
 	return merged_df
 
@@ -153,8 +152,14 @@ def get_rtgtools_resuls(file_paths):
 		df['Tool'] = filename.split(".")[0]
 		df_redesigned = df[['Tool', 'Threshold','True-pos-baseline','True-pos-call','False-pos','False-neg','Precision','Sensitivity','F-measure']]
 		df_redesigned.columns = ['Tool', 'Threshold','TP_base','TP_call','FP','FN','Precision','Recall','F1']
+		# Convert relevant columns to integers, handling potential NaN values
+		int_columns = ['TP_base', 'FN', 'TP_call', 'FP']
+		float_columns = ['Recall','Precision','F1']
+		df_redesigned[int_columns] = df_redesigned[int_columns].fillna(0).astype(int)
+		df_redesigned[float_columns] = df_redesigned[float_columns].fillna(0).astype(float)
+
+		merged_df = pd.concat([merged_df, df_redesigned], ignore_index=True)
 
-		merged_df = pd.concat([merged_df, df_redesigned])
 	return merged_df
 
 def get_happy_resuls(file_paths):
@@ -172,7 +177,14 @@ def get_happy_resuls(file_paths):
 		df_redesigned = df[['Tool', 'Type','Filter','TRUTH.TOTAL','TRUTH.TP','TRUTH.FN','QUERY.TOTAL','QUERY.FP','QUERY.UNK','FP.gt','FP.al','METRIC.Recall','METRIC.Precision','METRIC.Frac_NA','METRIC.F1_Score','TRUTH.TOTAL.TiTv_ratio','QUERY.TOTAL.TiTv_ratio','TRUTH.TOTAL.het_hom_ratio','QUERY.TOTAL.het_hom_ratio']]
 		df_redesigned.columns = ['Tool', 'Type','Filter','TP_base','TP','FN','TP_call','FP','UNK','FP_gt','FP_al','Recall','Precision','Frac_NA','F1','TRUTH_TiTv_ratio','QUERY_TiTv_ratio','TRUTH_het_hom_ratio','QUERY_het_hom_ratio']
 
-		merged_df = pd.concat([merged_df, df_redesigned])
+		# Convert relevant columns to integers, handling potential NaN values
+		int_columns = ['TP_base', 'TP', 'FN', 'TP_call', 'FP', 'UNK', 'FP_gt', 'FP_al']
+		float_columns = ['Recall','Precision','Frac_NA','F1','TRUTH_TiTv_ratio','QUERY_TiTv_ratio','TRUTH_het_hom_ratio','QUERY_het_hom_ratio']
+		df_redesigned[int_columns] = df_redesigned[int_columns].fillna(0).astype(int)
+		df_redesigned[float_columns] = df_redesigned[float_columns].fillna(0).astype(float)
+
+		# Concatenate with the merged DataFrame
+		merged_df = pd.concat([merged_df, df_redesigned], ignore_index=True)
 
 	return merged_df
 
@@ -189,8 +201,13 @@ def get_sompy_resuls(file_paths, vartype):
 		df['Tool'] = filename.split(".")[0]
 		df_redesigned = df[['Tool','type','total.truth','tp','fn','total.query','fp','unk','recall','precision','recall_lower','recall_upper','recall2','precision_lower','precision_upper','na','ambiguous','fp.region.size','fp.rate']]
 		df_redesigned.columns = ['Tool','Type','TP_base','TP','FN','TP_call','FP','UNK','Recall','Precision','recall_lower','recall_upper','recall2','precision_lower','precision_upper','na','ambiguous','fp.region.size','fp.rate']
+		# Convert relevant columns to integers, handling potential NaN values
+		int_columns = ['TP_base', 'TP', 'FN', 'TP_call', 'FP', 'UNK']
+		float_columns = ['Recall','Precision','recall_lower','recall_upper','recall2','precision_lower','precision_upper','na','ambiguous','fp.region.size','fp.rate']
+		df_redesigned[int_columns] = df_redesigned[int_columns].fillna(0).astype(int)
+		df_redesigned[float_columns] = df_redesigned[float_columns].fillna(0).astype(float)
 
-		merged_df = pd.concat([merged_df, df_redesigned])
+		merged_df = pd.concat([merged_df, df_redesigned], ignore_index=True)
 
 	if vartype == "snv":
 		merged_df1 = merged_df[merged_df["Type"] == 'SNVs']
 
@@ -277,6 +277,14 @@ process {
             mode: params.publish_dir_mode
         ]
     }
+    withName: DATAVZRD {
+        ext.prefix = {"${meta.id}"}
+        publishDir = [
+            path: {"${params.outdir}/summary/datavzrd/${meta.vartype}"},
+            pattern: "*",
+            mode: params.publish_dir_mode
+        ]
+    }
     // compare vcf results
     withName: "TABIX_BGZIP*"{
         ext.prefix = {input.toString() - ".vcf.gz"}
@@ -347,7 +355,7 @@ process {
 // Don't publish results for these processes
 //
 process {
-    withName: 'TABIX_TABIX|TABIX_BGZIP|TABIX_BGZIPTABIX|BGZIP_TABIX|SURVIVOR_MERGE|BCFTOOLS_MERGE|REFORMAT_HEADER|BCFTOOLS_NORM|BCFTOOLS_DEDUP|BCFTOOLS_REHEADER|SORT_BED|UCSC_LIFTOVER|PICARD_LIFTOVERVCF|BCFTOOLS_VIEW_SUBSAMPLE' {
+    withName: 'TABIX_TABIX|TABIX_BGZIP|TABIX_BGZIPTABIX|BGZIP_TABIX|SURVIVOR_MERGE|BCFTOOLS_MERGE|REFORMAT_HEADER|BCFTOOLS_NORM|BCFTOOLS_DEDUP|BCFTOOLS_REHEADER|SORT_BED|UCSC_LIFTOVER|PICARD_LIFTOVERVCF|BCFTOOLS_VIEW_SUBSAMPLE|CREATE_DATAVZRD_INPUT' {
         publishDir = [
             path: { "${params.outdir}/test" },
             enabled: false
 
@@ -55,6 +55,11 @@
                         "git_sha": "a5377837fe9013bde89de8689829e83e84086536",
                         "installed_by": ["modules"]
                     },
+                    "datavzrd": {
+                        "branch": "master",
+                        "git_sha": "666652151335353eef2fcd58880bcef5bc2928e1",
+                        "installed_by": ["modules"]
+                    },
                     "happy/happy": {
                         "branch": "master",
                         "git_sha": "41fc46dfd94dddf4fdee633629090c1c3bc9f668",
 
@@ -0,0 +1,17 @@
+process CREATE_DATAVZRD_INPUT {
+    tag "$meta.id"
+    label 'process_single'
+
+    input:
+    tuple val(meta), path(csv), path(template)
+
+    output:
+    tuple val(meta), path("*.yaml"), path(csv), emit: config
+
+    script:
+    """
+    #!/bin/bash
+
+    cat "$template" | sed "s|CSVPATH|$csv|g" > config.yaml
+    """
+}