YatingMusic
diff --git a/‎README.md
+6-6 b/‎README.md
+6-6
diff --git a/‎cog.yaml
+18 b/‎cog.yaml
+18
diff --git a/‎dataset/Dataset.md
+5-5 b/‎dataset/Dataset.md
+5-5
diff --git a/‎dataset/corpus/.DS_Store
4 KB b/‎dataset/corpus/.DS_Store
4 KB
diff --git a/‎dataset/midi_analyzed/.DS_Store
0 Bytes b/‎dataset/midi_analyzed/.DS_Store
0 Bytes
diff --git a/‎dataset/midi_analyzed/keep b/‎dataset/midi_analyzed/keep
diff --git a/‎dataset/midi_synchronized/.DS_Store
2 KB b/‎dataset/midi_synchronized/.DS_Store
2 KB
diff --git a/‎dataset/midi_synchronized/keep b/‎dataset/midi_synchronized/keep
diff --git a/‎dataset/midi_transcribed/.DS_Store
0 Bytes b/‎dataset/midi_transcribed/.DS_Store
0 Bytes
diff --git a/‎dataset/midi_transcribed/keep b/‎dataset/midi_transcribed/keep
diff --git a/‎dataset/representations/cond-ls2midi/keep b/‎dataset/representations/cond-ls2midi/keep
diff --git a/‎dataset/representations/uncond/cp/.DS_Store
0 Bytes b/‎dataset/representations/uncond/cp/.DS_Store
0 Bytes
diff --git a/‎dataset/representations/uncond/remi/.DS_Store
0 Bytes b/‎dataset/representations/uncond/remi/.DS_Store
0 Bytes
diff --git a/‎predict.py
+117 b/‎predict.py
+117
diff --git a/‎dataset/corpus/keep ‎workspace/uncond/cp-linear/__init__.py b/‎dataset/corpus/keep ‎workspace/uncond/cp-linear/__init__.py
diff --git a/‎workspace/uncond/cp-linear/gen_midis/get_0.mid
-8.29 KB b/‎workspace/uncond/cp-linear/gen_midis/get_0.mid
-8.29 KB
diff --git a/‎workspace/uncond/cp-linear/gen_midis/get_1.mid
-9.49 KB b/‎workspace/uncond/cp-linear/gen_midis/get_1.mid
-9.49 KB
diff --git a/‎workspace/uncond/cp-linear/gen_midis/get_10.mid
-10 KB b/‎workspace/uncond/cp-linear/gen_midis/get_10.mid
-10 KB
diff --git a/‎workspace/uncond/cp-linear/gen_midis/get_11.mid
-7.78 KB b/‎workspace/uncond/cp-linear/gen_midis/get_11.mid
-7.78 KB
diff --git a/‎workspace/uncond/cp-linear/gen_midis/get_12.mid
-9.63 KB b/‎workspace/uncond/cp-linear/gen_midis/get_12.mid
-9.63 KB
diff --git a/‎workspace/uncond/cp-linear/gen_midis/get_13.mid
-8.21 KB b/‎workspace/uncond/cp-linear/gen_midis/get_13.mid
-8.21 KB
diff --git a/‎workspace/uncond/cp-linear/gen_midis/get_14.mid
-7.34 KB b/‎workspace/uncond/cp-linear/gen_midis/get_14.mid
-7.34 KB
diff --git a/‎workspace/uncond/cp-linear/gen_midis/get_15.mid
-8.2 KB b/‎workspace/uncond/cp-linear/gen_midis/get_15.mid
-8.2 KB
diff --git a/‎workspace/uncond/cp-linear/gen_midis/get_16.mid
-12.3 KB b/‎workspace/uncond/cp-linear/gen_midis/get_16.mid
-12.3 KB
diff --git a/‎workspace/uncond/cp-linear/gen_midis/get_17.mid
-6.48 KB b/‎workspace/uncond/cp-linear/gen_midis/get_17.mid
-6.48 KB
diff --git a/‎workspace/uncond/cp-linear/gen_midis/get_18.mid
-7.97 KB b/‎workspace/uncond/cp-linear/gen_midis/get_18.mid
-7.97 KB
diff --git a/‎workspace/uncond/cp-linear/gen_midis/get_19.mid
-9.76 KB b/‎workspace/uncond/cp-linear/gen_midis/get_19.mid
-9.76 KB
diff --git a/‎workspace/uncond/cp-linear/gen_midis/get_2.mid
-10.3 KB b/‎workspace/uncond/cp-linear/gen_midis/get_2.mid
-10.3 KB
diff --git a/‎workspace/uncond/cp-linear/gen_midis/get_20.mid
-7.32 KB b/‎workspace/uncond/cp-linear/gen_midis/get_20.mid
-7.32 KB
diff --git a/‎workspace/uncond/cp-linear/gen_midis/get_21.mid
-8.15 KB b/‎workspace/uncond/cp-linear/gen_midis/get_21.mid
-8.15 KB
diff --git a/‎workspace/uncond/cp-linear/gen_midis/get_22.mid
-7.69 KB b/‎workspace/uncond/cp-linear/gen_midis/get_22.mid
-7.69 KB
diff --git a/‎workspace/uncond/cp-linear/gen_midis/get_23.mid
-8.92 KB b/‎workspace/uncond/cp-linear/gen_midis/get_23.mid
-8.92 KB
diff --git a/‎workspace/uncond/cp-linear/gen_midis/get_24.mid
-8.92 KB b/‎workspace/uncond/cp-linear/gen_midis/get_24.mid
-8.92 KB
diff --git a/‎workspace/uncond/cp-linear/gen_midis/get_25.mid
-8.31 KB b/‎workspace/uncond/cp-linear/gen_midis/get_25.mid
-8.31 KB
diff --git a/‎workspace/uncond/cp-linear/gen_midis/get_26.mid
-8.02 KB b/‎workspace/uncond/cp-linear/gen_midis/get_26.mid
-8.02 KB
diff --git a/‎workspace/uncond/cp-linear/gen_midis/get_27.mid
-6.14 KB b/‎workspace/uncond/cp-linear/gen_midis/get_27.mid
-6.14 KB
diff --git a/‎workspace/uncond/cp-linear/gen_midis/get_28.mid
-8.02 KB b/‎workspace/uncond/cp-linear/gen_midis/get_28.mid
-8.02 KB
diff --git a/‎workspace/uncond/cp-linear/gen_midis/get_29.mid
-10.5 KB b/‎workspace/uncond/cp-linear/gen_midis/get_29.mid
-10.5 KB
diff --git a/‎workspace/uncond/cp-linear/gen_midis/get_3.mid
-7.25 KB b/‎workspace/uncond/cp-linear/gen_midis/get_3.mid
-7.25 KB
diff --git a/‎workspace/uncond/cp-linear/gen_midis/get_30.mid
-6.51 KB b/‎workspace/uncond/cp-linear/gen_midis/get_30.mid
-6.51 KB
diff --git a/‎workspace/uncond/cp-linear/gen_midis/get_31.mid
-8.57 KB b/‎workspace/uncond/cp-linear/gen_midis/get_31.mid
-8.57 KB
diff --git a/‎workspace/uncond/cp-linear/gen_midis/get_32.mid
-9.25 KB b/‎workspace/uncond/cp-linear/gen_midis/get_32.mid
-9.25 KB
diff --git a/‎workspace/uncond/cp-linear/gen_midis/get_33.mid
-7.31 KB b/‎workspace/uncond/cp-linear/gen_midis/get_33.mid
-7.31 KB
diff --git a/‎workspace/uncond/cp-linear/gen_midis/get_34.mid
-6.45 KB b/‎workspace/uncond/cp-linear/gen_midis/get_34.mid
-6.45 KB
diff --git a/‎workspace/uncond/cp-linear/gen_midis/get_35.mid
-9.24 KB b/‎workspace/uncond/cp-linear/gen_midis/get_35.mid
-9.24 KB
diff --git a/‎workspace/uncond/cp-linear/gen_midis/get_36.mid
-9.05 KB b/‎workspace/uncond/cp-linear/gen_midis/get_36.mid
-9.05 KB
diff --git a/‎workspace/uncond/cp-linear/gen_midis/get_37.mid
-11.7 KB b/‎workspace/uncond/cp-linear/gen_midis/get_37.mid
-11.7 KB
diff --git a/‎workspace/uncond/cp-linear/gen_midis/get_38.mid
-7.82 KB b/‎workspace/uncond/cp-linear/gen_midis/get_38.mid
-7.82 KB
diff --git a/‎workspace/uncond/cp-linear/gen_midis/get_39.mid
-6.38 KB b/‎workspace/uncond/cp-linear/gen_midis/get_39.mid
-6.38 KB
diff --git a/‎workspace/uncond/cp-linear/gen_midis/get_4.mid
-6.99 KB b/‎workspace/uncond/cp-linear/gen_midis/get_4.mid
-6.99 KB
diff --git a/‎workspace/uncond/cp-linear/gen_midis/get_40.mid
-7.74 KB b/‎workspace/uncond/cp-linear/gen_midis/get_40.mid
-7.74 KB
diff --git a/‎workspace/uncond/cp-linear/gen_midis/get_41.mid
-7.72 KB b/‎workspace/uncond/cp-linear/gen_midis/get_41.mid
-7.72 KB
diff --git a/‎workspace/uncond/cp-linear/gen_midis/get_42.mid
-9.68 KB b/‎workspace/uncond/cp-linear/gen_midis/get_42.mid
-9.68 KB
diff --git a/‎workspace/uncond/cp-linear/gen_midis/get_43.mid
-6.73 KB b/‎workspace/uncond/cp-linear/gen_midis/get_43.mid
-6.73 KB
diff --git a/‎workspace/uncond/cp-linear/gen_midis/get_44.mid
-6.33 KB b/‎workspace/uncond/cp-linear/gen_midis/get_44.mid
-6.33 KB
diff --git a/‎workspace/uncond/cp-linear/gen_midis/get_45.mid
-7.17 KB b/‎workspace/uncond/cp-linear/gen_midis/get_45.mid
-7.17 KB
diff --git a/‎workspace/uncond/cp-linear/gen_midis/get_46.mid
-11.9 KB b/‎workspace/uncond/cp-linear/gen_midis/get_46.mid
-11.9 KB
diff --git a/‎workspace/uncond/cp-linear/gen_midis/get_47.mid
-7.24 KB b/‎workspace/uncond/cp-linear/gen_midis/get_47.mid
-7.24 KB
diff --git a/‎workspace/uncond/cp-linear/gen_midis/get_48.mid
-9.53 KB b/‎workspace/uncond/cp-linear/gen_midis/get_48.mid
-9.53 KB
diff --git a/‎workspace/uncond/cp-linear/gen_midis/get_49.mid
-10.2 KB b/‎workspace/uncond/cp-linear/gen_midis/get_49.mid
-10.2 KB
diff --git a/‎workspace/uncond/cp-linear/gen_midis/get_5.mid
-5.78 KB b/‎workspace/uncond/cp-linear/gen_midis/get_5.mid
-5.78 KB
diff --git a/‎workspace/uncond/cp-linear/gen_midis/get_6.mid
-6.91 KB b/‎workspace/uncond/cp-linear/gen_midis/get_6.mid
-6.91 KB
diff --git a/‎workspace/uncond/cp-linear/gen_midis/get_7.mid
-7.72 KB b/‎workspace/uncond/cp-linear/gen_midis/get_7.mid
-7.72 KB
diff --git a/‎workspace/uncond/cp-linear/gen_midis/get_8.mid
-7.68 KB b/‎workspace/uncond/cp-linear/gen_midis/get_8.mid
-7.68 KB
diff --git a/‎workspace/uncond/cp-linear/gen_midis/get_9.mid
-8.41 KB b/‎workspace/uncond/cp-linear/gen_midis/get_9.mid
-8.41 KB
@@ -0,0 +1,18 @@
+build:
+  python_version: "3.6"
+  gpu: True
+  python_packages:
+    - cython==3.0.0a9
+    - torch==1.5.0
+    - miditoolkit==0.1.14
+    - tqdm==4.62.2
+    - pylab-sdk==1.3.2
+    - matplotlib==3.3.4
+    - midi2audio==0.1.1
+  system_packages:
+    - fluidsynth --fix-missing
+    - ffmpeg
+  pre_install:
+    - "pip install madmom"
+    - "pip install pytorch-fast-transformers"
+predict: "predict.py:Predictor"
@@ -0,0 +1,117 @@
+import datetime
+import glob
+import json
+import math
+import os
+import pickle
+import random
+import sys
+import tempfile
+import time
+from pathlib import Path
+import subprocess
+
+import cog
+import numpy as np
+import torch
+import torch.nn as nn
+import torch.nn.functional as F
+import torch.optim as optim
+from midi2audio import FluidSynth
+from torch.nn.utils import clip_grad_norm_
+from torch.utils.data import DataLoader, Dataset
+from tqdm.notebook import tqdm
+
+sys.path.append("workspace/uncond/cp-linear")
+from main_cp import *
+
+
+class Predictor(cog.Predictor):
+    def setup(self):
+        """Load model"""
+        path_data_root = "dataset/representations/uncond/cp/ailab17k_from-scratch_cp"
+        path_dictionary = os.path.join(path_data_root, "dictionary.pkl")
+        path_ckpt = "checkpoints"  # path to ckpt dir
+        loss = 25  # loss
+        name = "loss_" + str(loss)
+        path_saved_ckpt = os.path.join(path_ckpt, name + "_params.pt")
+
+        # load
+        dictionary = pickle.load(open(path_dictionary, "rb"))
+        event2word, word2event = dictionary
+
+        # config
+        n_class = []
+        for key in event2word.keys():
+            n_class.append(len(dictionary[0][key]))
+
+        # init model
+        net = TransformerModel(n_class, is_training=False)
+        net.cuda()
+        net.eval()
+
+        # load model
+        print("[*] load model from:", path_saved_ckpt)
+        net.load_state_dict(torch.load(path_saved_ckpt))
+
+        self.net = net
+        self.word2event = word2event
+        self.event2word = event2word
+        self.dictionary = dictionary
+        # self.fs = FluidSynth()
+
+    @cog.input("seed", type=int, default=-1, help="Random seed, -1 for random")
+    @cog.input(
+        "output_type",
+        type=str,
+        default="audio",
+        options=["audio", "midi"],
+        help="Output file type, can be audio or midi",
+    )
+    def predict(self, seed, output_type):
+        """Compute prediction"""
+        if seed >= 0:
+            random.seed(seed)
+            np.random.seed(seed)
+            torch.backends.cudnn.deterministic = True
+            torch.backends.cudnn.benchmark = False
+            torch.manual_seed(seed)
+
+        output_path_midi = Path(tempfile.mkdtemp()) / "output.mid"
+        output_path_wav = Path(tempfile.mkdtemp()) / "output.wav"
+        output_path_mp3 = Path(tempfile.mkdtemp()) / "output.mp3"
+        res = None
+        while res is None:
+            # because sometimes happens: ValueError: probabilities contain NaN
+            try:
+                res = self.net.inference_from_scratch(self.dictionary)
+            except:
+                print("Generation failed... Re-trying")
+
+        write_midi(res, str(output_path_midi), self.word2event)
+
+        if output_type == "audio":
+            command_fs = (
+                "fluidsynth -ni /usr/share/sounds/sf2/FluidR3_GM.sf2 "
+                + str(output_path_midi)
+                + " -F "
+                + str(output_path_wav)
+                + " -r 44100"
+            )
+            os.system(command_fs)
+            # self.fs.midi_to_audio(str(output_path_midi), str(output_path_wav))
+            subprocess.check_output(
+                [
+                    "ffmpeg",
+                    "-i",
+                    str(output_path_wav),
+                    "-af",
+                    "silenceremove=1:0:-50dB,aformat=dblp,areverse,silenceremove=1:0:-50dB,aformat=dblp,areverse",  # strip silence
+                    str(output_path_mp3),
+                ],
+            )
+
+            return output_path_mp3
+
+        elif output_type == "midi":
+            return output_path_midi