Add more recipes

yuiseki · yuiseki · commit e7768f362fe5 · 2024-05-05T16:16:17.000+09:00
diff --git a/recipes/A5000_24GB_x8/Mistral-7B-v0.1/coder-sql-en.yaml b/recipes/A5000_24GB_x8/Mistral-7B-v0.1/coder-sql-en.yaml
@@ -0,0 +1,18 @@
+target_task: tasks/text-generation/text2sql.md
+base_model_id: mistralai/Mistral-7B-v0.1
+model_name: Mistral-7B-v0.1-coder-sql-en-v0.1
+output_base_dir: output
+dataset_id: b-mc2/sql-create-context
+dataset_input_field_name: question
+dataset_context_hint: Given the context, generate an SQL query that answers the question
+dataset_context_field_name: context
+dataset_output_field_name: answer
+dataset_train_split_seed: 42
+dataset_train_split_test_size: 0.2
+lora_r: 8
+lora_alpha: 16
+lora_dropout: 0.05
+train_claim_gpu_num: 8
+train_per_device_train_batch_size: 1
+train_gradient_accumulation_steps: 16
+train_num_train_epochs: 4
diff --git a/recipes/A5000_24GB_x8/coder-trident-en.yaml b/recipes/A5000_24GB_x8/coder-trident-en.yaml
@@ -0,0 +1,18 @@
+target_task: tasks/nlp/translation.md
+base_model_id: TinyLlama/TinyLlama-1.1B-intermediate-step-1431k-3T
+model_name: tinyllama-coder-trident-v0.1
+output_base_dir: output
+dataset_id: yuiseki/text2geoql
+dataset_filter_field_name: input_type
+dataset_filter_field_value: trident
+dataset_input_field_name: input
+dataset_output_field_name: output
+dataset_train_split_seed: 42
+dataset_train_split_test_size: 0.2
+lora_r: 8
+lora_alpha: 16
+lora_dropout: 0.05
+train_claim_gpu_num: 8
+train_per_device_train_batch_size: 8
+train_gradient_accumulation_steps: 2
+train_num_train_epochs: 4