Corrected inference_library for DirectML

Chris Maunder · Chris Maunder · commit 98bf0675aa45 · 2024-08-21T14:55:39.000-04:00
diff --git a/multimode_llm_adapter.py b/multimode_llm_adapter.py
@@ -32,7 +32,7 @@ def initialise(self) -> None:
                 print("*** Multi-modal LLM using CPU only: This module requires > 16Gb RAM")
                 self.inference_device  = "CPU"
                 self.device            = "cpu"
-                self.inference_library = "ONNX"
+                self.inference_library = "ONNX/DML" if self.system_info.os == "Windows" else "ONNX"
                 self.model_repo        = "microsoft/Phi-3-vision-128k-instruct-onnx-cpu"
                 self.model_filename    = None # "Phi-3-vision-128k-instruct.gguf"
                 self.models_dir        = "cpu-int4-rtn-block-32-acc-level-4"