[dlinfer] fix glm-4v graph mode on ascend (InternLM#3235)

jinminxi104 · web-flow · commit 20770bef688a · 2025-03-10T14:30:40.000+08:00
* [dlinfer] support glm-4v graph mode on ascend

* lint
diff --git a/lmdeploy/pytorch/backends/dlinfer/ascend/graph_runner.py b/lmdeploy/pytorch/backends/dlinfer/ascend/graph_runner.py
@@ -9,6 +9,7 @@
 
 from lmdeploy.pytorch.config import BackendConfig, CacheConfig, ModelConfig
 from lmdeploy.pytorch.model_inputs import StepContext
+from lmdeploy.pytorch.models.chatglm2 import ChatGLMForConditionalGeneration
 from lmdeploy.pytorch.models.qwen2_vl import Qwen2VLForConditionalGeneration
 from lmdeploy.utils import get_logger
 
@@ -39,6 +40,11 @@ def __init__(self, model: torch.nn.Module, model_config: ModelConfig, cache_conf
                                                           backend='atbgraph')
             elif isinstance(self.model, Qwen2VLForConditionalGeneration):
                 self.model.model = torch.compile(self.model.model, fullgraph=True, dynamic=True, backend='atbgraph')
+            elif isinstance(self.model, ChatGLMForConditionalGeneration):
+                self.model.transformer.encoder = torch.compile(self.model.transformer.encoder,
+                                                               fullgraph=True,
+                                                               dynamic=True,
+                                                               backend='atbgraph')
             else:
                 self.model = torch.compile(self.model, fullgraph=True, dynamic=True, backend='atbgraph')