fixup mocker

ForBetterCodeNine · ForBetterCodeNine · commit 1c2492904f8d · 2025-11-20T20:08:05.000+08:00
Signed-off-by: CodeNine-CJ &lt;chenjian343@huawei.com&gt;
diff --git a/tests/ut/torchair/test_torchair_model_runner.py b/tests/ut/torchair/test_torchair_model_runner.py
@@ -1,9 +1,9 @@
-from unittest.mock import MagicMock, Mock, patch
+from unittest.mock import MagicMock, Mock
 
 import pytest
 import torch
 from pytest_mock import MockerFixture
-from vllm.config import VllmConfig
+from vllm.config import CacheConfig, VllmConfig
 
 from tests.ut.base import PytestBase
 from vllm_ascend.torchair.torchair_model_runner import NPUTorchairModelRunner
@@ -17,6 +17,11 @@ def setup_npu_torchair_model_runner(self, mocker: MockerFixture):
         vllm_config.model_config = MagicMock()
         vllm_config.model_config.hf_config = MagicMock()
         vllm_config.model_config.hf_config.index_topk = 2
+        cache_config = CacheConfig(block_size=16)
+        vllm_config.cache_config = cache_config
+        speculative_config = MagicMock()
+        speculative_config.num_speculative_tokens = 4
+        vllm_config.speculative_config = speculative_config
 
         device = torch.device("npu:0")
 
@@ -29,11 +34,11 @@ def setup_npu_torchair_model_runner(self, mocker: MockerFixture):
         ascend_config.torchair_graph_config.graph_batch_sizes = [1, 2, 4]
         ascend_config.torchair_graph_config.graph_batch_sizes_init = True
 
-        mocker.patch(
-            "vllm_ascend.worker.model_runner_v1.NPUModelRunner.__init__",
-            return_value=None)
+        # mocker.patch(
+        #     "vllm_ascend.worker.model_runner_v1.NPUModelRunner.__init__",
+        #     return_value=None)
 
-        mocker.patch("vllm_ascend.get_ascend_config",
+        mocker.patch("vllm_ascend.utils.get_ascend_config",
                      return_value=ascend_config)
         mocker.patch("vllm_ascend.torchair.utils.register_torchair_model")
         mocker.patch("vllm_ascend.torchair.utils.torchair_ops_patch")
@@ -45,17 +50,16 @@ def setup_npu_torchair_model_runner(self, mocker: MockerFixture):
         mock_attn_builder = Mock()
         mock_attn_backend = Mock()
         mock_attn_backend.get_builder_cls.return_value = lambda *args, **kwargs: mock_attn_builder
-        with patch.object(NPUTorchairModelRunner, 'attn_backend',
-                          mock_attn_backend):
-            with patch.object(NPUTorchairModelRunner, 'speculative_config',
-                              MagicMock()):
-                NPUTorchairModelRunner.decode_token_per_req = 1
-                NPUTorchairModelRunner.max_num_tokens = 10
 
-                runner = NPUTorchairModelRunner(vllm_config, device)
-                runner.vllm_config = vllm_config
-                runner.device = device
-                runner.attn_backend = mock_attn_backend
+        NPUTorchairModelRunner.decode_token_per_req = 1
+        NPUTorchairModelRunner.max_num_tokens = 10
+
+        runner = NPUTorchairModelRunner(vllm_config, device)
+        runner.vllm_config = vllm_config
+        runner.device = device
+        runner.attn_backend = mock_attn_backend
+        runner.ascend_config = ascend_config
+        runner.model_config = vllm_config.model_config
 
         return runner
 
diff --git a/tests/ut/torchair/test_torchair_mtp_proposer.py b/tests/ut/torchair/test_torchair_mtp_proposer.py
@@ -2,7 +2,8 @@
 
 import pytest
 import torch
-from vllm.config import VllmConfig
+from pytest_mock import MockerFixture
+from vllm.config import CacheConfig, VllmConfig
 
 from tests.ut.base import PytestBase
 from vllm_ascend.torchair.torchair_mtp_proposer import TorchairMtpProposer
@@ -15,25 +16,48 @@ class TestTorchairMtpProposer(PytestBase):
     def setup_torchair_mtp_proposer(self, mocker: MockerFixture):
         vllm_config = MagicMock(spec=VllmConfig)
         vllm_config.device_config = MagicMock()
-        vllm_config.device_config.device = torch.device("npu:0")
+        vllm_config.device_config.device = torch.device("cpu")
         vllm_config.speculative_config = MagicMock()
         vllm_config.speculative_config.draft_model_config = MagicMock()
         vllm_config.speculative_config.draft_model_config.dtype = torch.float16
+        # vllm_config.speculative_config.draft_model_config.get_hidden_size = lambda: 4096
+        vllm_config.speculative_config.method = "deepseek_mtp"
+        vllm_config.speculative_config.num_speculative_tokens = 5
+
+        # vllm_config.model_config = MagicMock(
+        #     dtype=torch.float16,
+        #     max_model_len=2048,
+        #     uses_mrope=False,
+        #     hf_config=MagicMock(index_topk=2)
+        # )
         vllm_config.load_config = MagicMock()
-
-        device = torch.device("npu:0")
+        cache_config = CacheConfig(block_size=16)
+        vllm_config.cache_config = cache_config
+        vllm_config.scheduler_config = MagicMock(max_num_batched_tokens=1024,
+                                                 max_num_seqs=64)
+        # vllm_config.compilation_config = MagicMock()
+        # vllm_config.compilation_config.cudagraph_mode = None
+
+        device = torch.device("cpu")
         runner = MagicMock()
+        runner.pcp_size = 1
+        runner.dcp_size = 1
+        runner.pcp_rank = 0
+        runner.max_num_tokens = 1024
+        runner.max_num_reqs = 10
+        runner._use_aclgraph.return_value = True
 
-        mocker.patch("vllm_ascend.torchair_mtp_proposer.__init__",
-                     return_value=None)
+        mocker.patch(
+            "vllm_ascend.torchair.torchair_mtp_proposer.MtpProposer.__init__",
+            return_value=None)
 
         if vllm_version_is("0.11.0"):
             mock_set_default_dtype = mocker.patch(
                 'vllm.model_executor.model_loader.utils.set_default_torch_dtype'
             )
         else:
             mock_set_default_dtype = mocker.patch(
-                'vllm.utls.torch_utils.set_default_torch_dtype')
+                'vllm.utils.torch_utils.set_default_torch_dtype')
         mock_set_default_dtype.return_value.__enter__.return_value = None
 
         mock_model_loader = MagicMock()
@@ -60,17 +84,15 @@ def setup_torchair_mtp_proposer(self, mocker: MockerFixture):
         proposer.vllm_config = vllm_config
         proposer.device = device
         proposer.runner = runner
+        proposer.speculative_config = vllm_config.speculative_config
+        proposer.draft_model_config = vllm_config.speculative_config.draft_model_config
+        proposer.method = vllm_config.speculative_config.method
 
         return proposer, mock_model_loader, mock_torchair_deepseek_mtp
 
     def test_init(self, setup_torchair_mtp_proposer):
         proposer, _, _, = setup_torchair_mtp_proposer
-
-        assert isinstance(proposer, setup_torchair_mtp_proposer)
-        assert proposer.torchair_compiled_model is None
-        Mock.assert_called_once_with(proposer.__class__.__bases__[0],
-                                     proposer.vllm_config, proposer.device,
-                                     proposer.runner)
+        assert isinstance(proposer, TorchairMtpProposer)
 
     def test_load_model(self, setup_torchair_mtp_proposer,
                         mocker: MockerFixture):
diff --git a/tests/ut/torchair/test_torchair_worker.py b/tests/ut/torchair/test_torchair_worker.py
@@ -54,10 +54,11 @@ def test_init_device(self, mock_platform, mock_init_dist_env):
         mock_platform.mem_get_info.return_value = (1000, 2000)
 
         with patch.object(NPUWorker, "__init__", lambda x, **kwargs: None):
-            worker = NPUWorker
+            worker = NPUWorker()
             worker.local_rank = 1
             worker.model_config = MagicMock()
             worker.model_config.seed = 42
+            worker.vllm_config = MagicMock()
 
             result = worker._init_device()
 
@@ -85,10 +86,11 @@ def test_init_device_torchair_worker(self, mock_platform,
 
         with patch.object(NPUTorchairWorker, "__init__",
                           lambda x, **kwargs: None):
-            worker = NPUTorchairWorker
+            worker = NPUTorchairWorker()
             worker.local_rank = 1
             worker.model_config = MagicMock()
             worker.model_config.seed = 42
+            worker.vllm_config = MagicMock()
 
             result = worker._init_device()