fix ci issue

2025-12-25 12:39:25 +01:00 · 2023-09-25 23:53:36 +08:00
parent 614889e351
commit 6c7a19ca35
3 changed files with 18 additions and 10 deletions
--- a/modelscope/models/nlp/space/model/gen_unified_transformer.py
+++ b/modelscope/models/nlp/space/model/gen_unified_transformer.py
@@ -14,7 +14,8 @@ class GenUnifiedTransformer(UnifiedTransformer):
        super(GenUnifiedTransformer, self).__init__(model_dir, config, reader,
                                                    generator)
        self.understand = config.BPETextField.understand
-
+        if torch.cuda.is_available():
+            self.use_gpu = True
        if self.use_gpu:
            self.cuda()
        return
@@ -201,15 +202,21 @@ class GenUnifiedTransformer(UnifiedTransformer):
        mask = state['mask']

        # shape: [batch_size, 1, 1]
-        pred_token = state['pred_token']
-        pred_mask = state['pred_mask']
-        pred_pos = state['pred_pos']
-        pred_type = state['pred_type']
-        pred_turn = state['pred_turn']
+        if self.use_gpu:
+            pred_token = state['pred_token'].cuda()
+            pred_mask = state['pred_mask'].cuda()
+            pred_pos = state['pred_pos'].cuda()
+            pred_type = state['pred_type'].cuda()
+            pred_turn = state['pred_turn'].cuda()
+        else:
+            pred_token = state['pred_token']
+            pred_mask = state['pred_mask']
+            pred_pos = state['pred_pos']
+            pred_type = state['pred_type']
+            pred_turn = state['pred_turn']

        # list of shape(len: num_layers): [batch_size, seq_len, hidden_dim]
        cache = state['cache']
-
        pred_embed = self.embedder(pred_token, pred_pos, pred_type,
                                   pred_turn).squeeze(-2)
        pred_embed = self.embed_layer_norm(pred_embed)
@@ -266,7 +273,7 @@ class GenUnifiedTransformer(UnifiedTransformer):
                src_pos=inputs['src_pos'],
                src_type=inputs['src_type'],
                src_turn=inputs['src_turn'])
-
+        
        # Generation process.
        gen_results = self.generator(
            step_fn=self._decode,
--- a/modelscope/models/nlp/space/model/generator.py
+++ b/modelscope/models/nlp/space/model/generator.py
@@ -67,6 +67,8 @@ class SpaceGenerator(object):
        self.min_gen_len = config.Generator.min_gen_len
        self.max_gen_len = config.Generator.max_gen_len
        self.use_gpu = config.use_gpu
+        if torch.cuda.is_available():
+            self.use_gpu = True
        assert 1 <= self.min_gen_len <= self.max_gen_len
        return

@@ -184,7 +186,6 @@ class BeamSearch(SpaceGenerator):
            unk_penalty = unk_penalty.cuda()
            eos_penalty = eos_penalty.cuda()
            scores_after_end = scores_after_end.cuda()
-
        if self.ignore_unk:
            scores = scores + unk_penalty
        scores = scores + eos_penalty
--- a/tests/trainers/test_lora_diffusion_xl_trainer.py
+++ b/tests/trainers/test_lora_diffusion_xl_trainer.py
@@ -35,7 +35,7 @@ class TestLoraDiffusionXLTrainer(unittest.TestCase):
        shutil.rmtree(self.tmp_dir)
        super().tearDown()

-    @unittest.skipUnless(test_level() >= 0, 'skip test in current test level')
+    @unittest.skipUnless(test_level() >= 1, 'skip test for oom')
    def test_lora_diffusion_xl_train(self):
        model_id = 'AI-ModelScope/stable-diffusion-xl-base-1.0'
        model_revision = 'v1.0.2'