merge master& add multi-gpu for ofa

新增对ofa多GPU训练的支持 Link: https://code.alibaba-inc.com/Ali-MaaS/MaaS-lib/codereview/10838906
2025-12-25 12:39:25 +01:00 · 2022-11-23 19:08:39 +08:00
parent 9da5091d4d
commit 31689a0139
1 changed files with 2 additions and 0 deletions
--- a/modelscope/trainers/multi_modal/ofa/ofa_trainer.py
+++ b/modelscope/trainers/multi_modal/ofa/ofa_trainer.py
@@ -20,6 +20,7 @@ from modelscope.preprocessors.ofa.utils.collate import collate_fn
 from modelscope.trainers import EpochBasedTrainer
 from modelscope.trainers.builder import TRAINERS
 from modelscope.trainers.optimizer.builder import build_optimizer
+from modelscope.trainers.parallel.utils import is_parallel
 from modelscope.utils.config import Config
 from modelscope.utils.constant import (DEFAULT_MODEL_REVISION, ConfigKeys,
                                       ModeKeys)
@@ -137,6 +138,7 @@ class OFATrainer(EpochBasedTrainer):
        return cfg

    def train_step(self, model, inputs):
+        model = model.module if self._dist or is_parallel(model) else model
        model.train()
        loss, sample_size, logging_output = self.criterion(model, inputs)
        train_outputs = {'loss': loss}