modelscope/tests/pipelines/test_text_generation.py

# Copyright (c) Alibaba, Inc. and its affiliates.
import unittest

from modelscope.hub.snapshot_download import snapshot_download
from modelscope.models import Model
from modelscope.models.nlp import GPT3ForTextGeneration, PalmForTextGeneration
from modelscope.pipelines import pipeline
from modelscope.pipelines.nlp import TextGenerationPipeline
from modelscope.preprocessors import TextGenerationTransformersPreprocessor
from modelscope.utils.constant import Tasks
from modelscope.utils.streaming_output import (StreamingOutputMixin,
                                               add_stream_generate)
from modelscope.utils.test_utils import test_level


class TextGenerationTest(unittest.TestCase):

    def setUp(self) -> None:
        self.palm_model_id_zh_base = 'damo/nlp_palm2.0_text-generation_chinese-base'
        self.palm_model_id_zh_large = 'damo/nlp_palm2.0_text-generation_chinese-large'
        self.palm_model_id_zh_commodity = 'damo/nlp_palm2.0_text-generation_commodity_chinese-base'
        self.palm_model_id_zh_weather = 'damo/nlp_palm2.0_text-generation_weather_chinese-base'
        self.palm_model_id_en = 'damo/nlp_palm2.0_text-generation_english-base'
        self.palm_input_zh = """
        本文总结了十个可穿戴产品的设计原则，而这些原则，同样也是笔者认为是这个行业最吸引人的地方：
        1.为人们解决重复性问题；2.从人开始，而不是从机器开始；3.要引起注意，但不要刻意；4.提升用户能力，而不是取代
        """
        self.palm_input_commodity = '垃圾桶，双层，可拆卸，加高，加高双层，把手，垃圾桶，内附，万向轮'
        self.palm_input_weather = "今日天气类型='浮尘'&空气质量等级='重度污染'&紫外线强度指数='中等'"
        self.palm_input_en = """
        The Director of Public Prosecutions who let off Lord Janner over alleged child sex abuse started
        her career at a legal chambers when the disgraced Labour peer was a top QC there . Alison Saunders ,
        54 , sparked outrage last week when she decided the 86-year-old should not face astring of charges
        of paedophilia against nine children because he has dementia . Today , newly-released documents
        revealed damning evidence that abuse was covered up by police andsocial workers for more than 20 years .
        And now it has emerged Mrs Saunders ' law career got off to a flying start when she secured her
        pupillage -- a barrister 's training contract at 1 Garden Court Chambers in London in 1983 .
        """

        self.gpt3_base_model_id = 'damo/nlp_gpt3_text-generation_chinese-base'
        self.gpt3_large_model_id = 'damo/nlp_gpt3_text-generation_chinese-large'
        self.gpt3_poetry_large_model_id = 'damo/nlp_gpt3_poetry-generation_chinese-large'
        self.gpt3_input = '《故乡》。深蓝的天空中挂着一轮金黄的圆月，下面是海边的沙地，'
        self.gpt3_poetry_input = '天生我材必有用，'

        self.llama_model_id = 'skyline2006/llama-7b'
        self.llama_input = 'My name is Merve and my favorite'
        self.seqgpt_model_id = 'damo/nlp_seqgpt-560m'
        self.ecomgpt_model_id = 'damo/nlp_ecomgpt_multilingual-7B-ecom'

    def run_pipeline_with_model_instance(self, model_id, input):
        model = Model.from_pretrained(model_id)
        preprocessor = TextGenerationTransformersPreprocessor(
            model.model_dir,
            model.tokenizer,
            first_sequence='sentence',
            second_sequence=None)
        pipeline_ins = pipeline(
            task=Tasks.text_generation,
            model=model,
            preprocessor=preprocessor,
            external_engine_for_llm=False)
        print(pipeline_ins(input))

    def run_pipeline_with_model_id(self,
                                   model_id,
                                   input,
                                   init_kwargs={},
                                   run_kwargs={}):
        init_kwargs['external_engine_for_llm'] = False
        pipeline_ins = pipeline(
            task=Tasks.text_generation, model=model_id, **init_kwargs)
        print(pipeline_ins(input, **run_kwargs))

    def run_streaming_pipeline_with_model_id(self,
                                             model_id,
                                             input,
                                             init_kwargs={},
                                             run_kwargs={}):
        init_kwargs['external_engine_for_llm'] = False
        pipeline_ins = pipeline(
            task=Tasks.text_generation, model=model_id, **init_kwargs)

        # set stream inputs
        assert isinstance(pipeline_ins, StreamingOutputMixin)
        for output in pipeline_ins.stream_generate(
                input, **run_kwargs, external_engine_for_llm=False):
            print(output, end='\r')
        print()

    @unittest.skipUnless(test_level() >= 0, 'skip test in current test level')
    def test_palm_zh_base_with_model_name(self):
        self.run_pipeline_with_model_id(self.palm_model_id_zh_base,
                                        self.palm_input_zh)

    @unittest.skipUnless(test_level() >= 0, 'skip test in current test level')
    def test_palm_zh_base_with_model_name_with_args(self):
        self.run_pipeline_with_model_id(
            self.palm_model_id_zh_base,
            self.palm_input_zh,
            run_kwargs={
                'top_p': 0.9,
                'temperature': 0.9,
                'max_length': 64
            })

    @unittest.skipUnless(test_level() >= 0, 'skip test in current test level')
    def test_palm_zh_base_with_model_name_batch(self):
        self.run_pipeline_with_model_id(
            self.palm_model_id_zh_base, [
                self.palm_input_zh, self.palm_input_zh[:10],
                self.palm_input_zh[10:]
            ],
            run_kwargs={'batch_size': 2})

    @unittest.skipUnless(test_level() >= 0, 'skip test in current test level')
    def test_palm_zh_base_with_model_name_batch_iter(self):
        self.run_pipeline_with_model_id(
            self.palm_model_id_zh_base, [
                self.palm_input_zh, self.palm_input_zh[:10],
                self.palm_input_zh[10:]
            ],
            init_kwargs={'padding': False})

    @unittest.skipUnless(test_level() >= 0, 'skip test in current test level')
    def test_palm_en_with_model_name(self):
        self.run_pipeline_with_model_id(self.palm_model_id_en,
                                        self.palm_input_en)

    @unittest.skipUnless(test_level() >= 0, 'skip test in current test level')
    def test_gpt_base_with_model_name(self):
        self.run_pipeline_with_model_id(self.gpt3_base_model_id,
                                        self.gpt3_input)

    @unittest.skipUnless(test_level() >= 0, 'skip test in current test level')
    def test_gpt_base_with_model_name_with_args(self):
        self.run_pipeline_with_model_id(
            self.gpt3_base_model_id,
            self.gpt3_input,
            run_kwargs={
                'top_p': 0.9,
                'temperature': 0.9,
                'max_length': 64
            })

    @unittest.skipUnless(test_level() >= 0, 'skip test in current test level')
    def test_gpt_base_with_model_name_batch(self):
        self.run_pipeline_with_model_id(
            self.gpt3_base_model_id,
            [self.gpt3_input, self.gpt3_input[:10], self.gpt3_input[10:]],
            run_kwargs={'batch_size': 2})

    @unittest.skipUnless(test_level() >= 0, 'skip test in current test level')
    def test_gpt_base_with_model_name_with_streaming(self):
        self.run_streaming_pipeline_with_model_id(
            self.gpt3_base_model_id,
            self.gpt3_input,
            run_kwargs={'max_length': 64})

    @unittest.skipUnless(test_level() >= 0, 'skip test in current test level')
    def test_gpt_base_with_model_name_with_streaming_batch(self):
        self.run_streaming_pipeline_with_model_id(
            self.gpt3_base_model_id,
            [self.gpt3_input, self.gpt3_input[:10], self.gpt3_input[10:]],
            run_kwargs={
                'batch_size': 2,
                'max_length': 32
            })

    @unittest.skipUnless(test_level() >= 1, 'skip test in current test level')
    def test_gpt_base_with_model_name_batch_iter(self):
        self.run_pipeline_with_model_id(
            self.gpt3_base_model_id,
            [self.gpt3_input, self.gpt3_input[:10], self.gpt3_input[10:]])

    @unittest.skipUnless(test_level() >= 0, 'skip test in current test level')
    def test_gpt_large_with_model_name(self):
        self.run_pipeline_with_model_id(self.gpt3_large_model_id,
                                        self.gpt3_input)

    @unittest.skipUnless(test_level() >= 1, 'skip test in current test level')
    def test_hf_model_stream_generate(self):
        from transformers import AutoTokenizer, GPT2LMHeadModel
        tokenizer = AutoTokenizer.from_pretrained('gpt2')
        model = GPT2LMHeadModel.from_pretrained('gpt2')
        model = add_stream_generate(model)
        inputs = tokenizer(self.llama_input, return_tensors='pt')
        output1 = model.generate(**inputs)
        output2 = None
        for tensor in model.stream_generate(**inputs):
            output2 = tensor
        self.assertTrue(output1.equal(output2))

    @unittest.skipUnless(test_level() >= 2, 'skip test in current test level')
    def test_palm_zh_large_with_model_name(self):
        self.run_pipeline_with_model_id(self.palm_model_id_zh_large,
                                        self.palm_input_zh)

    @unittest.skipUnless(test_level() >= 2, 'skip test in current test level')
    def test_palm_zh_commodity_with_model_name(self):
        self.run_pipeline_with_model_id(self.palm_model_id_zh_commodity,
                                        self.palm_input_commodity)

    @unittest.skipUnless(test_level() >= 2, 'skip test in current test level')
    def test_palm_zh_weather_with_model_name(self):
        self.run_pipeline_with_model_id(self.palm_model_id_zh_weather,
                                        self.palm_input_weather)

    @unittest.skipUnless(test_level() >= 2, 'skip test in current test level')
    def test_palm_zh_base_with_model_instance(self):
        self.run_pipeline_with_model_instance(self.palm_model_id_zh_base,
                                              self.palm_input_zh)

    @unittest.skipUnless(test_level() >= 2, 'skip test in current test level')
    def test_palm_zh_large_with_model_instance(self):
        self.run_pipeline_with_model_instance(self.palm_model_id_zh_large,
                                              self.palm_input_zh)

    @unittest.skipUnless(test_level() >= 2, 'skip test in current test level')
    def test_palm_zh_commodity_with_model_instance(self):
        self.run_pipeline_with_model_instance(self.palm_model_id_zh_commodity,
                                              self.palm_input_commodity)

    @unittest.skipUnless(test_level() >= 2, 'skip test in current test level')
    def test_palm_zh_weather_with_model_instance(self):
        self.run_pipeline_with_model_instance(self.palm_model_id_zh_weather,
                                              self.palm_input_weather)

    @unittest.skipUnless(test_level() >= 2, 'skip test in current test level')
    def test_palm_en_with_model_instance(self):
        self.run_pipeline_with_model_instance(self.palm_model_id_en,
                                              self.palm_input_en)

    @unittest.skipUnless(test_level() >= 2, 'skip test in current test level')
    def test_gpt_poetry_large_with_model_name(self):
        self.run_pipeline_with_model_id(self.gpt3_poetry_large_model_id,
                                        self.gpt3_poetry_input)

    @unittest.skipUnless(test_level() >= 2, 'skip test in current test level')
    def test_gpt_base_with_model_instance(self):
        self.run_pipeline_with_model_instance(self.gpt3_base_model_id,
                                              self.gpt3_input)

    @unittest.skipUnless(test_level() >= 2, 'skip test in current test level')
    def test_gpt_large_with_model_instance(self):
        self.run_pipeline_with_model_instance(self.gpt3_large_model_id,
                                              self.gpt3_input)

    @unittest.skipUnless(test_level() >= 2, 'skip test in current test level')
    def test_gpt_poetry_large_with_model_instance(self):
        self.run_pipeline_with_model_instance(self.gpt3_poetry_large_model_id,
                                              self.gpt3_poetry_input)

    @unittest.skipUnless(test_level() >= 2, 'skip test in current test level')
    def test_run_palm(self):
        for model_id, input in ((self.palm_model_id_zh_base,
                                 self.palm_input_zh), (self.palm_model_id_en,
                                                       self.palm_input_en)):
            cache_path = snapshot_download(model_id)
            model = PalmForTextGeneration.from_pretrained(cache_path)
            preprocessor = TextGenerationTransformersPreprocessor(
                cache_path, first_sequence='sentence', second_sequence=None)
            pipeline1 = TextGenerationPipeline(model, preprocessor)
            pipeline2 = pipeline(
                Tasks.text_generation,
                model=model,
                preprocessor=preprocessor,
                external_engine_for_llm=False)
            print(
                f'pipeline1: {pipeline1(input)}\npipeline2: {pipeline2(input)}'
            )

    @unittest.skipUnless(test_level() >= 2, 'skip test in current test level')
    def test_run_gpt3(self):
        cache_path = snapshot_download(self.gpt3_base_model_id)
        model = GPT3ForTextGeneration(cache_path)
        preprocessor = TextGenerationTransformersPreprocessor(
            cache_path,
            model.tokenizer,
            first_sequence='sentence',
            second_sequence=None)
        pipeline1 = TextGenerationPipeline(model, preprocessor)
        pipeline2 = pipeline(
            Tasks.text_generation,
            model=model,
            preprocessor=preprocessor,
            external_engine_for_llm=False)
        print(
            f'pipeline1: {pipeline1(self.gpt3_input)}\npipeline2: {pipeline2(self.gpt3_input)}'
        )

    @unittest.skipUnless(test_level() >= 2, 'skip test in current test level')
    def test_run_with_default_model(self):
        pipeline_ins = pipeline(
            task=Tasks.text_generation, external_engine_for_llm=False)
        print(
            pipeline_ins(
                [self.palm_input_zh, self.palm_input_zh, self.palm_input_zh],
                batch_size=2))

    @unittest.skipUnless(test_level() >= 2, 'skip test in current test level')
    def test_bloom(self):
        pipe = pipeline(
            task=Tasks.text_generation,
            model='langboat/bloom-1b4-zh',
            external_engine_for_llm=False)
        print(pipe('中国的首都是'))

    @unittest.skipUnless(test_level() >= 2, 'skip test in current test level')
    def test_gpt_neo(self):
        pipe = pipeline(
            task=Tasks.text_generation,
            model='langboat/mengzi-gpt-neo-base',
            external_engine_for_llm=False)
        print(
            pipe(
                '我是',
                do_sample=True,
                top_k=5,
                top_p=1,
                max_length=20,
                repetition_penalty=0.5))

    @unittest.skipUnless(test_level() >= 2, 'skip test in current test level')
    def test_gpt2(self):
        pipe = pipeline(
            task=Tasks.text_generation,
            model='damo/nlp_gpt2_text-generation_english-base',
            external_engine_for_llm=False)
        print(pipe('My name is Teven and I am'))

    @unittest.skip('oom error for 7b model')
    def test_llama_with_model_name(self):
        self.run_pipeline_with_model_id(self.llama_model_id, self.llama_input)

    @unittest.skip('oom error for 7b model')
    def test_llama_with_model_name_with_streaming(self):
        self.run_streaming_pipeline_with_model_id(
            self.llama_model_id,
            self.llama_input,
            run_kwargs={'max_length': 64})

    @unittest.skipUnless(test_level() >= 0, 'skip test in current test level')
    def test_seqgpt_with_model_name(self):
        inputs = {'task': '抽取', 'text': '杭州欢迎你。', 'labels': '地名'}
        PROMPT_TEMPLATE = '输入: {text}\n{task}: {labels}\n输出: '
        prompt = PROMPT_TEMPLATE.format(**inputs)
        self.run_pipeline_with_model_id(
            self.seqgpt_model_id, prompt, run_kwargs={'gen_token': '[GEN]'})

    @unittest.skipUnless(test_level() >= 1, 'skip test for oom in ci')
    def test_ecomgpt_with_model_name(self):
        PROMPT_TEMPLATE = 'Below is an instruction that describes a task. ' + \
                          'Write a response that appropriately completes the request.\n\n' + \
                          '### Instruction:\n{text}\n{instruction}\n\n### Response:'
        inputs = {
            'instruction':
            'Classify the sentence, select from the candidate labels: product, brand',
            'text': '照相机'
        }
        prompt = PROMPT_TEMPLATE.format(**inputs)
        self.run_pipeline_with_model_id(self.ecomgpt_model_id, prompt)


if __name__ == '__main__':
    unittest.main()