examples/pytorch/llm/utils/models.py

import os
from typing import Any, Dict, NamedTuple, Optional

import torch
from torch import dtype as Dtype

from modelscope import (AutoConfig, AutoModelForCausalLM, AutoTokenizer, Model,
                        get_logger, read_config, snapshot_download)
from modelscope.models.nlp.chatglm2 import ChatGLM2Config, ChatGLM2Tokenizer
from modelscope.models.nlp.qwen import QWenConfig, QWenTokenizer

logger = get_logger()


def _add_special_token(tokenizer, special_token_mapper: Dict[str,
                                                             Any]) -> None:
    for k, v in special_token_mapper:
        setattr(tokenizer, k, v)
    assert tokenizer.eos_token is not None
    if tokenizer.pad_token is None:
        tokenizer.pad_token = tokenizer.eos_token


def get_model_tokenizer_default(model_dir: str,
                                torch_dtype: Dtype,
                                load_model: bool = True):
    """load from an independent repository"""
    model_config = AutoConfig.from_pretrained(
        model_dir, trust_remote_code=True)
    model_config.torch_dtype = torch_dtype
    logger.info(f'model_config: {model_config}')
    tokenizer = AutoTokenizer.from_pretrained(
        model_dir, trust_remote_code=True)
    model = None
    if load_model:
        model = AutoModelForCausalLM.from_pretrained(
            model_dir,
            config=model_config,
            device_map='auto',
            torch_dtype=torch_dtype,
            trust_remote_code=True)
    return model, tokenizer


def get_model_tokenizer_polylm(model_dir: str,
                               torch_dtype: Dtype,
                               load_model: bool = True):
    """load from an independent repository"""
    model_config = AutoConfig.from_pretrained(
        model_dir, trust_remote_code=True)
    model_config.torch_dtype = torch_dtype
    logger.info(f'model_config: {model_config}')
    tokenizer = AutoTokenizer.from_pretrained(model_dir, use_fast=False)
    model = None
    if load_model:
        model = AutoModelForCausalLM.from_pretrained(
            model_dir,
            config=model_config,
            device_map='auto',
            torch_dtype=torch_dtype,
            trust_remote_code=True)
    return model, tokenizer


def get_model_tokenizer_chatglm2(model_dir: str,
                                 torch_dtype: Dtype,
                                 load_model: bool = True):
    """load from ms library"""
    config = read_config(model_dir)
    logger.info(config)
    model_config = ChatGLM2Config.from_pretrained(model_dir)
    model_config.torch_dtype = torch_dtype
    logger.info(model_config)
    tokenizer = ChatGLM2Tokenizer.from_pretrained(model_dir)
    model = None
    if load_model:
        model = Model.from_pretrained(
            model_dir,
            cfg_dict=config,
            config=model_config,
            device_map='auto',
            torch_dtype=torch_dtype)
    return model, tokenizer


def get_model_tokenizer_qwen(model_dir: str,
                             torch_dtype: Dtype,
                             load_model: bool = True):
    config = read_config(model_dir)
    logger.info(config)
    model_config = QWenConfig.from_pretrained(model_dir)
    model_config.torch_dtype = torch_dtype
    logger.info(model_config)
    tokenizer = QWenTokenizer.from_pretrained(model_dir)
    model = None
    if load_model:
        model = Model.from_pretrained(
            model_dir,
            cfg_dict=config,
            config=model_config,
            device_map='auto',
            torch_dtype=torch_dtype)
    return model, tokenizer


class LoRATM(NamedTuple):
    # default lora target modules
    baichuan = ['W_pack']
    chatglm2 = ['query_key_value']
    llama2 = ['q_proj', 'k_proj', 'v_proj']
    qwen = ['c_attn']
    polylm = ['c_attn']


# Reference: 'https://modelscope.cn/models/{model_id}/summary'
# keys: 'model_id', 'revision', 'torch_dtype', 'get_function',
#   'ignore_file_pattern', 'special_token_mapper', 'lora_TM'
MODEL_MAPPER = {
    'baichuan-7b': {
        'model_id': 'baichuan-inc/baichuan-7B',  # model id or model dir
        'revision': 'v1.0.7',
        'lora_TM': LoRATM.baichuan
    },
    'baichuan-13b': {
        'model_id': 'baichuan-inc/Baichuan-13B-Base',
        'revision': 'v1.0.3',
        'torch_dtype': torch.bfloat16,
        'lora_TM': LoRATM.baichuan
    },
    'chatglm2-6b': {
        'model_id': 'ZhipuAI/chatglm2-6b',
        'revision': 'v1.0.6',
        'get_function': get_model_tokenizer_chatglm2,
        'lora_TM': LoRATM.chatglm2
    },
    'llama2-7b': {
        'model_id': 'modelscope/Llama-2-7b-ms',
        'revision': 'v1.0.2',
        'ignore_file_pattern': [r'.+\.bin$'],  # use safetensors
        'lora_TM': LoRATM.llama2
    },
    'llama2-13b': {
        'model_id': 'modelscope/Llama-2-13b-ms',
        'revision': 'v1.0.2',
        'ignore_file_pattern': [r'.+\.bin$'],
        'lora_TM': LoRATM.llama2
    },
    'openbuddy-llama2-13b': {
        'model_id': 'OpenBuddy/openbuddy-llama2-13b-v8.1-fp16',
        'revision': 'v1.0.0',
        'lora_TM': LoRATM.llama2
    },
    'qwen-7b': {
        'model_id': 'QWen/qwen-7b',
        'revision': 'v1.0.0',
        'get_function': get_model_tokenizer_qwen,
        'torch_dtype': torch.bfloat16,
        'lora_TM': LoRATM.qwen,
    },
    'polylm-13b': {
        'model_id': 'damo/nlp_polylm_13b_text_generation',
        'revision': 'v1.0.3',
        'get_function': get_model_tokenizer_polylm,
        'torch_dtype': torch.bfloat16,
        'lora_TM': LoRATM.polylm
    }
}


def get_model_tokenizer(model_type: str,
                        torch_dtype: Optional[Dtype] = None,
                        load_model: bool = True):
    data = MODEL_MAPPER.get(model_type)
    if data is None:
        raise ValueError(f'model_type: {model_type}')

    model_id = data['model_id']
    get_function = data.get('get_function', get_model_tokenizer_default)
    ignore_file_pattern = data.get('ignore_file_pattern', [])
    special_token_mapper = data.get('special_token_mapper', {})
    if torch_dtype is None:
        torch_dtype = data.get('torch_dtype', torch.float16)

    model_dir = model_id
    if not os.path.exists(model_id):
        revision = data.get('revision', 'master')
        model_dir = snapshot_download(
            model_id, revision, ignore_file_pattern=ignore_file_pattern)

    model, tokenizer = get_function(model_dir, torch_dtype, load_model)
    _add_special_token(tokenizer, special_token_mapper)
    return model, tokenizer, model_dir
fix checkpoint, same device bug (#427) 2023-07-29 00:06:27 +08:00			`import os`
			`from typing import Any, Dict, NamedTuple, Optional`
support openbuddy-llama2-13b (#416) 2023-07-26 18:12:55 +08:00
			`import torch`
			`from torch import dtype as Dtype`

			`from modelscope import (AutoConfig, AutoModelForCausalLM, AutoTokenizer, Model,`
			`get_logger, read_config, snapshot_download)`
			`from modelscope.models.nlp.chatglm2 import ChatGLM2Config, ChatGLM2Tokenizer`
add qwen 7b base and chat 添加QWen 7b base模型和chat模型及相关pipelines Link: https://code.alibaba-inc.com/Ali-MaaS/MaaS-lib/codereview/13482235 * add qwen 7b base and chat * fix logger * update examples, lint test * add unittest for qwen base and chat * rename qwen to qwen-7b * resolve imports and add a registry to text-generation * reset load model from pretrained * fix precheck * skip qwen test case now * remove strange file 2023-08-02 09:25:21 +08:00			`from modelscope.models.nlp.qwen import QWenConfig, QWenTokenizer`
support openbuddy-llama2-13b (#416) 2023-07-26 18:12:55 +08:00
			`logger = get_logger()`


fix checkpoint, same device bug (#427) 2023-07-29 00:06:27 +08:00			`def _add_special_token(tokenizer, special_token_mapper: Dict[str,`
			`Any]) -> None:`
			`for k, v in special_token_mapper:`
			`setattr(tokenizer, k, v)`
			`assert tokenizer.eos_token is not None`
			`if tokenizer.pad_token is None:`
			`tokenizer.pad_token = tokenizer.eos_token`
support openbuddy-llama2-13b (#416) 2023-07-26 18:12:55 +08:00

			`def get_model_tokenizer_default(model_dir: str,`
fix checkpoint, same device bug (#427) 2023-07-29 00:06:27 +08:00			`torch_dtype: Dtype,`
			`load_model: bool = True):`
support openbuddy-llama2-13b (#416) 2023-07-26 18:12:55 +08:00			`"""load from an independent repository"""`
			`model_config = AutoConfig.from_pretrained(`
			`model_dir, trust_remote_code=True)`
			`model_config.torch_dtype = torch_dtype`
			`logger.info(f'model_config: {model_config}')`
			`tokenizer = AutoTokenizer.from_pretrained(`
			`model_dir, trust_remote_code=True)`
			`model = None`
			`if load_model:`
			`model = AutoModelForCausalLM.from_pretrained(`
			`model_dir,`
			`config=model_config,`
			`device_map='auto',`
			`torch_dtype=torch_dtype,`
			`trust_remote_code=True)`
			`return model, tokenizer`


[to #42322933] Add polylm lora trainer to modelscope Link: https://code.alibaba-inc.com/Ali-MaaS/MaaS-lib/codereview/13509769 * [to #42322933] Add polylm lora trainer to modelscope 2023-08-10 20:57:47 +08:00			`def get_model_tokenizer_polylm(model_dir: str,`
			`torch_dtype: Dtype,`
			`load_model: bool = True):`
			`"""load from an independent repository"""`
			`model_config = AutoConfig.from_pretrained(`
			`model_dir, trust_remote_code=True)`
			`model_config.torch_dtype = torch_dtype`
			`logger.info(f'model_config: {model_config}')`
			`tokenizer = AutoTokenizer.from_pretrained(model_dir, use_fast=False)`
			`model = None`
			`if load_model:`
			`model = AutoModelForCausalLM.from_pretrained(`
			`model_dir,`
			`config=model_config,`
			`device_map='auto',`
			`torch_dtype=torch_dtype,`
			`trust_remote_code=True)`
			`return model, tokenizer`


support openbuddy-llama2-13b (#416) 2023-07-26 18:12:55 +08:00			`def get_model_tokenizer_chatglm2(model_dir: str,`
fix checkpoint, same device bug (#427) 2023-07-29 00:06:27 +08:00			`torch_dtype: Dtype,`
			`load_model: bool = True):`
support openbuddy-llama2-13b (#416) 2023-07-26 18:12:55 +08:00			`"""load from ms library"""`
			`config = read_config(model_dir)`
			`logger.info(config)`
			`model_config = ChatGLM2Config.from_pretrained(model_dir)`
			`model_config.torch_dtype = torch_dtype`
			`logger.info(model_config)`
			`tokenizer = ChatGLM2Tokenizer.from_pretrained(model_dir)`
			`model = None`
			`if load_model:`
			`model = Model.from_pretrained(`
			`model_dir,`
			`cfg_dict=config,`
			`config=model_config,`
			`device_map='auto',`
			`torch_dtype=torch_dtype)`
			`return model, tokenizer`


add qwen 7b base and chat 添加QWen 7b base模型和chat模型及相关pipelines Link: https://code.alibaba-inc.com/Ali-MaaS/MaaS-lib/codereview/13482235 * add qwen 7b base and chat * fix logger * update examples, lint test * add unittest for qwen base and chat * rename qwen to qwen-7b * resolve imports and add a registry to text-generation * reset load model from pretrained * fix precheck * skip qwen test case now * remove strange file 2023-08-02 09:25:21 +08:00			`def get_model_tokenizer_qwen(model_dir: str,`
			`torch_dtype: Dtype,`
			`load_model: bool = True):`
			`config = read_config(model_dir)`
			`logger.info(config)`
			`model_config = QWenConfig.from_pretrained(model_dir)`
			`model_config.torch_dtype = torch_dtype`
			`logger.info(model_config)`
			`tokenizer = QWenTokenizer.from_pretrained(model_dir)`
			`model = None`
			`if load_model:`
			`model = Model.from_pretrained(`
			`model_dir,`
			`cfg_dict=config,`
			`config=model_config,`
			`device_map='auto',`
			`torch_dtype=torch_dtype)`
			`return model, tokenizer`


support openbuddy-llama2-13b (#416) 2023-07-26 18:12:55 +08:00			`class LoRATM(NamedTuple):`
			`# default lora target modules`
			`baichuan = ['W_pack']`
			`chatglm2 = ['query_key_value']`
			`llama2 = ['q_proj', 'k_proj', 'v_proj']`
add qwen 7b base and chat 添加QWen 7b base模型和chat模型及相关pipelines Link: https://code.alibaba-inc.com/Ali-MaaS/MaaS-lib/codereview/13482235 * add qwen 7b base and chat * fix logger * update examples, lint test * add unittest for qwen base and chat * rename qwen to qwen-7b * resolve imports and add a registry to text-generation * reset load model from pretrained * fix precheck * skip qwen test case now * remove strange file 2023-08-02 09:25:21 +08:00			`qwen = ['c_attn']`
[to #42322933] Add polylm lora trainer to modelscope Link: https://code.alibaba-inc.com/Ali-MaaS/MaaS-lib/codereview/13509769 * [to #42322933] Add polylm lora trainer to modelscope 2023-08-10 20:57:47 +08:00			`polylm = ['c_attn']`
support openbuddy-llama2-13b (#416) 2023-07-26 18:12:55 +08:00

			`# Reference: 'https://modelscope.cn/models/{model_id}/summary'`
fix checkpoint, same device bug (#427) 2023-07-29 00:06:27 +08:00			`# keys: 'model_id', 'revision', 'torch_dtype', 'get_function',`
			`# 'ignore_file_pattern', 'special_token_mapper', 'lora_TM'`
support openbuddy-llama2-13b (#416) 2023-07-26 18:12:55 +08:00			`MODEL_MAPPER = {`
			`'baichuan-7b': {`
fix checkpoint, same device bug (#427) 2023-07-29 00:06:27 +08:00			`'model_id': 'baichuan-inc/baichuan-7B', # model id or model dir`
support openbuddy-llama2-13b (#416) 2023-07-26 18:12:55 +08:00			`'revision': 'v1.0.7',`
			`'lora_TM': LoRATM.baichuan`
			`},`
			`'baichuan-13b': {`
			`'model_id': 'baichuan-inc/Baichuan-13B-Base',`
			`'revision': 'v1.0.3',`
fix checkpoint, same device bug (#427) 2023-07-29 00:06:27 +08:00			`'torch_dtype': torch.bfloat16,`
support openbuddy-llama2-13b (#416) 2023-07-26 18:12:55 +08:00			`'lora_TM': LoRATM.baichuan`
			`},`
fix checkpoint, same device bug (#427) 2023-07-29 00:06:27 +08:00			`'chatglm2-6b': {`
support openbuddy-llama2-13b (#416) 2023-07-26 18:12:55 +08:00			`'model_id': 'ZhipuAI/chatglm2-6b',`
			`'revision': 'v1.0.6',`
			`'get_function': get_model_tokenizer_chatglm2,`
			`'lora_TM': LoRATM.chatglm2`
			`},`
			`'llama2-7b': {`
			`'model_id': 'modelscope/Llama-2-7b-ms',`
			`'revision': 'v1.0.2',`
			`'ignore_file_pattern': [r'.+\.bin$'], # use safetensors`
			`'lora_TM': LoRATM.llama2`
			`},`
			`'llama2-13b': {`
			`'model_id': 'modelscope/Llama-2-13b-ms',`
			`'revision': 'v1.0.2',`
			`'ignore_file_pattern': [r'.+\.bin$'],`
			`'lora_TM': LoRATM.llama2`
			`},`
			`'openbuddy-llama2-13b': {`
			`'model_id': 'OpenBuddy/openbuddy-llama2-13b-v8.1-fp16',`
add qwen 7b base and chat 添加QWen 7b base模型和chat模型及相关pipelines Link: https://code.alibaba-inc.com/Ali-MaaS/MaaS-lib/codereview/13482235 * add qwen 7b base and chat * fix logger * update examples, lint test * add unittest for qwen base and chat * rename qwen to qwen-7b * resolve imports and add a registry to text-generation * reset load model from pretrained * fix precheck * skip qwen test case now * remove strange file 2023-08-02 09:25:21 +08:00			`'revision': 'v1.0.0',`
support openbuddy-llama2-13b (#416) 2023-07-26 18:12:55 +08:00			`'lora_TM': LoRATM.llama2`
add qwen 7b base and chat 添加QWen 7b base模型和chat模型及相关pipelines Link: https://code.alibaba-inc.com/Ali-MaaS/MaaS-lib/codereview/13482235 * add qwen 7b base and chat * fix logger * update examples, lint test * add unittest for qwen base and chat * rename qwen to qwen-7b * resolve imports and add a registry to text-generation * reset load model from pretrained * fix precheck * skip qwen test case now * remove strange file 2023-08-02 09:25:21 +08:00			`},`
			`'qwen-7b': {`
			`'model_id': 'QWen/qwen-7b',`
			`'revision': 'v1.0.0',`
			`'get_function': get_model_tokenizer_qwen,`
			`'torch_dtype': torch.bfloat16,`
			`'lora_TM': LoRATM.qwen,`
[to #42322933] Add polylm lora trainer to modelscope Link: https://code.alibaba-inc.com/Ali-MaaS/MaaS-lib/codereview/13509769 * [to #42322933] Add polylm lora trainer to modelscope 2023-08-10 20:57:47 +08:00			`},`
			`'polylm-13b': {`
			`'model_id': 'damo/nlp_polylm_13b_text_generation',`
			`'revision': 'v1.0.3',`
			`'get_function': get_model_tokenizer_polylm,`
			`'torch_dtype': torch.bfloat16,`
			`'lora_TM': LoRATM.polylm`
support openbuddy-llama2-13b (#416) 2023-07-26 18:12:55 +08:00			`}`
			`}`


			`def get_model_tokenizer(model_type: str,`
fix checkpoint, same device bug (#427) 2023-07-29 00:06:27 +08:00			`torch_dtype: Optional[Dtype] = None,`
			`load_model: bool = True):`
support openbuddy-llama2-13b (#416) 2023-07-26 18:12:55 +08:00			`data = MODEL_MAPPER.get(model_type)`
			`if data is None:`
			`raise ValueError(f'model_type: {model_type}')`
fix checkpoint, same device bug (#427) 2023-07-29 00:06:27 +08:00
support openbuddy-llama2-13b (#416) 2023-07-26 18:12:55 +08:00			`model_id = data['model_id']`
			`get_function = data.get('get_function', get_model_tokenizer_default)`
			`ignore_file_pattern = data.get('ignore_file_pattern', [])`
fix checkpoint, same device bug (#427) 2023-07-29 00:06:27 +08:00			`special_token_mapper = data.get('special_token_mapper', {})`
			`if torch_dtype is None:`
			`torch_dtype = data.get('torch_dtype', torch.float16)`

			`model_dir = model_id`
			`if not os.path.exists(model_id):`
			`revision = data.get('revision', 'master')`
			`model_dir = snapshot_download(`
			`model_id, revision, ignore_file_pattern=ignore_file_pattern)`

			`model, tokenizer = get_function(model_dir, torch_dtype, load_model)`
			`_add_special_token(tokenizer, special_token_mapper)`
support openbuddy-llama2-13b (#416) 2023-07-26 18:12:55 +08:00			`return model, tokenizer, model_dir`