tests/pipelines/test_speaker_verification.py

# Copyright (c) Alibaba, Inc. and its affiliates.

import unittest
from typing import Any, Dict, List, Union

from modelscope.outputs import OutputKeys
from modelscope.pipelines import pipeline
from modelscope.utils.constant import Tasks
from modelscope.utils.logger import get_logger
from modelscope.utils.test_utils import test_level

logger = get_logger()

SPEAKER1_A_EN_16K_WAV = 'data/test/audios/speaker1_a_en_16k.wav'
SPEAKER1_B_EN_16K_WAV = 'data/test/audios/speaker1_b_en_16k.wav'
SPEAKER2_A_EN_16K_WAV = 'data/test/audios/speaker2_a_en_16k.wav'
SCL_EXAMPLE_WAV = 'data/test/audios/scl_example1.wav'
SD_EXAMPLE_WAV = 'data/test/audios/2speakers_example.wav'


class SpeakerVerificationTest(unittest.TestCase):
    ecapatdnn_voxceleb_16k_model_id = 'damo/speech_ecapa-tdnn_sv_en_voxceleb_16k'
    campplus_voxceleb_16k_model_id = 'damo/speech_campplus_sv_en_voxceleb_16k'
    rdino_voxceleb_16k_model_id = 'damo/speech_rdino_ecapa_tdnn_sv_en_voxceleb_16k'
    speaker_change_locating_cn_model_id = 'damo/speech_campplus-transformer_scl_zh-cn_16k-common'
    eres2net_voxceleb_16k_model_id = 'damo/speech_eres2net_sv_en_voxceleb_16k'
    speaker_diarization_model_id = 'damo/speech_campplus_speaker-diarization_common'
    eres2net_aug_zh_cn_16k_common_model_id = 'damo/speech_eres2net_sv_zh-cn_16k-common'

    def setUp(self) -> None:
        self.task = Tasks.speaker_verification

    def run_pipeline(self,
                     model_id: str,
                     audios: Union[List[str], str],
                     task: str = None,
                     model_revision=None) -> Dict[str, Any]:
        if task is not None:
            self.task = task
        p = pipeline(
            task=self.task, model=model_id, model_revision=model_revision)
        result = p(audios)
        return result

    @unittest.skipUnless(test_level() >= 0, 'skip test in current test level')
    def test_run_with_speaker_verification_ecapatdnn_voxceleb_16k(self):
        logger.info(
            'Run speaker verification for ecapatdnn_voxceleb_16k model')

        result = self.run_pipeline(
            model_id=self.ecapatdnn_voxceleb_16k_model_id,
            audios=[SPEAKER1_A_EN_16K_WAV, SPEAKER2_A_EN_16K_WAV])
        print(result)
        self.assertTrue(OutputKeys.SCORE in result)

    @unittest.skipUnless(test_level() >= 0, 'skip test in current test level')
    def test_run_with_speaker_verification_campplus_voxceleb_16k(self):
        logger.info('Run speaker verification for campplus_voxceleb_16k model')

        result = self.run_pipeline(
            model_id=self.campplus_voxceleb_16k_model_id,
            audios=[SPEAKER1_A_EN_16K_WAV, SPEAKER2_A_EN_16K_WAV])
        print(result)
        self.assertTrue(OutputKeys.SCORE in result)

    @unittest.skipUnless(test_level() >= 0, 'skip test in current test level')
    def test_run_with_speaker_verification_rdino_voxceleb_16k(self):
        logger.info('Run speaker verification for rdino_voxceleb_16k model')
        result = self.run_pipeline(
            model_id=self.rdino_voxceleb_16k_model_id,
            audios=[SPEAKER1_A_EN_16K_WAV, SPEAKER1_B_EN_16K_WAV],
            model_revision='v1.0.1')
        print(result)
        self.assertTrue(OutputKeys.SCORE in result)

    @unittest.skipUnless(test_level() >= 0, 'skip test in current test level')
    def test_run_with_speaker_change_locating_cn_16k(self):
        logger.info(
            'Run speaker change locating for campplus-transformer model')
        result = self.run_pipeline(
            model_id=self.speaker_change_locating_cn_model_id,
            task=Tasks.speaker_diarization,
            audios=SCL_EXAMPLE_WAV)
        print(result)
        self.assertTrue(OutputKeys.TEXT in result)

    @unittest.skipUnless(test_level() >= 0, 'skip test in current test level')
    def test_run_with_speaker_verification_eres2net_voxceleb_16k(self):
        logger.info('Run speaker verification for eres2net_voxceleb_16k model')
        result = self.run_pipeline(
            model_id=self.eres2net_voxceleb_16k_model_id,
            audios=[SPEAKER1_A_EN_16K_WAV, SPEAKER1_B_EN_16K_WAV],
            model_revision='v1.0.2')
        print(result)
        self.assertTrue(OutputKeys.SCORE in result)

    @unittest.skipUnless(test_level() >= 0, 'skip test in current test level')
    def test_run_with_speaker_verification_eres2net_aug_zh_cn_common_16k(self):
        logger.info('Run speaker verification for eres2net_voxceleb_16k model')
        result = self.run_pipeline(
            model_id=self.eres2net_aug_zh_cn_16k_common_model_id,
            audios=[SPEAKER1_A_EN_16K_WAV, SPEAKER1_B_EN_16K_WAV],
            model_revision='v1.0.1')
        print(result)
        self.assertTrue(OutputKeys.SCORE in result)

    @unittest.skipUnless(test_level() >= 0, 'skip test in current test level')
    def test_run_with_speaker_diarization_common(self):
        logger.info(
            'Run speaker change locating for campplus-transformer model')
        result = self.run_pipeline(
            model_id=self.speaker_diarization_model_id,
            task=Tasks.speaker_diarization,
            audios=SD_EXAMPLE_WAV)
        print(result)
        self.assertTrue(OutputKeys.TEXT in result)


if __name__ == '__main__':
    unittest.main()
add speech speaker verification pipeline 添加单人说话人确认推理，包括相应的pipeline和model Link: https://code.alibaba-inc.com/Ali-MaaS/MaaS-lib/codereview/11426989 2023-02-09 09:26:42 +00:00			`# Copyright (c) Alibaba, Inc. and its affiliates.`

			`import unittest`
merge master ,加入speaker change locating pipeline Link: https://code.alibaba-inc.com/Ali-MaaS/MaaS-lib/codereview/12601179 2023-05-12 17:53:56 +08:00			`from typing import Any, Dict, List, Union`
add speech speaker verification pipeline 添加单人说话人确认推理，包括相应的pipeline和model Link: https://code.alibaba-inc.com/Ali-MaaS/MaaS-lib/codereview/11426989 2023-02-09 09:26:42 +00:00
			`from modelscope.outputs import OutputKeys`
			`from modelscope.pipelines import pipeline`
			`from modelscope.utils.constant import Tasks`
			`from modelscope.utils.logger import get_logger`
			`from modelscope.utils.test_utils import test_level`

			`logger = get_logger()`

			`SPEAKER1_A_EN_16K_WAV = 'data/test/audios/speaker1_a_en_16k.wav'`
			`SPEAKER1_B_EN_16K_WAV = 'data/test/audios/speaker1_b_en_16k.wav'`
			`SPEAKER2_A_EN_16K_WAV = 'data/test/audios/speaker2_a_en_16k.wav'`
merge master ,加入speaker change locating pipeline Link: https://code.alibaba-inc.com/Ali-MaaS/MaaS-lib/codereview/12601179 2023-05-12 17:53:56 +08:00			`SCL_EXAMPLE_WAV = 'data/test/audios/scl_example1.wav'`
add speaker diarization pipeline and improve some speaker pipelines Link: https://code.alibaba-inc.com/Ali-MaaS/MaaS-lib/codereview/12891685 * add new speaker diarization pipeline. improve the capability of speaker pipelines 2023-06-21 17:56:05 +08:00			`SD_EXAMPLE_WAV = 'data/test/audios/2speakers_example.wav'`
add speech speaker verification pipeline 添加单人说话人确认推理，包括相应的pipeline和model Link: https://code.alibaba-inc.com/Ali-MaaS/MaaS-lib/codereview/11426989 2023-02-09 09:26:42 +00:00

[to #49275037] remove demo check and fix service decoder Link: https://code.alibaba-inc.com/Ali-MaaS/MaaS-lib/codereview/12432683 2023-05-14 23:41:40 +08:00			`class SpeakerVerificationTest(unittest.TestCase):`
add speech speaker verification pipeline 添加单人说话人确认推理，包括相应的pipeline和model Link: https://code.alibaba-inc.com/Ali-MaaS/MaaS-lib/codereview/11426989 2023-02-09 09:26:42 +00:00			`ecapatdnn_voxceleb_16k_model_id = 'damo/speech_ecapa-tdnn_sv_en_voxceleb_16k'`
add speaker model cam++ for speaker verification task damo/speech_campplus_sv_en_voxceleb_16k 说话人识别的新模型，模型库已创建在https://modelscope.cn/models/damo/speech_campplus_sv_en_voxceleb_16k/summary Link: https://code.alibaba-inc.com/Ali-MaaS/MaaS-lib/codereview/12180950 2023-04-10 16:27:13 +08:00			`campplus_voxceleb_16k_model_id = 'damo/speech_campplus_sv_en_voxceleb_16k'`
add rdino model Link: https://code.alibaba-inc.com/Ali-MaaS/MaaS-lib/codereview/12406691 2023-04-26 11:18:28 +08:00			`rdino_voxceleb_16k_model_id = 'damo/speech_rdino_ecapa_tdnn_sv_en_voxceleb_16k'`
merge master ,加入speaker change locating pipeline Link: https://code.alibaba-inc.com/Ali-MaaS/MaaS-lib/codereview/12601179 2023-05-12 17:53:56 +08:00			`speaker_change_locating_cn_model_id = 'damo/speech_campplus-transformer_scl_zh-cn_16k-common'`
eres2net Link: https://code.alibaba-inc.com/Ali-MaaS/MaaS-lib/codereview/12640199 2023-05-16 22:28:20 +08:00			`eres2net_voxceleb_16k_model_id = 'damo/speech_eres2net_sv_en_voxceleb_16k'`
add speaker diarization pipeline and improve some speaker pipelines Link: https://code.alibaba-inc.com/Ali-MaaS/MaaS-lib/codereview/12891685 * add new speaker diarization pipeline. improve the capability of speaker pipelines 2023-06-21 17:56:05 +08:00			`speaker_diarization_model_id = 'damo/speech_campplus_speaker-diarization_common'`
eres2net_aug v2 Link: https://code.alibaba-inc.com/Ali-MaaS/MaaS-lib/codereview/13046524 * eres2net_aug v2 2023-06-25 18:07:04 +08:00			`eres2net_aug_zh_cn_16k_common_model_id = 'damo/speech_eres2net_sv_zh-cn_16k-common'`
add speech speaker verification pipeline 添加单人说话人确认推理，包括相应的pipeline和model Link: https://code.alibaba-inc.com/Ali-MaaS/MaaS-lib/codereview/11426989 2023-02-09 09:26:42 +00:00
			`def setUp(self) -> None:`
			`self.task = Tasks.speaker_verification`

add rdino model Link: https://code.alibaba-inc.com/Ali-MaaS/MaaS-lib/codereview/12406691 2023-04-26 11:18:28 +08:00			`def run_pipeline(self,`
			`model_id: str,`
merge master ,加入speaker change locating pipeline Link: https://code.alibaba-inc.com/Ali-MaaS/MaaS-lib/codereview/12601179 2023-05-12 17:53:56 +08:00			`audios: Union[List[str], str],`
			`task: str = None,`
add rdino model Link: https://code.alibaba-inc.com/Ali-MaaS/MaaS-lib/codereview/12406691 2023-04-26 11:18:28 +08:00			`model_revision=None) -> Dict[str, Any]:`
merge master ,加入speaker change locating pipeline Link: https://code.alibaba-inc.com/Ali-MaaS/MaaS-lib/codereview/12601179 2023-05-12 17:53:56 +08:00			`if task is not None:`
			`self.task = task`
add rdino model Link: https://code.alibaba-inc.com/Ali-MaaS/MaaS-lib/codereview/12406691 2023-04-26 11:18:28 +08:00			`p = pipeline(`
			`task=self.task, model=model_id, model_revision=model_revision)`
add speech speaker verification pipeline 添加单人说话人确认推理，包括相应的pipeline和model Link: https://code.alibaba-inc.com/Ali-MaaS/MaaS-lib/codereview/11426989 2023-02-09 09:26:42 +00:00			`result = p(audios)`
			`return result`

			`@unittest.skipUnless(test_level() >= 0, 'skip test in current test level')`
			`def test_run_with_speaker_verification_ecapatdnn_voxceleb_16k(self):`
			`logger.info(`
			`'Run speaker verification for ecapatdnn_voxceleb_16k model')`

			`result = self.run_pipeline(`
			`model_id=self.ecapatdnn_voxceleb_16k_model_id,`
			`audios=[SPEAKER1_A_EN_16K_WAV, SPEAKER2_A_EN_16K_WAV])`
			`print(result)`
			`self.assertTrue(OutputKeys.SCORE in result)`

add speaker model cam++ for speaker verification task damo/speech_campplus_sv_en_voxceleb_16k 说话人识别的新模型，模型库已创建在https://modelscope.cn/models/damo/speech_campplus_sv_en_voxceleb_16k/summary Link: https://code.alibaba-inc.com/Ali-MaaS/MaaS-lib/codereview/12180950 2023-04-10 16:27:13 +08:00			`@unittest.skipUnless(test_level() >= 0, 'skip test in current test level')`
			`def test_run_with_speaker_verification_campplus_voxceleb_16k(self):`
			`logger.info('Run speaker verification for campplus_voxceleb_16k model')`

			`result = self.run_pipeline(`
			`model_id=self.campplus_voxceleb_16k_model_id,`
			`audios=[SPEAKER1_A_EN_16K_WAV, SPEAKER2_A_EN_16K_WAV])`
			`print(result)`
			`self.assertTrue(OutputKeys.SCORE in result)`

add rdino model Link: https://code.alibaba-inc.com/Ali-MaaS/MaaS-lib/codereview/12406691 2023-04-26 11:18:28 +08:00			`@unittest.skipUnless(test_level() >= 0, 'skip test in current test level')`
			`def test_run_with_speaker_verification_rdino_voxceleb_16k(self):`
			`logger.info('Run speaker verification for rdino_voxceleb_16k model')`
			`result = self.run_pipeline(`
			`model_id=self.rdino_voxceleb_16k_model_id,`
			`audios=[SPEAKER1_A_EN_16K_WAV, SPEAKER1_B_EN_16K_WAV],`
			`model_revision='v1.0.1')`
			`print(result)`
			`self.assertTrue(OutputKeys.SCORE in result)`

merge master ,加入speaker change locating pipeline Link: https://code.alibaba-inc.com/Ali-MaaS/MaaS-lib/codereview/12601179 2023-05-12 17:53:56 +08:00			`@unittest.skipUnless(test_level() >= 0, 'skip test in current test level')`
			`def test_run_with_speaker_change_locating_cn_16k(self):`
			`logger.info(`
			`'Run speaker change locating for campplus-transformer model')`
			`result = self.run_pipeline(`
			`model_id=self.speaker_change_locating_cn_model_id,`
			`task=Tasks.speaker_diarization,`
			`audios=SCL_EXAMPLE_WAV)`
			`print(result)`
			`self.assertTrue(OutputKeys.TEXT in result)`

eres2net Link: https://code.alibaba-inc.com/Ali-MaaS/MaaS-lib/codereview/12640199 2023-05-16 22:28:20 +08:00			`@unittest.skipUnless(test_level() >= 0, 'skip test in current test level')`
			`def test_run_with_speaker_verification_eres2net_voxceleb_16k(self):`
			`logger.info('Run speaker verification for eres2net_voxceleb_16k model')`
			`result = self.run_pipeline(`
			`model_id=self.eres2net_voxceleb_16k_model_id,`
			`audios=[SPEAKER1_A_EN_16K_WAV, SPEAKER1_B_EN_16K_WAV],`
			`model_revision='v1.0.2')`
			`print(result)`
			`self.assertTrue(OutputKeys.SCORE in result)`

eres2net_aug v2 Link: https://code.alibaba-inc.com/Ali-MaaS/MaaS-lib/codereview/13046524 * eres2net_aug v2 2023-06-25 18:07:04 +08:00			`@unittest.skipUnless(test_level() >= 0, 'skip test in current test level')`
			`def test_run_with_speaker_verification_eres2net_aug_zh_cn_common_16k(self):`
			`logger.info('Run speaker verification for eres2net_voxceleb_16k model')`
			`result = self.run_pipeline(`
			`model_id=self.eres2net_aug_zh_cn_16k_common_model_id,`
			`audios=[SPEAKER1_A_EN_16K_WAV, SPEAKER1_B_EN_16K_WAV],`
			`model_revision='v1.0.1')`
			`print(result)`
			`self.assertTrue(OutputKeys.SCORE in result)`

add speaker diarization pipeline and improve some speaker pipelines Link: https://code.alibaba-inc.com/Ali-MaaS/MaaS-lib/codereview/12891685 * add new speaker diarization pipeline. improve the capability of speaker pipelines 2023-06-21 17:56:05 +08:00			`@unittest.skipUnless(test_level() >= 0, 'skip test in current test level')`
			`def test_run_with_speaker_diarization_common(self):`
			`logger.info(`
			`'Run speaker change locating for campplus-transformer model')`
			`result = self.run_pipeline(`
			`model_id=self.speaker_diarization_model_id,`
			`task=Tasks.speaker_diarization,`
			`audios=SD_EXAMPLE_WAV)`
			`print(result)`
			`self.assertTrue(OutputKeys.TEXT in result)`

add speech speaker verification pipeline 添加单人说话人确认推理，包括相应的pipeline和model Link: https://code.alibaba-inc.com/Ali-MaaS/MaaS-lib/codereview/11426989 2023-02-09 09:26:42 +00:00
			`if __name__ == '__main__':`
			`unittest.main()`