검색 기능은 준비 중입니다.
검색 기능은 준비 중입니다.

The original paper is in English. Non-English content has been machine-translated and may contain typographical errors or mistranslations. ex. Some numerals are expressed as "XNUMX".
Copyrights notice

The original paper is in English. Non-English content has been machine-translated and may contain typographical errors or mistranslations. Copyrights notice

HMM-Based Style Control for Expressive Speech Synthesis with Arbitrary Speaker's Voice Using Model Adaptation 모델 적응을 이용한 임의 화자의 음성으로 표현적 음성 합성을 위한 HMM 기반 스타일 제어

Takashi NOSE, Makoto TACHIBANA, Takao KOBAYASHI

  • 조회수

    0

  • 이것을 인용

요약 :

본 논문에서는 HMM 기반 음성 합성에서 소량의 화자의 음성 데이터를 이용하여 임의 화자의 합성 음성의 감정 표현 강도와 화법을 제어하는 ​​방법을 제시한다. 모델 적응 접근법은 다중 회귀 숨겨진 세미 마르코프 모델(MRHSMM)을 기반으로 하는 스타일 제어 기술에 도입되었습니다. 대상 화자의 MRHSMM을 훈련하기 위해 두 가지 다른 접근 방식이 제안됩니다. 첫 번째는 사전 훈련된 MRHSMM이 대상 화자의 모델에 적응되는 MRHSMM 기반 모델 적응입니다. 이를 위해 우리는 MRHSMM에 대한 MLLR 적응 알고리즘을 공식화합니다. 두 번째 방법은 MRHSMM의 초기화에 사용되는 대상 화자의 스타일 종속 HSMM을 얻기 위해 평균 음성 모델에서 화자와 스타일의 동시 적응을 활용합니다. 스타일별 50개 문장의 적응 데이터를 이용한 주관적 평가 결과, 제안한 방법이 목표 화자의 동일한 크기의 음성 데이터를 사용할 때 기존의 화자 종속 모델 훈련보다 우수한 성능을 보이는 것을 확인했습니다.

발행
IEICE TRANSACTIONS on Information Vol.E92-D No.3 pp.489-497
발행일
2009/03/01
공개일
온라인 ISSN
1745-1361
DOI
10.1587/transinf.E92.D.489
원고의 종류
PAPER
범주
언어 및 청각

작성자

키워드