검색 기능은 준비 중입니다.
검색 기능은 준비 중입니다.

The original paper is in English. Non-English content has been machine-translated and may contain typographical errors or mistranslations. ex. Some numerals are expressed as "XNUMX".
Copyrights notice

The original paper is in English. Non-English content has been machine-translated and may contain typographical errors or mistranslations. Copyrights notice

Speaker Adaptation Based on a Maximum Observation Probability Criterion 최대 관찰 확률 기준에 따른 화자 적응

Tae-Young YANG, Chungyong LEE, Dae-Hee YOUN

  • 조회수

    0

  • 이것을 인용

요약 :

입력 음성의 관찰 확률을 최대화하는 화자 적응 기법을 제안한다. 반연속적 은닉 마르코프 모델(SCHMM) 음성 인식기에 적용됩니다. 제안된 알고리즘은 적응 음성 데이터의 특징이 최대 관찰 확률을 달성할 수 있도록 기울기 탐색 기법을 통해 평균 μ와 공분산 Σ를 반복적으로 적응시킵니다. 혼합 계수와 상태 전이 확률은 모델 보간 방식에 의해 조정됩니다. 이 방식의 가장 큰 장점은 SCHMM의 모든 상태에 공통적인 평균과 분산이 SCHMM의 다른 매개변수와 독립적으로 적용된다는 것입니다. 특히 참조 모델과 새 스피커 사이에 음향 불일치가 큰 경우 빠르고 정확한 적응이 가능합니다. 또한, 코드북을 사용하는 다른 분야에도 이 방식이 적용될 가능성이 있다. 제안된 적응 알고리즘은 남성 화자 의존적, 여성 화자 의존적, 화자 독립적 인식기에 의해 평가되었다. 격리된 단어 인식에 대한 실험 결과, 제안한 적응 알고리즘은 남성 화자 의존적 인식기에서 평균 46.03%, 여성 화자 의존적 인식기에서는 52.18%, 화자 독립적 인식기에서는 9.84%의 평균 향상을 보였다.

발행
IEICE TRANSACTIONS on Information Vol.E84-D No.2 pp.286-288
발행일
2001/02/01
공개일
온라인 ISSN
DOI
원고의 종류
LETTER
범주
언어 및 청각

작성자

키워드