검색 기능은 준비 중입니다.
검색 기능은 준비 중입니다.

The original paper is in English. Non-English content has been machine-translated and may contain typographical errors or mistranslations. ex. Some numerals are expressed as "XNUMX".
Copyrights notice

The original paper is in English. Non-English content has been machine-translated and may contain typographical errors or mistranslations. Copyrights notice

Acoustic Feature Transformation Based on Discriminant Analysis Preserving Local Structure for Speech Recognition 음성 인식을 위한 국소 구조를 보존하는 판별 분석을 기반으로 한 음향 특징 변환

Makoto SAKAI, Norihide KITAOKA, Kazuya TAKEDA

  • 조회수

    0

  • 이것을 인용

요약 :

음성 인식 성능을 향상시키기 위해 판별 분석을 기반으로 한 특징 변환을 통해 음향 특징의 중복 차원을 줄이는 방법이 널리 사용되었습니다. 이를 위해 선형 판별 분석(LDA)과 이분산 판별 분석(HDA)이 자주 사용되며, LDA와 HDA에 대한 일반화 방법인 PLDA(power LDA)가 제안되었습니다. 그러나 이러한 방법은 다중 모드 데이터에 대해 예상치 못한 차원 감소를 초래할 수 있습니다. 다중 모드 데이터의 차원을 줄일 때 데이터의 로컬 구조를 보존하는 것이 중요합니다. 본 논문에서는 다중 모드 데이터의 차원성을 적절하게 줄이기 위해 지역성 보존 HDA와 지역성 보존 PLDA의 두 가지 방법을 소개합니다. 또한 최적이 아닌 예측을 신속하게 계산하기 위한 대략적인 계산 방식을 제안합니다. 실험 결과는 지역성 보존 방법이 음성 인식에서 기존 방법보다 더 나은 성능을 제공한다는 것을 보여줍니다.

발행
IEICE TRANSACTIONS on Information Vol.E93-D No.5 pp.1244-1252
발행일
2010/05/01
공개일
온라인 ISSN
1745-1361
DOI
10.1587/transinf.E93.D.1244
원고의 종류
PAPER
범주
언어 및 청각

작성자

키워드