검색 기능은 준비 중입니다.
검색 기능은 준비 중입니다.

The original paper is in English. Non-English content has been machine-translated and may contain typographical errors or mistranslations. ex. Some numerals are expressed as "XNUMX".
Copyrights notice

The original paper is in English. Non-English content has been machine-translated and may contain typographical errors or mistranslations. Copyrights notice

A Non-Intrusive Speech Intelligibility Estimation Method Based on Deep Learning Using Autoencoder Features 오토인코더 기능을 이용한 딥러닝 기반 비침해적 음성 명료도 추정 방법

Yoonhee KIM, Deokgyu YUN, Hannah LEE, Seung Ho CHOI

  • 조회수

    0

  • 이것을 인용

요약 :

본 논문에서는 오토인코더의 병목 현상 특성을 활용한 딥러닝 기반의 비침해적 음성 명료도 추정 방법을 제시합니다. 기존의 표준 비침해적 음성 명료도 추정 방법인 P.563은 다양한 소음 환경에서 명료도 추정 성능이 부족합니다. 우리는 입력과 출력이 각각 오토인코더 병목 현상과 단기 객관적 지능(STOI) 점수인 LSTM(장단기 기억) 신경망을 기반으로 하는 보다 정확한 음성 명료도 추정 방법을 제안합니다. 여기서 STOI는 표준 도구입니다. 기준 음성 신호로 침입 음성 명료도를 측정합니다. 제안한 방법은 다양한 잡음 환경에서 음성 신호에 대한 기존 표준 P.563 및 MFCC(Mel-Frequency Cepstral Coefficient) 특징 기반 명료도 추정 방법과 비교하여 우수한 성능을 가짐을 보였다.

발행
IEICE TRANSACTIONS on Information Vol.E103-D No.3 pp.714-715
발행일
2020/03/01
공개일
2019/12/11
온라인 ISSN
1745-1361
DOI
10.1587/transinf.2019EDL8150
원고의 종류
LETTER
범주
언어 및 청각

작성자

Yoonhee KIM
  Seoul National University of Science and Technology
Deokgyu YUN
  Seoul National University of Science and Technology
Hannah LEE
  Seoul National University of Science and Technology
Seung Ho CHOI
  Seoul National University of Science and Technology

키워드