검색 기능은 준비 중입니다.
검색 기능은 준비 중입니다.

The original paper is in English. Non-English content has been machine-translated and may contain typographical errors or mistranslations. ex. Some numerals are expressed as "XNUMX".
Copyrights notice

The original paper is in English. Non-English content has been machine-translated and may contain typographical errors or mistranslations. Copyrights notice

Convolutional Auto-Encoder and Adversarial Domain Adaptation for Cross-Corpus Speech Emotion Recognition 코퍼스 간 음성 감정 인식을 위한 컨벌루션 자동 인코더 및 적대 도메인 적응

Yang WANG, Hongliang FU, Huawei TAO, Jing YANG, Hongyi GE, Yue XIE

  • 조회수

    0

  • 이것을 인용

요약 :

이 편지는 교차 말뭉치 SER의 훈련 및 테스트 음성 신호가 다른 음성 말뭉치에 속하는 교차 말뭉치 음성 감정 인식(SER) 작업에 중점을 둡니다. 기존 알고리즘은 지식 전달을 촉진하기 위해 서로 다른 말뭉치 간의 공통 감정 정보를 효과적으로 추출할 수 없습니다. 이 어려운 문제를 해결하기 위해 교차 코퍼스 SER을 위한 새로운 CAEADA(Convolutional Auto-Encoder 및 Adversarial Domain Adaptation) 프레임워크가 제안되었습니다. 프레임워크는 먼저 특징 처리를 위한 1차원 컨볼루셔널 자동 인코더(XNUMXD-CAE)를 구성합니다. 이는 인접한 XNUMX차원 통계 특징 간의 상관 관계를 탐색할 수 있으며 특징 표현은 인코더-디코더 스타일 기반 아키텍처를 통해 향상될 수 있습니다. . 이후 ADA(Adversarial Domain Adaptation) 모듈은 도메인 판별자를 혼동하여 소스 도메인과 대상 도메인 간의 특징 분포 불일치를 완화하고, 특히 MMD(최대 평균 불일치)를 사용하여 특징 변환을 더 잘 수행합니다. 제안된 CAEADA를 평가하기 위해 EmoDB, eNTERFACE 및 CASIA 음성 말뭉치를 대상으로 광범위한 실험을 수행했으며 그 결과 제안한 방법이 다른 접근 방식보다 성능이 우수하다는 것을 보여줍니다.

발행
IEICE TRANSACTIONS on Information Vol.E105-D No.10 pp.1803-1806
발행일
2022/10/01
공개일
2022/07/12
온라인 ISSN
1745-1361
DOI
10.1587/transinf.2022EDL8045
원고의 종류
LETTER
범주
인공지능, 데이터마이닝

작성자

Yang WANG
  Henan University of Technology, Ministry of Education,Henan University of Technology
Hongliang FU
  Henan University of Technology, Ministry of Education,Henan University of Technology
Huawei TAO
  Henan University of Technology, Ministry of Education,Henan University of Technology
Jing YANG
  Henan University of Technology, Ministry of Education,Henan University of Technology
Hongyi GE
  Henan University of Technology, Ministry of Education,Henan University of Technology
Yue XIE
  Nanjing Institute of Technology

키워드