검색 기능은 준비 중입니다.
검색 기능은 준비 중입니다.

The original paper is in English. Non-English content has been machine-translated and may contain typographical errors or mistranslations. ex. Some numerals are expressed as "XNUMX".
Copyrights notice

The original paper is in English. Non-English content has been machine-translated and may contain typographical errors or mistranslations. Copyrights notice

A Two-Stage Attention Based Modality Fusion Framework for Multi-Modal Speech Emotion Recognition 다중 모드 음성 감정 인식을 위한 XNUMX단계 주의 기반 양식 융합 프레임워크

Dongni HU, Chengxin CHEN, Pengyuan ZHANG, Junfeng LI, Yonghong YAN, Qingwei ZHAO

  • 조회수

    0

  • 이것을 인용

요약 :

최근 인간의 감정을 자동으로 인식하고 분석하는 것이 여러 분야의 커뮤니티에서 점점 더 주목을 받고 있습니다. 그러나 여러 양식에서 감정 정보를 동시에 활용하는 것은 어렵습니다. 이전 연구에서는 다양한 융합 방법을 탐구했지만 주로 양식 간 상호 작용 또는 양식 내 상호 작용에 중점을 두었습니다. 이 편지에서 우리는 통합된 엔드투엔드 프레임워크에서 양식 내 및 양식 간 상호 작용을 동시에 모델링하기 위해 MAF(양식 주의 흐름)라는 새로운 XNUMX단계 융합 전략을 제안합니다. 실험 결과는 제안된 접근 방식이 널리 사용되는 후기 융합 방법보다 성능이 뛰어나고 적층된 MAF 블록 수가 증가할 때 더 나은 성능을 달성한다는 것을 보여줍니다.

발행
IEICE TRANSACTIONS on Information Vol.E104-D No.8 pp.1391-1394
발행일
2021/08/01
공개일
2021/04/30
온라인 ISSN
1745-1361
DOI
10.1587/transinf.2021EDL8002
원고의 종류
LETTER
범주
인간 컴퓨터 상호 작용

작성자

Dongni HU
  Chinese Academy of Sciences,University of Chinese Academy of Sciences
Chengxin CHEN
  Chinese Academy of Sciences,University of Chinese Academy of Sciences
Pengyuan ZHANG
  Chinese Academy of Sciences,University of Chinese Academy of Sciences
Junfeng LI
  Chinese Academy of Sciences,University of Chinese Academy of Sciences
Yonghong YAN
  Chinese Academy of Sciences,University of Chinese Academy of Sciences
Qingwei ZHAO
  Chinese Academy of Sciences

키워드