IEEE ICASSP 2022

2022 IEEE International Conference on Acoustics, Speech and Signal Processing

7-13 May 2022

Virtual (all paper presentations)

22-27 May 2022

Main Venue: Marina Bay Sands Expo & Convention Center, Singapore

27-28 October 2022

Satellite Venue: Crowne Plaza Shenzhen Longgang City Centre, Shenzhen, China

ICASSP 2022

SPE-15.3

SPEECH EMOTION RECOGNITION WITH GLOBAL-AWARE FUSION ON MULTI-SCALE FEATURE REPRESENTATION

Wenjing Zhu, Xiang Li, DXM Financial, China

Session:

Emotion Recognition: Representation Learning

Location:

Gather Area D

Presentation Time:

Sun, 8 May, 23:00 - 23:45 China Time (UTC +8)
Sun, 8 May, 15:00 - 15:45 UTC

Session Chair:

Jianhua Tao, Institute of Automation Chinese Academy of Sciences

Resources

View Manuscript

Session SPE-15

SPE-15.1: DOMAIN-INVARIANT FEATURE LEARNING FOR CROSS CORPUS SPEECH EMOTION RECOGNITION

Yuan Gao, Longbiao Wang, Jiaxing Liu, Jianwu Dang, Tianjin University, China; Shogo Okada, Japan Advanced Institute of Science and Technology, Japan

SPE-15.2: MULTI-STAGE GRAPH REPRESENTATION LEARNING FOR DIALOGUE-LEVEL SPEECH EMOTION RECOGNITION

Yaodong Song, Jiaxing Liu, Longbiao Wang, Ruiguo Yu, Tianjin University, China; Jianwu Dang, Japan Advanced Institute of Science and Technology, Japan

SPE-15.3: SPEECH EMOTION RECOGNITION WITH GLOBAL-AWARE FUSION ON MULTI-SCALE FEATURE REPRESENTATION

Wenjing Zhu, Xiang Li, DXM Financial, China

SPE-15.4: REPRESENTATION LEARNING THROUGH CROSS-MODAL CONDITIONAL TEACHER-STUDENT TRAINING FOR SPEECH EMOTION RECOGNITION

Sundararajan Srinivasan, Zhaocheng Huang, Katrin Kirchhoff, Amazon.com, United States of America

SPE-15.5: NOT ALL FEATURES ARE EQUAL: SELECTION OF ROBUST FEATURES FOR SPEECH EMOTION RECOGNITION IN NOISY ENVIRONMENTS

Seong-Gyun Leem, Carlos Busso, The University of Texas at Dallas, United States of America; Daniel Fulford, Boston University, United States of America; Jukka-Pekka Onnela, Harvard University, United States of America; David Gard, San Francisco State University, United States of America

SPE-15.6: TOWARDS TRANSFERABLE SPEECH EMOTION REPRESENTATION: ON LOSS FUNCTIONS FOR CROSS-LINGUAL LATENT REPRESENTATIONS

Sneha Das, Line H. Clemmensen, Technical University of Denmark, Denmark; Nicole Nadine Lønfeldt, Copenhagen University Hospital, Capital Region, Denmark; Anne Katrine Pagsberg, Copenhagen University Hospital and Copenhagen University, Denmark

Contact | Accessibility | Nondiscrimination Policy | IEEE Ethics Reporting | IEEE Privacy Policy | Terms | Signal Processing Society

©2026 IEEE – All rights reserved.

Last updated Last updated 21 May 2022.

Use of this website signifies your agreement to the IEEE Terms and Conditions.

Support: webmaster@2022.ieeeicassp.org Host: https://cmsworldwide.com/