IEEE ICASSP 2022

2022 IEEE International Conference on Acoustics, Speech and Signal Processing

7-13 May 2022

Virtual (all paper presentations)

22-27 May 2022

Main Venue: Marina Bay Sands Expo & Convention Center, Singapore

27-28 October 2022

Satellite Venue: Crowne Plaza Shenzhen Longgang City Centre, Shenzhen, China

ICASSP 2022

CHAL-4.5

MULTI-SCALE TEMPORAL FREQUENCY CONVOLUTIONAL NETWORK WITH AXIAL ATTENTION FOR MULTI-CHANNEL SPEECH ENHANCEMENT

Guochang Zhang, Chunliang Wang, Libiao Yu, Jianqiang Wei, Baidu, China

Session:

L3DAS22 Machine Learning for 3D Audio Signal Processing

Location:

Gather Area A

Presentation Time:

Sat, 7 May, 22:00 - 22:45 China Time (UTC +8)
Sat, 7 May, 14:00 - 14:45 UTC

Session Chair:

Danilo Comminiello, Sapienza University of Rome

Resources

View Manuscript

Session CHAL-4

CHAL-4.1: L3DAS22 CHALLENGE: LEARNING 3D AUDIO SOURCES IN A REAL OFFICE ENVIRONMENT

Eric Guizzo, Christian Marinoni, Marco Pennese, Aurelio Uncini, Danilo Comminiello, Sapienza University of Rome, Italy; Xinlei Ren, Xiguang Zheng, Chen Zhang, Kuaishou Technology, China; Bruno Masiero, University of Campinas, Brazil

CHAL-4.2: ICASSP 2022 L3DAS22 CHALLENGE: ENSEMBLE OF RESNET-CONFORMERS WITH AMBISONICS DATA AUGMENTATION FOR SOUND EVENT LOCALIZATION AND DETECTION

Yongjian Mao, Ying Zeng, Hongqing Liu, Wenbin Zhu, Yi Zhou, Chongqing University of Posts and Telecommunications, China

CHAL-4.3: A TRACK-WISE ENSEMBLE EVENT INDEPENDENT NETWORK FOR POLYPHONIC SOUND EVENT LOCALIZATION AND DETECTION

Jinbo Hu, Ming Wu, Feiran Yang, Jun Yang, Institute of Acoustics, Chinese Academy of Sciences, China; Yin Cao, Mark Plumbley, University of Surrey, United Kingdom of Great Britain and Northern Ireland; Qiuqiang Kong, ByteDance, China

CHAL-4.4: TOWARDS LOW-DISTORTION MULTI-CHANNEL SPEECH ENHANCEMENT: THE ESPNET-SE SUBMISSION TO THE L3DAS22 CHALLENGE

Yen-Ju Lu, Xuankai Chang, Zhong-Qiu Wang, Shinji Watanabe, Carnegie Mellon University, United States of America; Samuele Cornell, Università Politecnica delle Marche, Italy; Wangyou Zhang, Chenda Li, Shanghai Jiao Tong University, China; Zhaoheng Ni, Meta, United States of America

CHAL-4.5: MULTI-SCALE TEMPORAL FREQUENCY CONVOLUTIONAL NETWORK WITH AXIAL ATTENTION FOR MULTI-CHANNEL SPEECH ENHANCEMENT

Guochang Zhang, Chunliang Wang, Libiao Yu, Jianqiang Wei, Baidu, China

CHAL-4.6: THE PCG-AIID SYSTEM FOR L3DAS22 CHALLENGE: MIMO AND MISO CONVOLUTIONAL RECURRENT NETWORK FOR MULTI CHANNEL SPEECH ENHANCEMENT AND SPEECH RECOGNITION

Jingdong Li, Yuanyuan Zhu, Dawei Luo, Yun Liu, Guohui Cui, Zhaoxia Li, Tencent, China

Contact | Accessibility | Nondiscrimination Policy | IEEE Ethics Reporting | IEEE Privacy Policy | Terms | Signal Processing Society

©2026 IEEE – All rights reserved.

Last updated Last updated 21 May 2022.

Use of this website signifies your agreement to the IEEE Terms and Conditions.

Support: webmaster@2022.ieeeicassp.org Host: https://cmsworldwide.com/