My SLT 2018 Schedule

Note: Your custom schedule will not be saved unless you create a new account or login to an existing account.

Create a login based on your email (takes less than one minute)
Perform 'Paper Search'
Select papers that you desire to save in your personalized schedule
Click on 'My Schedule' to see the current list of selected papers
Click on 'Printable Version' to create a separate window suitable for printing (the header and menu will appear, but will not actually print)

Clicking on the Add button next to a paper title will add that paper to your custom schedule.
Clicking on the Remove button next to a paper will remove that paper from your custom schedule.

ASR IV

Session Type: Poster

Time: Friday, December 21, 13:30 - 15:30

Location: Kallirhoe Hall

1: TOWARD DOMAIN-INVARIANT SPEECH RECOGNITION VIA LARGE SCALE TRAINING

Arun Narayanan; Google

Ananya Misra; Google

Khe Chai Sim; Google

Golan Pundak; Google

Anshuman Tripathi; Google

Mohamed Elfeky; Google

Parisa Haghani; Google

Trevor Strohman; Google

Michiel Bacchiani; Google

2: TRANSLITERATION BASED APPROACHES TO IMPROVE CODE-SWITCHED SPEECH RECOGNITION PERFORMANCE

Jesse Emond; Google

Bhuvana Ramabhadran; Google

Brian Roark; Google

Pedro Moreno; Google

Min Ma; Google

3: EXPLORING LAYER TRAJECTORY LSTM WITH DEPTH PROCESSING UNITS AND ATTENTION

Jinyu Li; Microsoft

Liang Lu; Microsoft

Changliang Liu; Microsoft

Yifan Gong; Microsoft

4: MULTICHANNEL ASR WITH KNOWLEDGE DISTILLATION AND GENERALIZED CROSS CORRELATION FEATURE

Wenjie Li; Key Laboratory of Speech Acoustics and Content Understanding, Institute of Acoustics

Yu Zhang; Key Laboratory of Speech Acoustics and Content Understanding, Institute of Acoustics

Pengyuan Zhang; Key Laboratory of Speech Acoustics and Content Understanding, Institute of Acoustics

Fengpei Ge; Key Laboratory of Speech Acoustics and Content Understanding, Institute of Acoustics

5: OPTIMIZING THE QUALITY OF SYNTHETICALLY GENERATED PSEUDOWORDS FOR THE TASK OF MINIMAL-PAIR DISTINCTION

Heiko Holz; University of Tübingen

Maria Chinkina; University of Tübingen

Laura Vetter; Ludwig Maximilian University of Munich

6: LEVERAGING SEQUENCE-TO-SEQUENCE SPEECH SYNTHESIS FOR ENHANCING ACOUSTIC-TO-WORD SPEECH RECOGNITION

Masato Mimura; Kyoto University

Sei Ueno; Kyoto University

Hirofumi Inaguma; Kyoto University

Shinsuke Sakai; Kyoto University

Tatsuya Kawahara; Kyoto University

7: HIERARCHICAL MULTITASK LEARNING WITH CTC

Ramon Sanabria; Carnegie Mellon University

Florian Metze; Carnegie Mellon University

8: A K-NEAREST NEIGHBOURS APPROACH TO UNSUPERVISED SPOKEN TERM DISCOVERY

Alexis Thual; ENS

Corentin Dancette; ENS

Julien Karadayi; ENS

Juan Benjumea; ENS

Emmanuel Dupoux; ENS

9: A NEW TIMIT BENCHMARK FOR CONTEXT-INDEPENDENT PHONE RECOGNITION USING TURBO FUSION

Timo Lohrenz; TU Braunschweig

Wei Li; TU Braunschweig

Tim Fingscheidt; TU Braunschweig

10: EFFICIENT IMPLEMENTATION OF RECURRENT NEURAL NETWORK TRANSDUCER IN TENSORFLOW

Tom Bagby; Google

Kanishka Rao; Google

Khe Chai Sim; Google

11: AUDIO-VISUAL SPEECH RECOGNITION WITH A HYBRID CTC/ATTENTION ARCHITECTURE

Stavros Petridis; Imperial College London

Themos Stafylakis; University of Nottingham

Pingchuan Ma; Imperial College London

Georgios Tzimiropoulos; University of Nottingham

Maja Pantic; Imperial College London

12: MULTILINGUAL SEQUENCE-TO-SEQUENCE SPEECH RECOGNITION: ARCHITECTURE, TRANSFER LEARNING, AND LANGUAGE MODELING

Jaejin Cho; Johns Hopkins University

Murali Karthick Baskar; Brno university of technology

Ruizhi Li; Johns Hopkins University

Matthew Wiesner; Johns Hopkins University

Sri Harish Mallidi; Amazon

Nelson Yalta; Waseda University

Martin Karafiat; Brno university of technology

Shinji Watanabe; Johns Hopkins University

Takaaki Hori; Mitsubishi Electric Research Laboratories

13: SPEAKER SELECTIVE BEAMFORMER WITH KEYWORD MASK ESTIMATION

Yusuke Kida; Yahoo Japan Corporation

Dung Tran; Yahoo Japan Corporation

Motoi Omachi; Yahoo Japan Corporation

Toru Taniguchi; Yahoo Japan Corporation

Yuya Fujita; Yahoo Japan Corporation

14: SPEAKER ADAPTED BEAMFORMING FOR MULTI-CHANNEL AUTOMATIC SPEECH RECOGNITION

Tobias Menne; RWTH Aachen University

Ralf Schlüter; RWTH Aachen University

Hermann Ney; RWTH Aachen University

15: SPEAKER ADAPTATION FOR END-TO-END CTC MODELS

Ke Li; Johns Hopkins University

Jinyu Li; Microsoft AI and Research

Yong Zhao; Microsoft AI and Research

Kshitiz Kumar; Microsoft AI and Research

Yifan Gong; Microsoft AI and Research

16: AN EXPLORATION OF MIMIC ARCHITECTURES FOR RESIDUAL NETWORK BASED SPECTRAL MAPPING

Peter Plantinga; The Ohio State University

Deblin Bagchi; The Ohio State University

Eric Fosler-Lussier; The Ohio State University

17: MULTI-CHANNEL MULTI-SPEAKER OVERLAPPED SPEECH RECOGNITION WITH LOCATION GUIDED SPEECH EXTRACTION NETWORK

Zhuo Chen; Microsoft Cloud & AI

Xiong Xiao; Microsoft Cloud & AI

Takuya Yoshioka; Microsoft Cloud & AI

Jinyu Li; Microsoft Cloud & AI

Hakan Erdogan; Microsoft Cloud & AI

Yifan Gong; Microsoft Cloud & AI

18: A STUDY ON SPEECH ENHANCEMENT USING EXPONENT-ONLY FLOATING POINT QUANTIZED NEURAL NETWORK (EOFP-QNN)

Yi-Te Hsu; Academia Sinica

Yu-Chen Lin; National Taiwan University

Szu-Wei Fu; National Taiwan University

Yu Tsao; Academia Sinica

Tei-Wei Kuo; National Taiwan University

19: RAPID SPEAKER ADAPTATION OF NEURAL NETWORK BASED FILTERBANK LAYER FOR AUTOMATIC SPEECH RECOGNITION

Hiroshi Seki; Toyohashi University of Technology

Kazumasa Yamamoto; Chubu University

Tomoyosi Akiba; Toyohashi University of Technology

Seiichi Nakagawa; Chubu University

20: FAR-FIELD ASR USING LOW-RANK AND SPARSE SOFT TARGETS FROM PARALLEL DATA

Pranay Dighe; Idiap Research Institute, EPFL

Afsaneh Asaei; Idiap Research Institute

Herve Bourlard; Idiap Research Institute, EPFL

21: DEEP VIEW2VIEW MAPPING FOR VIEW-INVARIANT LIPREADING

Alexandros Koumparoulis; National Technical University of Athens

Gerasimos Potamianos; University of Thessaly