CV

Education

Ph.D student in Computer Science and Engineering, Shanghai Jiao Tong University, from 2023.
B.Eng. in Artificial Intelligence, Shanghai Jiao Tong University University, 2023

Skills

Skill 1
- Sub-skill 1.1
- Sub-skill 1.2
Skill 2

Publications

AHAMask: Reliable Task Specification for Large Audio Language Models without Instructions

Yiwei Guo, Bohan Li, Hankun Wang, Zhihan Li, Shuai Wang, Xie Chen, Kai Yu (2026). "AHAMask: Reliable Task Specification for Large Audio Language Models without Instructions." In Proc. AAAI, 2026.

Recent Advances in Discrete Speech Tokens: A Review

Yiwei Guo, Zhihan Li, Hankun Wang, Bohan Li, Chongtian Shao, Hanglei Zhang, Chenpeng Du, Xie Chen, Shujie Liu, Kai Yu. (2025). "Recent Advances in Discrete Speech Tokens: A Review." IEEE Transactions on Pattern Analysis and Machine Intelligence, 2025.

LSCodec: Low-Bitrate and Speaker-Decoupled Discrete Speech Codec

Yiwei Guo, Zhihan Li, Chenpeng Du, Hankun Wang, Xie Chen, Kai Yu (2025) LSCodec: Low-Bitrate and Speaker-Decoupled Discrete Speech Codec. Proc. Interspeech 2025, 5018-5022, doi: 10.21437/Interspeech.2025-1106

VoiceFlow: Efficient text-to-speech with rectified flow matching

Yiwei Guo, Chenpeng Du, Ziyang Ma, Xie Chen, Kai Yu. (2024). "VoiceFlow: Efficient text-to-speech with rectified flow matching." In Proc. IEEE ICASSP, 2024, pp. 11121-11125.

UniCATS: A unified context-aware text-to-speech framework with contextual vq-diffusion and vocoding

Chenpeng Du, Yiwei Guo, Feiyu Shen, Zhijun Liu, Zheng Liang, Xie Chen, Shuai Wang, Hui Zhang, Kai Yu. (2024). "UniCATS: A unified context-aware text-to-speech framework with contextual vq-diffusion and vocoding." Proc. AAAI, 2024, vol. 38, No. 16, pp. 17924-17932.

Talks

Talk in the University of Cambridge: Reducing Speaker and Temporal Redundancy in Discrete Speech Tokenization

October 20, 2025

Talk/Seminar at Department of Engineering, University of Cambridge, Cambridge, UK

ICASSP 2025 Tutorial: Speech Synthesis with Discrete Speech Tokens

April 07, 2025

Tutorial at ICASSP 2025, Hyderabad, India & Suzhou, China

Service and leadership

Reviewers

Yiwei Guo

CV