高级/资深音频算法工程师(AIGC方向)
Zoom ·careers.zoom.com
Apply directExcited to grow your career?
We value our talented employees, and whenever possible strive to help one of our associates grow professionally before recruiting new talent to our open positions. If you think the open position you see is right for you, we encourage you to apply!
Our people make all the difference in our success.
【职位亮点】
技术前沿: 聚焦大模型与生成式AI,探索下一代音频技术。
核心业务: 直接参与公司核心产品线的音频体验创新与构建。
专家团队: 与业内顶尖的算法专家和工程师合作,共同成长。
应用广泛: 研究方向覆盖语音生成、增强、编码、3D音频等多个热门领域。
【岗位职责】负责基于大型模型(Transformer, Diffusion Model等)的音频算法设计与研发。
主导或参与以下至少一个技术方向的研发与落地:
生成式音频: 包括文本到语音合成(TTS)、端到端AI编解码(E2E AI Codec)、AI音乐生成、语音修复(Speech Restoration)等。
语音增强: 攻克复杂场景下的降噪难题,特别是保留音乐背景的语音降噪;优化AI回声消除(AEC)及干扰抑制(Suppression)算法。
空间音频: 研发个性化HRTF生成与3D音频渲染算法;
负责跟进学术界与工业界的前沿进展,推动新技术在产品中的应用与迭代。
负责核心算法的模型训练、性能优化与部署,确保算法的效率与效果。
【任职要求】
计算机、电子信息、信号处理等相关专业博士。
具备扎实的数字信号处理理论基础,并精通深度学习,特别是生成式模型。
精通Python,熟练运用PyTorch或TensorFlow等至少一种深度学习框架。
【加分项】
在INTERSPEECH, ICASSP, NeurIPS, ICML, IEEE TASLP等顶级会议或期刊发表过相关论文。
具备大规模模型(LLM、多模态大模型)的训练、微调或部署经验。