职位描述 1. 利用滴滴海量的出行语音数据,参与公司核心语音识别等算法的设计和研究; 2. 跟踪研究业界领先的语音新算法及技术,包括语音识别、语音合成、语音事件监测、语音情绪识别等; 3. 参与语音相关数据整理、模型训练、技术创新与实现等工作; 4. 配合产品完成语音业务相关的需求及指标。
亮点 1. 业界领先的语音识别和合成系统 2. 丰富多样且具有挑战的语音应用场景 3. 经验丰富的语音大牛 4. 宽松向上的团队氛围 5. 有机会参与到顶会论文的发表工作中
工资福利 1. 免费水果零食 2. 餐补 3. 打车报销 4. 有竞争力的薪酬
任职要求 1. 具有计算机,电子工程,自动化,数学等相关专业本科及以上学历; 2. 熟悉常用的深度学习模型和机器学习方法,包括且不限于CNN、RNN、LSTM、Attention等; 3. 对语音识别整体框架有一定了解,有声学模型/语言模型/语音合成/信号处理/声纹识别/语音事件监测/情绪识别中一项或几项相关项目经验者优先; 4. 工程能力强,熟悉和掌握C/C++ 和脚本语言编程(如Shell, Python等)者优先; 5. 使用过Kaldi,HTK等工具者优先; 6. 实习时间不少于三个月;
联系方式 请将简历发到jiangdongwei@didichuxing.com,我们会尽快安排面试
P.S. 对我们团队的工作有兴趣的同学可以先看一下 1 我们开源的Athena项目(https://github.com/athena-team/athena),项目中包含了各种SOTA的ASR和TTS recipe,WFST构图与解码,C++ deployment的实现,MPC无监督预训练等 2 “CCF语音对话与听觉专业组走进企业系列活动"中对滴滴语音技术的介绍 https://mp.weixin.qq.com/s/PXcsNhg_vXHaMLATOZPuKg 3 机器之心报道的我们近期在无监督预训练上的工作 https://mp.weixin.qq.com/s/4wLR_9RVxbTsHKXf-1MLIw 4 我们团队参加Interspeech的时候写的一系列语音技术发展趋势的文章 https://mp.weixin.qq.com/s/dOrJ9zGelffKGnSAZ1coyA 5 AI前线上的文章 https://mp.weixin.qq.com/s/c64XucML13OwI26_UE9xDQ ,这是我们团队去年的成果之一~
|