智能语音算法(J20676)
  • 招聘类别:
  • 社会招聘
  • 工作性质:
  • 全职
  • 薪资范围:
  • 面议
  • 招聘人数:
  • 1
  • 发布时间:
  • 2025-10-28
  • 截止时间:
  •  
  • 工作地点:
  • 上海市

工作职责:

1. 语音唤醒算法研发与优化
* 负责车载语音唤醒(KWS)模型的训练、优化与部署(ONNX、Android、车机端推理)。
* 提升唤醒率、降低误唤醒率与延迟,优化算法在不同噪声/口音环境下的稳定性。
2. 实时语音交互链路(RTC)设计与优化
* 负责语音识别、语义理解、TTS 链路的实时传输与延迟优化。
* 设计座舱语音 Agent 的交互逻辑,实现自然流畅的多轮语音对话。
* 具备 ASR / NLU / TTS 等模型的端侧部署与性能优化经验。
3. 座舱语音 Agent 智能行为设计
* 结合场景(导航、空调、娱乐等)设计多模态交互策略。
* 实现语音 / 车控 / 第三方 MCP融合能力。
* 参与构建基于大语言模型的座舱智能体,包括意图识别、上下文记忆、对话策略等。
4. 跨部门协作与系统落地
* 与客户端、算法平台、产品及整车团队合作,推动算法落地与闭环优化。


任职资格:

1. 学历背景
* 硕士及以上学历,计算机、电子工程、人工智能等相关专业。
2. 技术能力
* 熟悉语音唤醒(KWS)、语音识别(ASR)、语音增强或降噪算法原理,拥有对应开发、训练和端侧部署经验。
* 具备 PyTorch / ONNXRuntime / 端侧 等框架下的模型开发经验。
* 熟悉语音算法部署流程,具备 C++ / Python / Android NDK 推理经验。
* 熟悉 WebRTC / RTP / 流式语音交互协议者优先。
* 有 LLM / RAG / 语音 Agent 研发经验者优先。
3. 加分项
* 有车载语音、智能座舱、智能助手等项目经验。
* 对语音交互系统(唤醒 → 识别 → 生成 → 播报)有完整理解,具备座舱算法开发经验。
* 有多麦语音阵列、AEC / NS / VAD、噪声鲁棒性算法经验。

©2025  上海哈啰普惠科技有限公司   京ICP备05051632号-16 京公网安备 11010802032024号隐私政策 Powered by