上海哈啰普惠科技有限公司招聘系统--招聘详细

强化学习算法工程师-【自动驾驶】(J20772)

招聘类别：
社会招聘
工作性质：
全职
薪资范围：
面议
招聘人数：
若干

发布时间：
2025-11-25
截止时间：

工作地点：
上海市

工作职责：

工作职责：
1、设计并实现面向自动驾驶的强化学习训练框架，提升端到端大模型在稀疏场景下的训练效率和泛化能力；
2、研发适用于驾驶决策、路径规划与交互博弈的强化学习算法，包括但不限于GRPO、PPO和DPO等，解决L4 Robotaxi场景中的安全性、强交互博弈和长尾场景等问题。

任职资格：

任职资格：
1、本科及以上学历，专业方向包括计算机、软件、自动化、模式识别等理工科，工作经验不小于2年；
2、具备较强的编程能力，精通Python及C++语言，熟悉Docker容器化部署，有良好的编程习惯和标准化的代码风格；
3、熟悉UniAD、Pluto、Diffusion Planner等主流的端到端模型；
4、熟悉GRPO、PPO和DPO等强化学习算法，有自动驾驶强化学习业务应用的经验者优先。

加分项：
1、具备数据驱动算法的研发能力，有端到端模型算法的开发和优化经验；
2、在CVPR/ICCV/ECCV/ICLR/ICRA/IROS/CoRL/NeurlPS等发表过RL相关论文。

现在申请

返回职位列表

热招职位更多 >>

长招职位更多 >>