强化学习算法工程师-【自动驾驶】(J20772)
  • 招聘类别:
  • 社会招聘
  • 工作性质:
  • 全职
  • 薪资范围:
  • 面议
  • 招聘人数:
  • 若干
  • 发布时间:
  • 2025-11-25
  • 截止时间:
  •  
  • 工作地点:
  • 上海市

工作职责:

工作职责:
1、设计并实现面向自动驾驶的强化学习训练框架,提升端到端大模型在稀疏场景下的训练效率和泛化能力;
2、研发适用于驾驶决策、路径规划与交互博弈的强化学习算法,包括但不限于GRPO、PPO和DPO等,解决L4 Robotaxi场景中的安全性、强交互博弈和长尾场景等问题。


任职资格:

任职资格:
1、本科及以上学历,专业方向包括计算机、软件、自动化、模式识别等理工科,工作经验不小于2年;
2、具备较强的编程能力,精通Python及C++语言,熟悉Docker容器化部署,有良好的编程习惯和标准化的代码风格;
3、熟悉UniAD、Pluto、Diffusion Planner等主流的端到端模型;
4、熟悉GRPO、PPO和DPO等强化学习算法,有自动驾驶强化学习业务应用的经验者优先。

加分项:
1、具备数据驱动算法的研发能力,有端到端模型算法的开发和优化经验;
2、 在CVPR/ICCV/ECCV/ICLR/ICRA/IROS/CoRL/NeurlPS等发表过RL相关论文。

©2025  上海哈啰普惠科技有限公司   京ICP备05051632号-16 京公网安备 11010802032024号隐私政策 Powered by