训推平台工程师(J20394)
  • 招聘类别:
  • 社会招聘
  • 工作性质:
  • 全职
  • 薪资范围:
  • 面议
  • 招聘人数:
  • 2
  • 发布时间:
  • 2025-09-09
  • 截止时间:
  •  
  • 工作地点:
  • 北京市,上海市

工作职责:

● 构建端到端训练流水线(Argo Workflows)
● 基于 Volcano 实现 gang、拓扑感知、抢占调度
● 优化 PyTorch 分布式训练性能(DDP)


任职资格:

必备技能
● 熟悉 Argo Workflows、Volcano
● 具备 PyTorch 分布式训练经验
● 理解 NCCL / UCX
● 熟练掌握 Kubernetes
加分技能
● 大规模分布式训练或自动驾驶训练经验

©2025  上海哈啰普惠科技有限公司   京ICP备05051632号-16 京公网安备 11010802032024号隐私政策 Powered by