【量天尺】Agent AI工程师 -上海(J20573)
  • 招聘类别:
  • 校园招聘
  • 工作性质:
  • 全职
  • 薪资范围:
  • 面议
  • 招聘人数:
  • 若干
  • 发布时间:
  • 2025-09-26
  • 截止时间:
  •  
  • 工作地点:
  • 上海市

工作职责:

我们希望你是 2024年11月-2026年10月 期间毕业的 博士/硕士研究生
同时也是:
学术先锋:在国内外顶刊/顶会上发表过重要学术论文(包括但不限于NeurIPS、ICML、CVPR、ICCV、ECCV 等顶会或 IEEE Transactions 系列核心期刊)
竞赛达人:在国内外顶尖赛事中取得优秀成绩(包括但不限于RoboMaster、Topcoder、Codeforces、ACM-ICPC、RoboCup、Kaggle、Nips、Kdd)
实战高手:有自动驾驶、机器人、大模型基座,复杂Agent相关科研项目或实习经历(包括但不限于感知算法优化、决策模型开发,复杂多Agent的搭建等)
同频共振:理性务实、敢想敢干、渴望成功、乐观激进、聪明自省

工作内容:
1. 负责AI模型训练和推理流程的深度优化,包括多机多卡分布式训练方案,保障高效稳定的训练速度和推理性能,熟悉并应用TP/PP/DP/EP/ZeRO等分布式或并行优化策略,充分挖掘硬件性能。
2. 优化并行训练策略与分布式训练框架,提高模型可扩展性和集群资源利用率,解决分布式训练中的负载均衡、同步机制、通信瓶颈等问题。
3. 研究并实践模型压缩、量化(包括量化KV cache)、剪枝、FlashAttention等加速技术,缩短推理时延,降低部署成本,与算法团队合作,针对应用场景进行模型结构的裁剪和定制化。
4. 对接基础设施团队,优化集群算力、显存和带宽等资源的调度与使用效率,分析并持续降低训练和推理的总体计算成本。
5. 利用NVIDIA Nsight Compute和PyTorch Profiler等工具,深入分析模型性能瓶颈,挖掘硬件和算法的潜力。
6. 关注AI加速领域最新研究进展及产业动态,对新技术进行可行性评估与引入,主动探索并落地新型训练优化策略或加速引擎。


任职资格:

1. 计算机科学、人工智能或相关专业,硕士及以上学历,博士优先,有顶会期刊(CVPR、ICML等)优先。
2. 熟悉分布式训练和并行计算,有大规模项目实战背景。有AI模型训练与推理加速相关经验
3. 精通主流深度学习算法,包括但不限于 Transformer、Diffusion、GNN、强化学习等,熟悉其计算模式及优化要点。
4. 编程基础扎实,熟练掌握Python、C/C++等语言,具备良好的架构设计及编码规范。
5. 熟悉主流深度学习框架(如TensorFlow、PyTorch)及分布式训练框架(如DeepSpeed、NeMo Megatron等),熟悉推理框架(如vLLM、TensorRT等),对多进程、多线程、MPI等并行计算有深入理解。
6. 熟悉模型压缩、量化、剪枝等模型加速方法,并具备相关项目实践经验。
7.熟悉模型性能分析工具(如PyTorch Profiler、TensorBoard等),有性能优化经验者优先
8. 参与过相关领域的技术竞赛并获得优异成绩(如Kaggle、ACM、MLPerf)优先。

©2025  上海哈啰普惠科技有限公司   京ICP备05051632号-16 京公网安备 11010802032024号隐私政策 Powered by