上海哈啰普惠科技有限公司招聘系统--招聘详细

【量天尺】Agent AI工程师 -上海(J20573)

招聘类别：
校园招聘
工作性质：
全职
薪资范围：
面议
招聘人数：
若干

发布时间：
2025-09-26
截止时间：

工作地点：
上海市

工作职责：

我们希望你是 2024年11月-2026年10月期间毕业的博士/硕士研究生
同时也是：
学术先锋：在国内外顶刊/顶会上发表过重要学术论文（包括但不限于NeurIPS、ICML、CVPR、ICCV、ECCV 等顶会或 IEEE Transactions 系列核心期刊）
竞赛达人：在国内外顶尖赛事中取得优秀成绩（包括但不限于RoboMaster、Topcoder、Codeforces、ACM-ICPC、RoboCup、Kaggle、Nips、Kdd）
实战高手：有自动驾驶、机器人、大模型基座，复杂Agent相关科研项目或实习经历（包括但不限于感知算法优化、决策模型开发,复杂多Agent的搭建等）
同频共振：理性务实、敢想敢干、渴望成功、乐观激进、聪明自省

工作内容：
1. 负责AI模型训练和推理流程的深度优化，包括多机多卡分布式训练方案，保障高效稳定的训练速度和推理性能，熟悉并应用TP/PP/DP/EP/ZeRO等分布式或并行优化策略，充分挖掘硬件性能。
2. 优化并行训练策略与分布式训练框架，提高模型可扩展性和集群资源利用率，解决分布式训练中的负载均衡、同步机制、通信瓶颈等问题。
3. 研究并实践模型压缩、量化（包括量化KV cache）、剪枝、FlashAttention等加速技术，缩短推理时延，降低部署成本，与算法团队合作，针对应用场景进行模型结构的裁剪和定制化。
4. 对接基础设施团队，优化集群算力、显存和带宽等资源的调度与使用效率，分析并持续降低训练和推理的总体计算成本。
5. 利用NVIDIA Nsight Compute和PyTorch Profiler等工具，深入分析模型性能瓶颈，挖掘硬件和算法的潜力。
6. 关注AI加速领域最新研究进展及产业动态，对新技术进行可行性评估与引入，主动探索并落地新型训练优化策略或加速引擎。

任职资格：

1. 计算机科学、人工智能或相关专业，硕士及以上学历，博士优先，有顶会期刊（CVPR、ICML等）优先。
2. 熟悉分布式训练和并行计算，有大规模项目实战背景。有AI模型训练与推理加速相关经验
3. 精通主流深度学习算法，包括但不限于 Transformer、Diffusion、GNN、强化学习等，熟悉其计算模式及优化要点。
4. 编程基础扎实，熟练掌握Python、C/C++等语言，具备良好的架构设计及编码规范。
5. 熟悉主流深度学习框架（如TensorFlow、PyTorch）及分布式训练框架（如DeepSpeed、NeMo Megatron等），熟悉推理框架（如vLLM、TensorRT等），对多进程、多线程、MPI等并行计算有深入理解。
6. 熟悉模型压缩、量化、剪枝等模型加速方法，并具备相关项目实践经验。
7.熟悉模型性能分析工具（如PyTorch Profiler、TensorBoard等），有性能优化经验者优先
8. 参与过相关领域的技术竞赛并获得优异成绩（如Kaggle、ACM、MLPerf）优先。

现在申请

返回职位列表

热招职位更多 >>

长招职位更多 >>