工作职责:
负责AI平台、大模型平台及AI应用平台相关系统的设计与开发,聚焦智能Agent、RAG等前沿AI能力的工程化落地;
1. 涵盖机器学习系统模型训练、模型推理、资源管理、工作流、模型评估、数据处理、监控告警等功能模块开发;
2. 负责多种异构资源如GPU、CPU、RDMA等的最优化的编排调度,提升集群的整体资源利用率;
3. 解决开发过程中遇到的技术难题,确保项目按时交付;
4. 与算法团队密切合作,负责机器学习、深度学习算法模型的工程化、服务化以及产品化;
5. 负责平台的性能优化和稳定性保障,监控系统运行状态,及时发现和解决潜在的问题。
6. 大模型推理性能优化。
任职资格:
熟悉大模型Agent、RAG应用开发,熟悉LangChain、LlamaIndex等常用框架者优先。
熟悉k8s云原生,有二次开发经验者优先
了解ai相关技术知识者优先