
工作职责:
岗位职责:
1.负责自动驾驶/智能驾驶相关感知模型(如OD、OCC、Lane、TFL、TFS、E2E等)的高效量化与加速,推动模型在嵌入式终端平台的上线落地;
2.参与模型从训练到推理的全流程优化,包括模型转换、量化、剪枝、蒸馏、加速等,提升模型推理效率和部署性能;
3.负责模型在NVIDIA Orin、NVIDIA Thor等芯片平台上的性能优化与落地,针对硬件特性进行模型结构适配与算子优化;
4.根据业务需求,进行CUDA、DSP等底层加速优化,实现高性能推理;
5.跟进主流感知模型(如BEVFusion、Sparse4D、Transformer结构、稀疏卷积等)的前沿部署方案,并推进落地;
6.负责编写相关量化、加速流程文档和工具脚本,支持自动化部署与性能回归测试。
任职资格:
任职要求:
1.计算机、自动化、电子工程等相关专业本科及以上学历,2年以上AI模型量化与加速经验;
2.熟练掌握Python、C/C++编程,具备扎实的代码能力,熟悉主流深度学习框架(如PyTorch/ONNX/TensorRT等);
3.熟悉模型量化、剪枝、蒸馏等模型压缩与加速方法,具备实际项目经验;
4.熟悉CUDA开发及性能优化,或具备DSP等异构计算平台的优化经验;
5.有BEVFusion、Sparse4D等主流感知模型的量化部署经验者优先;
6.有Transformer结构(如ViT、Swin Transformer等)、稀疏卷积(Sparse Convolution)相关模型的量化及部署经验者优先;
7.有NVIDIA Orin、Thor、TI TDA4、J5/J6、高通等芯片的模型加速部署经验优先;
8.具备良好的性能分析与调优能力,能够针对资源受限平台进行模型裁剪和推理加速;
9.具备良好的沟通、团队协作与主动学习能力。
加分项
- 有实际量产项目部署经验,或参与过自动驾驶感知系统的端到端上线;
- 熟悉异构计算(如FPGA、NPU等)、多芯片协同调度、模型自动化部署工具链;
- 英语良好,能阅读、撰写技术文档。