
工作职责:
工作内容:
1. 基于Cuda和TenseorRT开发推理框架,优化工具链
2. 开发工具监测GPU运行效率及显存使用,提高应用的效率和性能
3. 端侧部署与性能优化,主导世界模型方案落地,综合运用指令集优化,线程调度策略,内存池管理技术,实现极致性能与资源利用
4. 平台部署可行性评估:系统性评估世界模型相关模块在数据平台适配潜力,输出模型能力报告以及性能优化路径
任职资格:
任职要求:
1. 硕士及以上学历,计算机/自动化/数学/机器人等相关专业,掌握计算机体系结构核心知识
2. 精通c++/c面向对象编程,具备图像处理/计算机视觉领域实践经验
3. 硬件编程专长:深入理解CPU GPU AI加速硬件架构,具备ARM/NEON/DSP编程或GPU OpenCL开发经验者优先
4. 有多元化计算机架构下编译系统开发,编译优化或算法加速经验者优先