职位描述
该职位还未进行加V认证,请仔细了解后再进行投递!
工作职责:
负责AI模型工程化相关工作,如框架设计、模型优化、推理加速等。
任职资格:
1、计算机、人工智能等相关专业本科以上学历,3年以上工作经验,具备扎实的C/C /Python/CUDA等编程经验及工程化经验
2、2年及以上大模型分布式推理引擎开发经验;国际竞赛和核心会议发文
3、有AI Infra公司和AI芯片公司、大语言模型推理框架研发经验优先
4、有内存管理、算子优化、机器学习编译、异步并发、IO优化相关研发经验优先
5、熟悉深度学习算法(transformer、LLM、VLM、DM等)及及常用开源大模型
6、熟悉AI常用训练和部署(如PyTorch/DeepSpeed/QNN/vllm/
TensorRT/sglang/ktransformer/openvino/ncnn/onnx等)应用与原理
7、熟悉常见模型轻量化方法(量化AWQ/GPTQ、剪枝、蒸馏等)和大模型推理加速(off-loading、投机采样等)及相关工具链
8、有CUDA性能优化及其他硬件(如 CPU、NPU 等)的使用、相关的性能调优经验,如FastTransformer、TensorRT、triton等经验优先
负责AI模型工程化相关工作,如框架设计、模型优化、推理加速等。
任职资格:
1、计算机、人工智能等相关专业本科以上学历,3年以上工作经验,具备扎实的C/C /Python/CUDA等编程经验及工程化经验
2、2年及以上大模型分布式推理引擎开发经验;国际竞赛和核心会议发文
3、有AI Infra公司和AI芯片公司、大语言模型推理框架研发经验优先
4、有内存管理、算子优化、机器学习编译、异步并发、IO优化相关研发经验优先
5、熟悉深度学习算法(transformer、LLM、VLM、DM等)及及常用开源大模型
6、熟悉AI常用训练和部署(如PyTorch/DeepSpeed/QNN/vllm/
TensorRT/sglang/ktransformer/openvino/ncnn/onnx等)应用与原理
7、熟悉常见模型轻量化方法(量化AWQ/GPTQ、剪枝、蒸馏等)和大模型推理加速(off-loading、投机采样等)及相关工具链
8、有CUDA性能优化及其他硬件(如 CPU、NPU 等)的使用、相关的性能调优经验,如FastTransformer、TensorRT、triton等经验优先
工作地点
地址:深圳宝安区庭威产业园-2号楼1B2楼D区


职位发布者
HR
深圳市亿道控股有限公司

-
电子技术·半导体·集成电路
-
500-999人
-
公司性质未知
-
深圳市宝安区28区大宝路49-1号金富来大厦