APP下载
机会在手,求职信息实时掌握
    Alternate Text
    APP下载
    Alternate Text
    微信公众号
    Alternate Text
    小程序
当前位置:首页> 列表 >职位详情
大模型推理加速算法专家
70000-90000元 应届毕业生 硕士
  • 全勤奖
  • 节日福利
  • 不加班
  • 周末双休
聚好看科技股份有限公司 2025-07-14 11:15:36 473人关注
职位描述
该职位还未进行加V认证,请仔细了解后再进行投递!
岗位职责:1.深入前沿推理加速技术研究,突破大语言模型解码速度瓶颈和多模态融合计算挑战; 2.设计创新的注意力机制优化算法,加速大语言模型长文本理解和多轮对话能力; 3.研发高效视觉-语言模型推理架构,解决图像特征提取与文本生成的计算协同问题; 4.开发面向不同语言任务和多模态场景的自适应推理技术,实现动态计算资源分配; 5.主导大规模模型服务体系设计,解决百亿/千亿参数模型的低成本部署挑战。 任职要求:1.人工智能、计算机或相关领域博士学位(优秀硕士需3年以上强相关经验),在大语言模型、多模态理解及生成模型优化领域有深厚研究积累; 2.精通Transformer计算优化,深入理解Flash Attention、Speculative Decoding、MQA/GQA等前沿技术; 3.掌握模型压缩技术栈,包括GPTQ/AWQ量化、SparseGPT稀疏化、知识蒸馏等方法; 4.熟悉vLLM、DeepSpeed-Inference、TGI等大模型推理框架,能进行系统级优化; 5.具备VLM(如CLIP、LLaVA、MiniGPT-4)推理加速经验,了解多GPU推理和Continuous Batching技术; 6.在相关领域会议发表高水平论文,或主导过业界重要语言/多模态模型优化项目。
联系方式
注:联系我时,请说是在宝安人才网上看到的。
工作地点
地址:杭州滨江区杭州-滨江区火炬创新中心6栋杭州滨江区杭州高新区火炬创新中心6楼
求职提示:用人单位发布虚假招聘信息,或以任何名义向求职者收取财物(如体检费、置装费、押金、服装费、培训费、身份证、毕业证等),均涉嫌违法,请求职者务必提高警惕。
top
投递简历
马上投递
更多岗位等你来挑选   加入宝安人才网,发现更好的自己
投递简历
马上投递
提示
该职位仅支持官方网站投递
关闭 去投递

若您已有简历,可直接登录登录

  • 省份

    注:0表示面议
    获取验证码
    保存并投递
    会员中心 提示:订单支付,立即生效
    天数: 0
    共计: 0
    支付方式:
    微信支付
    支付宝支付
    确认 取消