java开发-刘工

• UID:24668

综合评分 33

方向：后端-Java

南京市

1000元/8h

5-10年经验

求职意愿：接单·不求职(30天前更新)

个人简介

现就职于江苏润和科技有限公司，一名高级开发java工程师。

技能

核心技能：

其他技能： Java、Spring Boot、MySQL Workbench

交流语言：英语（无需工具可书面交流）、普通话（母语水平）

行业经验：人工智能、工业互联网

项目案例

华为昇腾NPU上部署大模型推理，实现pd分离

vLLM-Ascend ：昇腾 NPU 上的大模型推理部署前言：近两年大语言模型的推理需求爆发式增长，推理引擎成为了AI工程落地的核心基础设施。举个例子，爆发式增长的推理需求相当于一群车过马路，传统的推理引擎就是“单车道马路”，容易拥堵。而vLLM是业界领先的开源推理框架，相当于“十车道高速公路”，让AI的响应更快更迅速、成本也更低。为了支持昇腾AI芯片生态，vLLM社区在去年年底推出了vLLM-Ascend硬件插件‌。就像是为昇腾芯片量身定制的“适配器”，巴适得很。截至 2025 年 12 月，vLLM-Ascend 已支持 Llama、Qwen、ChatGLM、Mixtral 等主流架构，并具备 Expert Parallelism（EP）、多模态、Embedding 模型等高级能力

人工智能