5天前活跃

CDMLB

• UID:19713
综合评分 34
方向: 后端-Java 人工智能-计算机视觉与图像处理
昆明市
300元/8h
1年经验
求职意愿:接单·求职中(5天前更新)

个人简介

一名专注于AI模型工程化落地的研发工程师。拥有昆明理工大学硕士教育背景及云南省人工智能重点实验室项目经验,擅长将前沿视觉算法转化为稳定服务。熟练掌握 Python、Flask、PyTorch,具备从模型微调 (LoRA)、推理优化到 Web API 封装部署的全链路能力。

技能

核心技能:
其他技能: Java、Python、OpenCV、PyTorch、Transformers、C++、MATLAB
交流语言: 普通话( 母语水平 ) 英语( 借助工具可书面交流 )
行业经验: 人工智能

项目案例

基于LoRA微调的多模态大模型开放域视觉定位系统
立项原因: 问题:通用多模态大模型在特定领域(如工业场景、医疗影像)的细粒度视觉定位任务上精度不足,且直接调用云端API存在数据隐私和响应延迟问题。 解决方案:本项目探索使用参数高效微调技术,在有限的算力资源下,让多模态模型适应特定领域的开放域视觉定位需求。 行业场景: 智能安防监控:本地化部署模型,实时定位监控画面中的异常行为或特定目标。 工业自动化质检:在工厂产线上,快速定位产品缺陷部位,无需为每种新缺陷重新训练专用模型。 内容审核与分析:对图像内容进行细粒度的元素定位和分析,为后续处理提供结构化数据。 功能介绍: 开放域视觉定位:支持通过自然语言指令,在图像中定位任意指定的物体、人物或场景元素。 思维链增强推理:利用大模型的内在推理能力,通过多步思考提升复杂场景下的定位准确性。 参数高效微调:采用LoRA技术对Qwen2.5-VL-7B模型进行微调,仅训练少量参数即可显著提升在目标领域的效果。 完整训练流水线:实现了从数据准备、模型训练到性能评估的全流程。 结果可视化:将模型的定位输出以边界框形式在图像上直观展示。
人工智能

工作经历

云南省人工智能重点实验室
  
501-1000人
计算机视觉算法工程师
2024.09 - 2025.10
参与图像识别与检索方向的研发项目,负责深度学习模型的构建、训练与调优。专注于解决开放域环境下的视觉识别与定位问题,探索并应用思维链、LoRA微调等先进技术提升模型性能。利用PyTorch、Transformers等框架进行算法实现,并通过Flask对模型进行服务化封装,支撑后续应用集成。

教育经历

昆明理工大学
2024.09 - 2027.06
计算机应用技术
硕士
相似推荐
南昌市
后端-Java、爬虫/脚本-爬虫/脚本
技能:Java、Python
西安市
后端-Java
技能:Java、Spring Boot
北京市
后端-Java、运维-运维
技能:Java
乌鲁木齐市
后端-Java、前端-小程序
技能:JavaScript、Spring Boot、Vue
长沙市
后端-Java、前端-小程序
技能:Java
帮助文档   Copyright @ 2021-2024 程聚宝 | 浙ICP备2021014372号
人工客服