业务亮点和立项原因:随着人口老龄化,我国眼科疾病患病人数攀升,医疗资源分布不均问题突出。高水平医院眼科医生工作负担重,漏判、误诊等问题频发,且专业医生培养周期长、数量有限。传统诊断模式依赖肉眼观察眼底图像,耗时耗力且易受主观因素影响。基于此,本项目借助深度学习技术,开发眼科疾病智能诊断系统,以实现对多种常见眼科疾病及正常眼底的准确识别,提升诊断效率和准确性,减轻医生负担,降低误诊漏诊率,缓解医疗资源紧张问题。
立项过程和沟通过程:项目团队与眼科专家、医生、医疗机构管理人员及患者深入交流,收集各方需求。了解医生诊断痛点、医疗机构对系统功能的期望以及患者对诊断流程的需求。同时调研市场现有系统优缺点及行业趋势,明确项目方向。与潜在合作的医疗机构沟通,介绍项目理念和技术优势,探讨合作可能性,根据其反馈优化项目方案,最终确立项目。
具体功能模块及使用者功能
图像处理功能:对眼底图像进行轮廓裁剪、CLAHE 处理和双目拼接,提取视盘区域,消除光照不均干扰,增强血管纹理细节,实现左右眼图像空间对齐,为诊断提供清晰统一的图像。
疾病检测功能:支持单张或批量图像上传,通过多标签分类能力判别 7 类眼科疾病与正常类别,允许单张图像存在多个病理标签,精准诊断复杂病例。
报告生成功能:快速生成详细诊断报告,支持打印和 PDF 格式导出,方便医生查看、存档及与患者沟通。
历史记录查询功能:便捷查询历史检测记录,包括时间、诊断结果和 AI 建议,便于病情复核与长期存档。
诊断建议功能:集成医疗大模型,依据诊断结果生成个性化治疗建议和健康管理方案,提升患者依从性和诊疗效率。
疾病科普功能:提供常见眼病的详实介绍,包括示意图和文字说明,点击 “了解更多” 可跳转至百度百科获取更多资料。
主要功能路径:用户上传眼底图像,系统对图像进行预处理(轮廓裁剪、CLAHE 处理、双目拼接),然后通过深度学习模型进行疾病检测,生成诊断结果,基于诊断结果生成诊断建议和报告,同时将检测记录存储以便用户查询。用户还可通过疾病科普功能了解相关眼病知识。
参与人数:团队共 5 人,包括算法工程师、前端开发工程师、图像处理工程师、产品设计师和数据分析师。
开发周期:从 2025 年 1 月 1 日开始,到 2025 年 4 月 14 日结束,约 3 个半月。
我的任务:负责 AI 诊断模型的设计与调优,选用 EfficientNet-B4 和 Vision Transformer 模型,通过加权融合策略提升模型性能,处理类别不平衡问题,调整超参数,优化模型准确率、精确率和召回率,确保模型在测试集上达到预期性能指标。
技术栈、架构、亮点及难点
技术栈
后端:Flask 框架、PyTorch 深度学习框架、MySQL 数据库、Redis 缓存。
前端:HTML/CSS/JavaScript、Vue.js。
图像处理:OpenCV、NumPy。
模型训练监控:TensorBoard。
架构:采用前后端分离架构,后端负责数据处理、模型推理和业务逻辑,前端负责用户交互和数据展示,通过 RESTful API 接口实现前后端数据交互。
亮点
模型采用 EfficientNet-B4 和 Vision Transformer 加权融合策略,结合两者在细节提取和全局关联建模的优势,提升分类精度和鲁棒性。
针对类别不平衡问题,引入类别权重和 Focal Loss 损失函数,提高模型对少数类疾病的识别能力。
系统功能丰富,集成图像处理、疾病检测、报告生成等多种功能,满足医疗机构、医生和患者的多样化需求。
难点
眼底图像预处理:需要解决亮度不均、噪声去除、双目图像对齐等问题,确保输入数据质量。
模型训练:处理类别不平衡问题,优化超参数,提高模型泛化能力,确保在测试集上达到高精度。
系统集成:将前端、后端和模型训练部分集成,确保系统稳定运行,响应速度快。