1. 立项背景和目标
颌骨囊肿作为口腔颌面外科常见疾病,其诊疗依赖 CBCT 三维影像,但传统手动标注方式工作量大、易受边界模糊等因素干扰,且基层医疗机构面临设备与专科医生匮乏的困境,导致诊疗效率低、水平参差不齐。同时,传统单模态分割模型存在泛化能力有限、漏诊率较高等问题。本项目旨在融合人工智能与医疗技术,开发基于多领域特征增强的颌骨囊肿 CBCT 分割系统,实现囊肿精准识别、量化分析与全流程诊疗支撑,减轻医生负担,提升诊疗精准度与效率,推动智能医疗技术在口腔领域的落地应用。
2. 软件功能、核心功能模块的介绍
软件核心围绕 “精准分割 + 临床适配” 构建两大核心模块:一是 2D 交互查看模块,支持切片导航、多视图对比、置信度统计与图像参数调节,可快速定位囊肿核心层、核验分割结果可靠性,适配医生观察习惯;二是 3D 可视化模块,提供基础囊肿模型、结合 CT 轮廓模型等多类型立体模型,自动计算囊肿体积等量化数据,支持旋转、缩放等交互操作,直接服务病情评估与术前规划。核心功能覆盖囊肿分割、量化分析、可视化展示、数据兼容等,实现从诊断到治疗的全流程支撑。
3. 业务流程、功能路径描述
业务流程以临床诊疗需求为核心:首先医生上传 CBCT 影像数据,系统自动调用 GCT-Net 双模态模型进行囊肿分割,融合图像特征与文本语义特征生成精准分割结果;随后进入 2D 交互查看环节,医生可通过切片导航、多视图对比核验分割准确性,借助置信度统计聚焦重点区域,通过参数调节优化观察效果;接着可切换至 3D 可视化模块,生成立体模型并获取量化数据,辅助制定个性化手术方案;最后分割结果与 3D 模型可导入现有医疗系统,用于病历存档、多科室会诊及术后评估,形成 “数据上传 - 智能分割 - 交互核验 - 诊疗应用 - 数据归档” 的完整功能路径。
整体架构采用 “双模态融合 + 全流程支撑” 设计思路,以 GCT-Net 模型为核心,构建 “数据输入 - 特征处理 - 分割输出 - 临床应用” 的技术链路。技术栈方面,核心算法层采用 PyTorch 框架搭建 GCT-Net 模型,集成图卷积模块(GCN)、CLIP 文本编码模块实现多模态特征融合,通过 ResConv、GCAN Module 等完成多尺度特征提取与处理,采用二元交叉熵损失与 Dice 损失组合解决类别不平衡问题;应用层基于 Web 技术开发 2D 交互与 3D 可视化界面,支持 ITK-SNAP、PACS 等医疗系统数据兼容,底层适配 CUDA 加速计算,确保在中端显卡上高效运行。
我主要负责 GCT-Net 模型的多模态特征融合模块开发与 2D 交互查看模块的功能实现。在特征融合模块中,将文本特征与图像特征高效融合。在 2D 交互查看模块中,完成切片导航、置信度统计等核心功能开发,实现 30 秒内定位囊肿核心层,将医生手动核验时间从 30 分钟缩短至 5 分钟内,模块兼容主流 CBCT 影像格式,适配率达 98% 以上,满足不同医院的设备需求。