AI Forge 平台面向“数据集 → 训练 → 模型版本 → 推理”的一体化流程管理。提供数据集目录/标注导入与拆分(train/val/test)、训练任务创建与异步执行、训练产物与模型版本元数据管理、任务状态追踪与可视化管理台(Vue3)。后端提供统一 API 与开放推理接口,训练/推理计算由独立 Python 服务执行,大文件走共享存储,小数据走 HTTP 传参,便于扩展为对象存储与更多训练模板。
整体采用前后端分离:Vue3+Vite+TS 实现管理台;Java(Spring Boot)承载业务、任务状态与元数据(MySQL),并生成训练 manifest 写入共享存储;Java 通过 HTTP 调用 Python(FastAPI/Uvicorn) POST /train 触发训练,Python 读取 manifest 与样本执行训练并将权重/产物写回存储,后端再回写任务与模型版本状态。实现难点在于跨进程共享存储路径一致性、任务异步状态流转与失败重试/回滚处理。