目标:
本项目是一款致力于提升学生学习效率与精准查漏补缺的在线智能题库平台。打破传统考试“只给对错”的局限,独创“过程性诊断”模式,结合高颗粒度的商业化变现闭环,为师生提供“测与评”的深度一体化解决方案。
核心业务:
智能教研与图谱组卷(B端):依托“学段-版本-册-章-节-考点”多维树状知识图谱进行精细化捞题组卷。支持试卷结构(分值/题型/难度)模板化一键复用,兼容大-小-孙题的多级嵌套,并支持系统自动效验分值。
双轨诊断考场(C端):业内首创“先测后评”(线下整卷作答,线上测算总分)与“边测边评”(线上单题限时闪卡闯关)双轨诊断机制。配合底层秒表/倒计时防作弊系统,通过“解题问答”精准定位学生思维盲区。
复杂理科公式渲染引擎:前端搭载深度定制的富文本与 MathJax 混合解析引擎,完美处理由于数据抓取残留导致的乱码,无损渲染带上下标、分数、根号等复杂嵌套的理科公式。
全链路商业化变现闭环:自研全局统一收银台组件,支持“微信支付 + 账户余额”双轨支付及防呆拦截。实现了单题深度解析、试题原生打包导出(自动生成 Word/Zip 存入本地沙盒并支持微信转发)、专属深度诊断报告解锁等多场景的精准变现。
项目采用“前后端分离 + 异构服务处理”的微服务架构思想。以 Java (Spring Boot) 作为核心业务基座,承载高并发的在线测评、分布式鉴权、订单交易与组卷逻辑;针对极其复杂的非结构化教研文档,独立拆分出 Python 解析微服务,专职处理海量 Word 试题的清洗与结构化。
设计思路上秉持“高内聚、低耦合”,将公共业务抽离为独立模块,彻底打通了“教研生产 ➔ 试题解析 ➔ C端消费 ➔ 数据反哺 ➔ 商业闭环”的全链路。
核心技术实现:
Python 文档逆向解析引擎:针对传统题库录入效率低下的痛点,利用 Python 深度解析 Word (docx) 底层 XML 结构。结合复杂的正则规则与 AST 树提取,精准剥离“大题-小题-孙题-题设条件”,并对嵌套的 OMath/MathML 公式进行无损提取与清洗,最终将其转换为标准化的 LaTeX 数据存入 MySQL,实现了题库的高效自动化建设。
多终端混合渲染技术:针对前端小程序在复杂理科公式渲染上的性能瓶颈,重构了底层富文本拦截器。深度清洗后台富文本残留标签,利用自建的特殊字符映射字典(Unicode转LaTeX)兜底,结合 MathJax 实现行内公式与块级公式的基线完美对齐。
复杂状态机与交易防呆设计:独立设计并实现“微信支付 + 钱包余额”的双轨支付状态机。通过在前端封装统一的全局收银台 Popup 组件,配合拦截器实现了点击卡点、实时余额核算、不足自动置灰等防呆逻辑,确保高频变现场景下交易系统的健壮性。
提效显著:借助 Python 的自动化 Word 解析脚本,将教研人员单份试卷的录题拆题时间从平均 2小时缩短至 5分钟以内,录题效率提升 90% 以上。
数据沉淀:系统平稳运行,已成功沉淀并结构化超 X 万 道高质量K12理科试题,公式解析无损还原率高达 99.5% 预估(注:X请根据实际情况替换)。
商业转化:全栈独立打通整套商业化收银体系,成功跑通单题解析、报告解锁、试卷导出(动态生成Zip/Word流写入原生沙盒)等 4 个核心变现场景,实现了业务从 0 到 1 的营收闭环。