一、立项背景和目标
在学术审查领域,常规检测方式难以满足日益增长的文献资料处理需求,教育领域对高效文本审查工具的需求持续扩大。本项目旨在构建基于 SpringBoot&Vue 框架的文脉智审平台,打造适用于教学实践的规范化学术文档综合管理系统。通过标准化流程简化课题申报、文档归档等工作,提升信息处理效率与质量,借助多层次内容对比分析鉴别非常规引用行为,为学术成果独创性提供技术保障,促进学术环境建设。
二、软件功能、核心功能模块的介绍
(一)核心功能模块
课题管理模块:涵盖课题申请、课题审核、课题查重、查重记录查询功能,支持课题信息的新增、修改、删除、导出导入,实现课题从申请到审核再到查重的全流程管理。
论文管理模块:包含文章数据管理、论文查重、论文提交、论文审核功能,支持论文文档上传、查重检测、审核评估等操作,保障论文质量与原创性。
展示管理模块:囊括公告发布与管理、文章发布与管理、评论管理、敏感词监控设置功能,实现信息展示、用户互动及内容监管。
文档合并模块:提供 Excel 相似字段自动合并工具,支持文件上传、字段匹配与合并操作,简化数据整理流程。
(二)扩展服务亮点
论文题目智能查询:通过算法为用户提供相关参考信息,助力方向定位。
多维度查重服务:支持课题查重、论文查重,批量查重与手动查重结合,精准检测原创性。
全局搜索功能:可搜索平台内论文、公告等所有内容,方便用户快速获取信息。
互动交流平台:用户可浏览优秀文章、查看公告、发布评论,增强信息透明度与社区活跃度。
三、业务流程、功能路径描述
(一)课题管理流程
课题申请:用户登录后进入课题申请页面,填写课题名称、类别等信息,选择保存或提交,提交后进入审核流程。
课题审核:审核人登录后台,查询待审核课题,查看详情并填写审核意见,选择通过或驳回。
课题查重:用户可通过语义查询、批量查重等方式检测课题相似度,系统生成查重报告,支持记录查询、导出与删除。
(二)论文管理流程
论文提交:学生登录后选择对应课题,上传论文文档,系统自动填充相关信息,可保存或提交审核。
论文审核:审核人查看论文详情与查重结果,填写审核意见并完成审核操作。
论文查重:用户上传文档发起查重,系统后台处理后生成包含总相似度、重复段落、参考文献的报告,支持详情查看、记录管理。
(三)展示管理流程
公告 / 文章管理:管理员登录后台,新增、修改、删除公告或文章,设置展示时间、分类等属性,前端用户可浏览查看。
评论与敏感词管理:用户发布评论后,系统进行敏感词检测,管理员可审核、修改、删除评论,同时可维护敏感词库。
(一)负责模块
课题查重模块:包括课题语义查询、批量查重、查重记录管理功能的设计与开发。
论文查重核心算法实现:基于知网义原关系,设计并开发文本相似度计算算法。
全局搜索功能:实现平台内论文、公告、文章等内容的跨模块搜索。
(二)实现结果
课题查重模块:支持单条语义查询响应时间≤3 秒,批量查重支持单次 500 条数据导入,查重准确率达 85% 以上,累计处理查重请求 1000 + 次。
论文查重算法:实现义原相似度、概念相似度及组合概念相似度计算,重复段落标记准确率≥90%,支持 doc、docx、pdf 等多种格式文档上传查重。
全局搜索功能:搜索响应时间≤2 秒,搜索结果准确率达 95%,覆盖平台 95% 以上的有效内容。
(一)难点一:查重算法精准度不足
问题:初期简单文本匹配导致语义相似但文字不同的内容漏检,同时存在重复率误判情况。
解决方案:引入知网义原关系数据库,拆解文本为义原单元,计算义原相似度、概念相似度与组合概念相似度,通过阈值过滤与加权计算优化结果。针对未登录词,采用拆分组合策略扩展计算范围,提升查重精准度。
(二)难点二:批量查重数据处理效率低
问题:批量导入大量课题或论文数据时,系统响应缓慢,甚至出现卡顿,数据匹配耗时较长。
解决方案:采用异步处理机制,批量查重请求提交后后台异步执行,通过 Redis 缓存中间结果,减轻数据库压力。优化数据导入模板,明确字段格式要求,同时引入数据分片处理技术,将大量数据拆分后并行处理,提升处理效率,使单次 500 条数据批量查重耗时控制在 10 分钟内。