程序聚合 软件案例 兴趣班搜索系统

兴趣班搜索系统

2026-03-11 13:02:15
行业:在线教育
载体:网站
技术:Python、FastAPI

业务和功能介绍

业务和功能介绍
1、立项背景和目标:
针对北美课后教育市场商家信息高度分散(独立建站)、传统搜索引擎难以实现垂直领域精细化搜索,且聚合平台人工维护数据成本高昂的痛点,Richoo项目应运而生。本系统旨在打造一个垂直领域的SaaS+平台,核心目标是通过引入AI大模型(LLM)技术,实现海量商家网站课程信息的自动化采集、同步与智能解析,从而为北美家长和儿童提供高效的课程发现、个性化推荐以及统一的日程管理服务。
2、核心功能模块:
系统主要由五大核心业务模块构成:
课程查询系统:基于Elasticsearch提供BM25文本匹配与向量语义搜索相结合的混合召回能力。
课程推荐系统:结合用户画像与实时点击行为数据,为用户提供个性化的课程推荐。
课程日历系统:提供便捷的可视化工具,帮助家长统一管理小孩的课后班日程。
课程信息爬虫系统:负责在后台周期性并发抓取数万个商家网站的更新内容。
智能客服系统:利用Langraph技术,将家长复杂的自然语言需求精准转化为搜索过滤条件。
3、业务流程与路径:
系统的整体业务流呈现高度自动化的数据闭环:首先,爬虫系统从分散的商家网站抓取原始网页数据;随后,数据进入异步消息队列,由LLM解析服务接管,利用大模型将非结构化网页文本提取为结构化的课程JSON数据并建立索引;在用户端,家长通过前端发起搜索、对话(智能客服)或浏览推荐,网关将请求路由至对应的检索或推荐微服务,系统结合热度数据进行快速响应,最终用户可将心仪的课程一键加入个人日历中。

项目实现

项目实现
1、整体架构与设计思路及技术栈:
为了应对AI驱动型项目高异构性、高并发及快速迭代的要求,系统整体采用了微服务架构风格(MSA)。设计思路是基于业务能力将系统解耦为六大自治服务(爬虫、解析、索引、搜索、推荐、BFF网关),实现计算密集型AI服务与高并发I/O服务的资源隔离与独立伸缩。
技术栈方面:爬虫模块采用Playwright并发抓取结合MongoDB存储状态;解析模块调用Gemini API大模型;不同服务间的异步通信与解耦重度依赖Kafka消息队列;搜索与API网关采用高性能异步Python框架FastAPI,对接Elasticsearch和Redis进行检索与缓存,结合Clickhouse处理热度数据;智能客服则独立采用Langraph/LangChain技术栈。
2、“我”的负责模块和量化结果:
我在本项目中担任系统架构师及核心算法工程师。主要负责:①主导微服务架构的选型与落地;②设计核心数据流,特别是爬虫与LLM解析服务之间的异步通信机制;③亲手实现搜索召回(BM25+语义)与推荐算法。
量化结果:在我的主导下,系统研发效率极大提升,从启动到核心功能上线仅耗时3个月;系统成功聚合了北美新泽西州和纽约州3万家培训机构、15万次课后班的实时课程信息;保障了系统于2025年6月顺利上线,并能够支撑高峰期LLM解析资源10倍以上的弹性扩容,持续稳定运营。
3、“我”遇到的难点、坑,和解决方案:
难点一:数据采集与AI解析的速度鸿沟。 爬虫产出HTML速度极快,但LLM解析资源消耗大且受外部API限速,传统同步调用会导致爬虫阻塞甚至系统崩溃。
解决方案: 我引入了Kafka作为异步消息队列缓冲层。爬虫服务作为生产者仅负责将原始HTML推入raw_html主题即刻返回;解析服务作为消费者根据自身算力按需拉取处理。这完美实现了流量削峰,即便外部API延迟,系统依然高可用。
难点二:微服务拆分带来的运维与监控黑洞。 随着服务增多,系统初期面临链路追踪困难、故障定位周期长的“坑”。
解决方案: 我牵头引入了统一的日志采集系统(ELK Stack),实现了跨服务的链路追踪。配合标准化的微服务治理和自动化CI/CD部署工具,有效化解了微服务带来的额外运维复杂度,让新算法更新能在数分钟内安全上线。

示例图片视频


八月
24小时内活跃
方向: 后端-Java、前端-小程序、
交付率:100.00%
相似推荐
ai作业批改小程序-学伴小智
1. 立项背景和目标 针对晚托机构老师在管理学生作业时面临的错题记录繁琐、纸质作业难以数据化、缺乏针对性复习题目等痛点,本项目研发了“学伴小智”小程序。目标是打造一款轻量级的智能教学辅助工具,通过AI技术将传统的纸质错题快速转化为结构化数据,为老师提供精准的学情分析,并实现个性化练习题的自动生成,从而提升辅导效率,实现因材施教。 2. 软件功能、核心功能模块介绍 智能聊天式上传模块(核心创新):打破传统表单录入方式,采用对话式交互。老师只需在聊天界面上传作业照片并输入学生姓名,系统即可自动识别并归档。 AI自动识别与分析:集成 Google Gemini AI 能力,自动完成 OCR 文字识别、题型分类(计算、应用、概念题等)及知识点定位,并生成详细解析。 多维度学情分析:提供错题类型分布饼图、知识点薄弱项 Top10 柱状图及学生错题趋势折线图,帮助老师快速锁定班级或个人的学习盲区。 智能举一反三(核心闭环):基于选定的错题,AI 异步生成难度相当、知识点一致的变式练习题,支持一键导出 Word 试卷,完成“练习-错题-再练习”的闭环。 3. 业务流程、功能路径描述 用户进入小程序后,通过底部中央的“相机”按钮进入聊天上传页,上传作业图片后,AI 实时返回识别结果并自动存入数据库。随后,老师可在“查询”模块通过年级、班级、时间等维度筛选作业记录或单道错题。在“练习”模块,老师可以勾选特定的错题任务,提交“举一反三”生成请求。系统在后台异步完成试卷编排后,通过 WebSocket 或轮询通知老师预览并导出 Word 版练习卷。
车载智能终端
车载智能终端是出行大数据云平台的数据采集前端,主要面向城市公共交通,支撑运营监控、调度、客流分析等业务。 用于实现车载智能视频分析,通过AI算法模型在端侧对实时视频进行分析处理,用于采集客流量、司机疲劳驾驶等等, 从而实现给业务侧提供精准数据支撑。主要用于公交车、大巴车等场景,也可以扩展应用到各类视频分析的其他场景。
出行大数据平台
面向城市公共交通行业,主要服务对象包括: 交通运输主管部门:掌握全市公交、地铁等运营整体情况 公交/地铁运营企业:支撑日常运营与调度决策 城市规划部门:为线网规划、设施建设提供数据支撑 本方案通过配套的智能终端采集客流量等出行大数据,构建出行大数据分析平台,利用大数据AI模型分析车辆、站点、线路数据,同时支持对线路进行智能运能匹配分析,数据赋能公交相关业务,用于制定更加合理的排班计划,提高公交业务的运行效率。
电梯智能摄像头
该产品面向政府监管、物业、维保、保险、业主等多元主体,形成覆盖电梯全生命周期的应用生态。 该产品集成加速度传感器、气压传感器、陀螺仪、AI 图像与声音识别等,对轿厢、井道等全链路运行状态进行采集,并传送至电梯全生命周期云平台,实现大数据边缘计算。对紧急事件进行快速处理,包括困人、异常运行、故障等场景的实时报警与推送。
数字电梯AI赋能平台
以 AI 为手段,面向电梯安全、运维、救援等场景提供监测、预警和决策支持。 平台面向政府监管、物业、维保、应急救援等环节,支撑电梯全生命周期管理。 1. 电梯安全监控 风险预警:按电梯运行与维保数据划分风险等级(如 I / III / IV 级),支撑分级管控 报警管理:统计困人、设备故障、电动车违规、维保超时等,支持报警类型 TOP5 排行 重点治理:突出困人报警、设备故障、电动车相关风险,便于制定治理措施 2. 运营与维保管理 检验维保管理:覆盖年检、金检、保养、维修等,保障按时维保与检验 维保超时预警:对超期未维保、未检验的电梯进行提醒 运营统计:按月展示运营趋势,支撑资源配置和维保计划 3. 应急救援与处置 实时救援:SOS 事件集中展示,支持快速响应与调度 处置流程:按「去处理 / 待处理 / 已处理」跟踪事件状态 绩效统计:展示平均响应时间、平均救援时间、累计救援次数等指标 4. 智慧社区 / 楼宇 电动车管理:电动车禁止搬运、禁停提醒、限域告警,降低电动车入梯等消防风险 行为识别:通过 AI 识别异常行为,辅助安全管理 5. 数据决策支撑 为监管部门、物业、维保单位提供报警、故障、困人、救援等汇总数据 支撑政策制定、资源调配和运营优化
帮助文档   Copyright @ 2021-2024 程聚宝 | 浙ICP备2021014372号
人工客服