程序聚合 软件案例 兴趣班搜索系统

兴趣班搜索系统

2026-03-11 13:02:15
行业:在线教育
载体:网站
技术:Python、FastAPI

业务和功能介绍

业务和功能介绍
1、立项背景和目标:
针对北美课后教育市场商家信息高度分散(独立建站)、传统搜索引擎难以实现垂直领域精细化搜索,且聚合平台人工维护数据成本高昂的痛点,Richoo项目应运而生。本系统旨在打造一个垂直领域的SaaS+平台,核心目标是通过引入AI大模型(LLM)技术,实现海量商家网站课程信息的自动化采集、同步与智能解析,从而为北美家长和儿童提供高效的课程发现、个性化推荐以及统一的日程管理服务。
2、核心功能模块:
系统主要由五大核心业务模块构成:
课程查询系统:基于Elasticsearch提供BM25文本匹配与向量语义搜索相结合的混合召回能力。
课程推荐系统:结合用户画像与实时点击行为数据,为用户提供个性化的课程推荐。
课程日历系统:提供便捷的可视化工具,帮助家长统一管理小孩的课后班日程。
课程信息爬虫系统:负责在后台周期性并发抓取数万个商家网站的更新内容。
智能客服系统:利用Langraph技术,将家长复杂的自然语言需求精准转化为搜索过滤条件。
3、业务流程与路径:
系统的整体业务流呈现高度自动化的数据闭环:首先,爬虫系统从分散的商家网站抓取原始网页数据;随后,数据进入异步消息队列,由LLM解析服务接管,利用大模型将非结构化网页文本提取为结构化的课程JSON数据并建立索引;在用户端,家长通过前端发起搜索、对话(智能客服)或浏览推荐,网关将请求路由至对应的检索或推荐微服务,系统结合热度数据进行快速响应,最终用户可将心仪的课程一键加入个人日历中。

项目实现

项目实现
1、整体架构与设计思路及技术栈:
为了应对AI驱动型项目高异构性、高并发及快速迭代的要求,系统整体采用了微服务架构风格(MSA)。设计思路是基于业务能力将系统解耦为六大自治服务(爬虫、解析、索引、搜索、推荐、BFF网关),实现计算密集型AI服务与高并发I/O服务的资源隔离与独立伸缩。
技术栈方面:爬虫模块采用Playwright并发抓取结合MongoDB存储状态;解析模块调用Gemini API大模型;不同服务间的异步通信与解耦重度依赖Kafka消息队列;搜索与API网关采用高性能异步Python框架FastAPI,对接Elasticsearch和Redis进行检索与缓存,结合Clickhouse处理热度数据;智能客服则独立采用Langraph/LangChain技术栈。
2、“我”的负责模块和量化结果:
我在本项目中担任系统架构师及核心算法工程师。主要负责:①主导微服务架构的选型与落地;②设计核心数据流,特别是爬虫与LLM解析服务之间的异步通信机制;③亲手实现搜索召回(BM25+语义)与推荐算法。
量化结果:在我的主导下,系统研发效率极大提升,从启动到核心功能上线仅耗时3个月;系统成功聚合了北美新泽西州和纽约州3万家培训机构、15万次课后班的实时课程信息;保障了系统于2025年6月顺利上线,并能够支撑高峰期LLM解析资源10倍以上的弹性扩容,持续稳定运营。
3、“我”遇到的难点、坑,和解决方案:
难点一:数据采集与AI解析的速度鸿沟。 爬虫产出HTML速度极快,但LLM解析资源消耗大且受外部API限速,传统同步调用会导致爬虫阻塞甚至系统崩溃。
解决方案: 我引入了Kafka作为异步消息队列缓冲层。爬虫服务作为生产者仅负责将原始HTML推入raw_html主题即刻返回;解析服务作为消费者根据自身算力按需拉取处理。这完美实现了流量削峰,即便外部API延迟,系统依然高可用。
难点二:微服务拆分带来的运维与监控黑洞。 随着服务增多,系统初期面临链路追踪困难、故障定位周期长的“坑”。
解决方案: 我牵头引入了统一的日志采集系统(ELK Stack),实现了跨服务的链路追踪。配合标准化的微服务治理和自动化CI/CD部署工具,有效化解了微服务带来的额外运维复杂度,让新算法更新能在数分钟内安全上线。

示例图片视频


八月
15天前活跃
方向: 后端-Java、前端-小程序、
交付率:100.00%
相似推荐
万能工具-小程序
视频处理,图片处理,链接分析,电商全平台文案生成和优化,视频去水印加水印,图片去水印加水印,各类功能全加进去了,还有加功能空间,汇率计算,收益亏损计算,订单查询,客户数据,记帐,统计数据,查看库存,
文件资产智能扫描与统计工具(AI辅助全流程开发)-AI-driven File Scanner CLI Tool
立项背景: 中小企业及自由职业者在日常运营中常需快速了解本地文件资产分布情况(如设计稿、合同文档、代码等)。传统手动统计耗时易错,且无法及时响应管理层的即时数据需求。本项目旨在开发一款无需安装、零外部依赖的命令行工具,解决这一痛点。 核心功能模块: 1. 路径输入解析:接收任意文件夹路径,支持绝对路径和相对路径 2. 递归文件扫描:深度遍历所有子目录,不遗漏任何文件 3. 按扩展名分类统计:自动识别文件后缀并分组计数,无扩展名文件归类为"(无扩展名)" 4. 报告生成:输出结构化TXT报告,包含各类型数量、总文件数、统计时间,按数量降序排列 5. 参数自定义:支持指定输出文件名、排除特定目录(如node_modules、.git等) 业务流程: 用户在终端执行命令并传入文件夹路径 → 程序解析参数并验证路径有效性 → 递归遍历目录树,按扩展名分组统计 → 按数量降序排列结果 → 生成格式化报告写入指定路径 → 终端输出统计摘要。 该项目完整演示了从需求分析到工具交付的AI辅助全流程开发模式。
企业级AI知识库系统-基于大模型和rag、知识图谱、agentwiki
一、平台核心定位 KB Admin 是一套面向企业 / 开发者的一站式 AI 智能体(Agent)管理平台,主打「知识库问答 + 大模型对话 + 可编排技能」的一体化能力,支持零代码快速搭建行业专属 AI 助手,解决企业知识沉淀、智能客服、业务自动化、场景化问答等核心需求,是打造私有化 / 行业化大模型应用的低代码底座。 二、核心业务场景 企业智能客服 / 知识问答助手:将企业文档、产品手册、行业规范等上传构建专属知识库,实现用户 7×24 小时智能问答,自动解答业务咨询、售后问题,大幅降低人工客服成本。 行业专属 AI 顾问:针对政策解读、技术咨询(如 NFC 技术)、专业领域场景,搭建具备行业知识沉淀的专属 AI 助手,提供精准、合规的专业解答。 企业内部知识助手:整合内部培训资料、流程文档、制度文件,为员工提供智能问答、流程指引、知识检索服务,提升内部协作效率。 多模态智能体应用开发:支持文本、语音、图像多模态交互,搭配自定义工具技能,实现业务自动化(如数据查询、流程审批、外部接口调用)的智能体搭建。 三、核心功能模块详解 1. 仪表盘:全局数据概览 实时统计核心业务数据:机器人数量、总对话数、今日对话量、Token 消耗、7 天活跃用户、好评 / 差评数据,直观掌握 AI 助手运行状态与用户反馈。 提供「快速开始」引导流程,三步完成从模型配置到机器人上线的全流程操作,降低新手使用门槛。 2. 模型管理:多模型统一接入 支持全类型 AI 模型接入:包括 LLM 文本模型(如 DeepSeek、智谱系列)、Embedding 向量模型、VLM 视觉模型、ASR 语音识别模型、Reranker 精排模型,覆盖文本、语音、图像全场景需求。 提供「自动发现模型」与「手动添加」两种接入方式,支持主流大模型 API 一键配置,兼容智谱、DeepSeek 等国内外主流模型服务商,满足不同场景的性能与成本需求。 3. 工具与技能:可编排的 Agent 能力扩展 支持「工具服务 + Agent 技能 + MCP 服务器」三层能力扩展,遵循 agentskills.io 开放标准,可快速接入自定义工具、外部接口,为 AI 助手赋予业务自动化能力。 提供示例库、一键导入、新建技能功能,开发者可零代码 / 低代码编排工具逻辑,实现如数据查询、外部 API 调用、业务流程自动化等复杂能力,让 AI 从 “问答” 升级为 “可执行任务的智能体”。 4. 机器人管理:全生命周期 AI 助手运营 可视化管理多 AI 机器人:支持创建、配置、测试、发布全流程管理,可同时搭建多个不同场景的 AI 助手(如政策解读助手、技术咨询助手)。 提供机器人配置、测试对话、小程序入口生成能力,一键生成可嵌入小程序 / 网页的对话入口,快速落地业务场景;同时支持对话数据统计与知识库绑定,实现机器人与专
校园智能体——基于大模型的个性化校园服务AI助手
“校园智能体”是一款面向中小学及高校场景的智能化校园服务系统,以自然语言交互为核心,深度融合校园数据库与大语言模型能力,为师生提供安全、高效、个性化的信息查询与事务协助服务。系统以“小园”为拟人化助手形象,支持通过对话方式实时查询学生信息、课程安排、出勤记录、校园活动、教师资料及班级管理等六大类核心业务,真正实现“一问即答、一事一解”的智慧校园体验。 核心功能与技术亮点 1.多模态知识库集成 对接学校教务、学工、后勤等系统数据,构建结构化校园知识图谱,确保信息权威性与时效性。 2.自然语言理解与生成(NLU/NLG) 支持模糊提问、上下文追问与意图识别(如“帮我报名毕业典礼”→自动关联ID、年级、班级校验),降低用户使用门槛。 3.角色化权限控制 区分学生、教师、管理员角色,动态过滤敏感信息(如仅班主任可查全班考勤),保障数据安全合规。 4.主动式服务引导 基于用户身份与历史行为推荐高频服务(如高三学生优先推送“毕业典礼”“志愿填报指南”),提升服务精准度。 5.轻量化部署架构 采用微服务+本地化推理模型设计,支持私有云/混合云部署,满足教育行业数据不出校要求。
某烟草物品遗留项目
参与某烟草企业工厂智能监控项目,负责前后端开发及算法实现。使用 OpenCV 对工厂图像数据进行处理与增强,引入 Retinex 算法有效解决光线阴影干扰问题;基于 YOLOv8 完成模型训练,最终检测准确率达 95%;使用 Flask 框架搭建网页端,实现高精度、 多路、区域化的实时检测,支持用户自定义时间、区域、摄像头等参数。项目部署于边缘计算设备,涉及 MySQL、Linux、GitLab、HTTP 协议等技术栈,独立承担从算法到产品的完整开发流程。
帮助文档   Copyright @ 2021-2024 程聚宝 | 浙ICP备2021014372号
人工客服