程序聚合 软件案例 基于用户画像的商品搜索引擎

基于用户画像的商品搜索引擎

2026-06-20 16:19:31
行业:电商
载体:网站
技术:Python、FastAPI

业务和功能介绍

一、立项背景与目标

传统电商搜索有三个痛点:意图理解弱,无法理解"适合跑步用的降噪耳机"中"跑步用"指向运动耳机品类;缺乏个性化,新老用户看到相同结果;搜索与对话割裂,无法在同一界面完成购物闭环。

项目目标:中文查询映射三级品类树(8个一级34个二级约120个叶子),准确率超90%;基于三层画像做个性化重排;多轮AI对话集成情感识别;CDC加Flink实时更新画像延迟小于1分钟;从LLM输出自动提取规则减少依赖;全链路异步有超时降级保护。技术栈:FastAPI、MySQL、ES、Redis、DeepSeek、BGE、Kafka+Flink、Vue3+TypeScript。

二、软件功能与核心模块

意图识别引擎是系统核心,六策略级联匹配。ChatIntent用正则加轻量LLM过滤闲聊;LLMIntent用DeepSeek做层次剪枝从一级品类逐层下钻到叶子;另配备AC自动机、模糊匹配、规则字典、语义匹配四种后备。置信度超0.8自动提取品牌同义词属性规则入库,同一规则确认三次升级为可信并刷新策略缓存,后续相同查询不再调用LLM,形成自进化闭环。查询缓存用LRU加TTL加编辑距离模糊去重。

搜索引擎多路召回加混合排序。ES与SQL并行召回去重合并。意图排序满分150(关键词50、价格40、品牌35、品类25),画像排序满分100(七个维度各10到20分),最终分等于基础100加两者。

AI对话四步编排:情感识别、带上下文意图识别、商品召回、LangChain回复生成。词典规则支持五种情感亚毫秒级。LLM不可用三级模板降级。

画像三层:人口画像63维缓存24小时,会话画像聚合短期行为缓存15分钟,统计画像TF-IDF计算品类亲和度和价格分位数缓存1小时。权重根据订单数动态协商。

实时流计算:MySQL CDC经Kafka到Flink,HOP窗口聚合会话行为,全量聚合计算统计特征写回画像表。

三、业务流程与功能路径

搜索路径:查LRU缓存,并行构建画像500ms超时Redis不可用降级MySQL,策略级联匹配叶子品类提取关键词价格,置信度达标自动提取规则,品类展开ES加SQL并行召回去重合并,混合排序返回,点击浏览行为追踪更新满意度。

对话多轮:首轮经情感意图识别触发商品召回,LLM根据画像和商品摘要生成推荐。次轮带历史上下文理解指代比较意图,每步可失败不阻塞后续。

CDC路径:MySQL变更被Debezium或Python轮询捕获序列化推送Kafka,Flink消费聚合计算写入画像表,下次搜索自动体现新偏好。

全网状降级:Redis不可用降级MySQL,LLM超时降级后备策略,ES不可用SQL独立可用,全部失败返回空结果不抛异常。

项目实现

一、整体架构与设计思路

DDD四层架构:API层路由参数校验,应用层编排流程,领域层纯业务逻辑不依赖框架,基础设施层数据库和外部调用。核心设计原则:策略模式加级联短路,六种意图策略按快到慢排列命中即退出;空对象模式降级,依赖不可用返回安全空对象而非null;组合根手动依赖注入不引入框架保持透明;惰性单例所有服务懒加载。

技术栈:意图识别用DeepSeek加AC自动机加BGE向量;搜索用ES中文ngram加MySQL品类过滤;AI对话用LangChain加词典情感分类;画像用MySQL加Redis双层缓存;流计算用Kafka加Flink SQL Gateway。

二、我负责的模块

意图识别:6策略级联,品类树8一级34二级约120叶子。ChatIntent小于100毫秒,LLMIntent500毫秒到2秒,AC自动机亚毫秒,模糊小于1毫秒,语义小于20毫秒。缓存LRU5000条TTL30分钟,编辑距离阈值0.70。置信度0.80触发规则提取,确认3次升级可信。

搜索:ES和SQL并行召回去重。意图150分(关键词50分精确子串加CJK重叠加向量三级、价格40分余弦衰减、品牌35分、品类25分),画像100分(七维各10到20分),基础100分最高350分。无画像按价格升序冷启动。

画像:三层,人口63维TTL24小时,会话最多10会话TTL15分钟,统计7维TF-IDF加价格分位数TTL1小时。新用户小于3单统计权重0.2,老用户大于等于10单权重0.7,总超时500毫秒。

对话:5种情感亚毫秒词典分类,加载5秒超时降级。速率限制滑动窗口60秒10次每IP。生成15秒超时三级模板降级。

CDC:HOP窗口24小时5分钟步长,Debezium为主Python轮询为备。

三、难点与解决方案

难点一:中文意图歧义。"苹果"可能手机或水果,"华为耳机便宜"修饰词干扰。方案用LLM层次剪枝逐层下钻,CJK字符重叠去修饰后缀后比较,品牌词优先减少歧义。

难点二:LLM高延迟高成本。每次超500毫秒费用不可控。方案级联把LLM放第二步规则优先过滤,缓存避免重复调用,自动规则提取运行越久LLM调用越少形成闭环。

难点三:用户冷启动。无画像排序无参考。方案无画像按价格升序降低门槛,权重协商新用户80%依赖会话画像快速学习,老用户70%依赖统计画像做推荐。

难点四:实时画像延迟。下单后搜索结果未反映新偏好。方案CDC到Flink端到端小于1分钟,HOP5分钟步长更新,Flink反压加Kafka磁盘缓冲不丢数据。

难点五:系统可用性。单点故障不应导致用户可见错误。方案全网状降级,Redis不可用降级MySQL仅增10到50毫秒,LLM超时后备策略接管,ES不可用SQL独立,全部失败返回空结果不抛异常

示例图片视频


天仔
1天前活跃
方向: 后端-Java、人工智能-NLP和自然语言处理、
交付率:100.00%
相似推荐
AI驱动的车载测试平台
AutoForge 是一款面向汽车电子诊断测试的 Web 化工艺平台,旨在解决传统桌面工具封闭、手工转换 CAPL 代码低效、团队协作困难等痛点。平台基于 B/S 架构,后端采用 FastAPI 提供 REST API 服务,前端采用 Vue 3 构建响应式操作界面,底层集成CAPL引擎实现工程文件的解析与 CAPL 代码自动生成。核心功能覆盖测试项目的全生命周期管理:支持测试分组与用例的灵活编排、100+ 标准化步骤模板的拖拽式设计、公共步骤的复用与同步、DID/DTC/TP 地址等项目级配置的集中管理,以及一键生成符合 CANoe 执行规范的 .can 代码。平台创新性地引入 DeepSeek-Reasoner 大语言模型,提供步骤智能推荐、配置合规审查、自然语言转测试步骤等 AI 辅助能力,显著降低测试设计门槛。同时支持基线文件差异对比,实现项目迭代的变更追踪与质量审计。系统部署于工程师工作站即可通过局域网向全团队提供浏览器访问,无需额外安装客户端软件,有效推动诊断测试工艺的标准化与协同效率提升。
宝马摩托线上商城
项目概述 本项目为宝马授权经销商量身打造高端摩托机车专属线上商城,聚焦 BMW 全系新车、原厂配件、骑行装备及精品周边销售,打通 “线上看车 - 预约试驾 - 线上下订 - 线下交付 - 售后维保” 全链路,构建宝马摩托官方标准的数字化新零售体系,助力经销商拓展线上获客渠道、提升品牌服务体验与销售转化效率。 项目背景 随着高端摩托消费年轻化、线上化趋势加剧,传统线下门店受地域、时段限制,获客成本高、展示效率低,难以满足用户 “随时看车、线上比价、便捷咨询” 的核心需求。作为宝马授权经销商,亟需搭建专属线上商城,统一品牌形象、标准化产品展示、数字化交易流程,同步对接线下门店服务能力,强化高端品牌调性,增强用户粘性与市场竞争力。 核心功能模块 1. 品牌化首页与车型展示 宝马官方风格 UI 设计,高清轮播展示旗舰车型、新品上市及门店活动; 全系车型分级分类(如探险 / 街车 / 复古 / 踏板),支持360° 全景看车、高清细节图、参数配置对比、车型视频沉浸式浏览; 原厂配件、骑行装备(头盔 / 服靴 / 护具)、生活精品分区展示,标注官方正品标识。 2. 线上咨询与试驾预约 车型详情页一键在线咨询、一键拨打门店热线,快速对接专属销售顾问; 预约试驾模块:选择车型、门店、时间,填写个人信息,系统自动同步至门店后台,支持短信 / 微信通知确认; 经销商门店 LBS 定位,展示地址、营业时间、联系电话,方便用户线下到店。 3. 线上下单与支付体系 新车定金支付、全款预订,支持微信 / 支付宝 / 银联等主流支付方式; 金融方案在线展示:分期贷款、厂家贴息等,提供月供计算器,一键提交金融申请; 订单管理:用户可查看订单状态、支付记录、物流信息,支持订单修改与取消。 4. 经销商专属后台管理 商品管理:车型、配件、装备上下架,价格调整,库存实时更新; 订单管理:订单审核、状态跟进、发货安排、售后处理,全流程追溯; 用户管理:客户信息、浏览记录、咨询记录、订单数据,构建客户画像; 数据看板:销售数据、访客数据、热门车型、转化率统计,支撑运营决策。 5. 会员体系与营销工具 会员注册 / 登录、积分累计、等级权益,绑定线下门店会员,打通线上线下权益; 营销活动:优惠券、限时折扣、新品预售、老客推荐返利,助力门店引流转化; 资讯社区:宝马摩托文化、骑行攻略、养护知识、赛事动态,增强用户互动。 6. 售后维保与正品保障 维保预约:选择服务类型、时间、门店,在线提交需求; 正品验证:车架号、配件编码查询,保障原厂正品,杜绝假货; 售后工单:问题反馈、维修记录查询,提升售后服务效率。
商用车系统数据采集
1、主要用来采集用户输入车架号vin17/后8位 进行指定品牌数据采集整理并完成自动化清洗入库。 2、使用web 页面进行每日数据采集的走势,可以监控每日数据采集量 3、提供API 接口可供其他前后端调用 4、自动登录,验证码识别,动态js 指纹解密,自动整理数据脚本,自动化入库处理 5、使用到使用是python +flask+js+mysql 处理、隐藏navigator.webdriver爬虫标识等等
车载智能座舱音视频娱乐系统-车机影音平台-车机音影平台
立项背景:随着智能汽车普及,车主对车内影音播放、多媒体交互需求提升,项目目标搭建适配小米座舱的一体化音视频播放底座。核心模块包含多路音视频解码、车载多媒体播放器、蓝牙音源接入、音效均衡调节。车机识别U盘/蓝牙/车联网流媒体音源,调用FFmpeg完成多格式音视频硬软解,用户通过中控屏切换音源、调节环绕音效,系统适配车载降噪算法,同步联动车内扬声器分区发声,满足行车影音娱乐需求。
精准营销MA
传统汽车经销模式下,集团各门店客户数据分散、标签体系缺失,导致营销依赖“广撒网”式推送,获客成本高且转化率低。随着存量市场竞争加剧,亟需打通线上线下数据孤岛,通过数字化手段实现客户分层与精准触达。为此构建精准营销系统,整合多源客户行为数据,依托动态标签引擎实现客群智能圈选,并联动短信、公众号、企业微信等全渠道自动化推送,解决营销资源浪费问题,驱动售后复购与潜客转化双增长。
帮助文档   Copyright @ 2021-2024 程聚宝 | 浙ICP备2021014372号
人工客服