程聚宝
程序员
软件外包公司
项目案例
发布需求
人才入驻
登录
注册
原"程序聚合"
工作台
程序员
软件开发公司
软件案例
发布需求
开发者入驻
帮助文档
小程序
登录
注册
原“程序聚合”
算法模型 软件定制 案例
行业:
全部
电商
企业内部管理
社交
在线教育
金融
旅游
云计算
医疗健康
人工智能
物流仓储
外卖跑腿
企业服务(saas)
物联网
VR/AR
区块链
内容平台
出行
安全
人力资源/HR
大数据
广告营销
农业
搜索
音视频
生活服务
汽车
游戏/电竞
工业互联网
智慧数字孪生
能源
零售/新消费
政务服务
房地产
展开
收起
载体:
全部
安卓APP
IOS APP
网站
小程序
H5
爬虫/脚本
插件
游戏
Windows应用
Mac应用
嵌入式软件
硬件
电视应用
云服务/云平台
算法模型
框架或代码包
车载应用
操作系统
鸿蒙应用
展开
收起
程序聚合
软件案例
全部
算法模型
分类筛选
银行反洗钱项目系统
反洗钱工作平台的设计,符合我国反洗钱监管要求,遵从未来发展趋势。主要模块包括大额可疑数据报送、可疑交易自主监测、客户身份识别与调查、名单管理与监控、客户风险评级、非现场监管报表、反恐怖融资、自贸区监测管理、5C 评估等核心模块,为甄别当前反洗钱、反经济犯罪、反恐怖融资等重点关注领域,提供了有效的支持。
金融、企业内部管理
MyBatis、Spring Boot、...
视频对抗攻击系统
1、立项背景和目标:针对主流视频识别系统开发对抗攻击能力,测试深度学习模型的鲁棒性与安全性。项目目标是实现视频帧级对抗样本的自动化生成,验证目标模型在对抗扰动下的误判率。 2、软件功能和核心模块:支持CPU和GPU双版本运行,包含视频解码与帧序列提取、基于TensorFlow的对抗扰动生成(FGSM/PGD等算法)、扰动后视频重组编码、攻击效果评估(扰动强度、PSNR、攻击成功率)四大模块。 3、业务流程:输入待测试视频 → 帧序列提取 → 选择攻击算法与参数 → 逐帧注入对抗扰动 → 视频编码输出 → 喂入目标识别模型测试 → 统计攻击成功率与扰动质量指标。
电商、音视频
FastAPI
跨模态检索tranning-free框架
立项背景与目标 背景: 跨模态检索(Cross-Modal Retrieval)是视觉-语言理解领域的核心任务,包含两类方向: - I2T(Image-to-Text): 给定一张图片,从候选文本库中检索最匹配的文本描述 - T2I(Text-to-Image): 给定一段文本,从候选图像库中检索最匹配的图片 传统的跨模态检索方法通常依赖大规模标注数据对模型进行微调训练(training-based),计算成本高、周期长,且跨领域泛化能力有 限。本项目探索一种**完全无训练(Training-Free)**的跨模态检索新范式——直接利用多模态大模型(MLLM)的语义理解和推理能力 ,结合层次化的上下文嵌入策略,在不进行任何模型微调的情况下,达到甚至超越有训练方法的检索精度。 目标: 1. 构建一个完整的、模块化的无训练跨模态检索流水线 2. 通过多维度图像描述生成和层次化语义嵌入,提升检索召回率 3. 引入 MLLM 重排序(Reranking)机制,在粗排的基础上做精细化语义匹配 4. 在 Flickr30K 和 COCO 2017 等标准数据集上验证方案的有效性 5. 通过一系列消融实验,系统分析各模块对最终性能的影响 软件功能 1. 图像多维度描述生成: 利用VL模型对每张图片从多个语义角度生成描述文本,为后续向量检索提供丰富的语义覆盖 2. 嵌入粗排: 采用自研嵌入策略,将多维度描述编码为高质量向量,计算图文相似度矩阵,输出 R@1/5/10 评估指标,并导出 Top-K 候选集供精排使用 3. MLLM Bidirectional Reranking: 在粗排 Top-K 候选集的基础上,对候选结果进行深度语义重排序,同时支持 I2T 和 T2I 两个方向 4. 自动化实验流水线: 通过 main.py 统一调度三阶段流程,自动进行 GPU 显存管理,支持大规模数据集批量处理 5. 稳定性测试: 对重排序模块进行多次重复推理,统计模型输出的一致性和稳定性 核心功能模块介绍 模块一:Stage1 - 图像描述生成(stage1_captioning.py) - 功能: 对数据集中的每张图片,利用 Qwen3模型生成四个独立维度的详细描述 模块二:Stage2 - HCE 粗排与评估(stage2_HCE.py) - 功能: 采用层次化上下文嵌入策略进行图文粗排检索,计算相似度矩阵并评估性能 - 核心类: CaptionRetrievalEvaluatorFast 模块三:Stage3-进行重排序Reranking
人工智能、搜索
PyTorch、Transformers
PCB金手指检测-方科PCB板
1.立项背景和目标 随着PCB高密度、高精度发展趋势,金手指位置度检测成为影响连接可靠性的关键工序。传统人工检测效率低、一致性差,难以满足批量生产中的精度要求。针对方正PCB的实际产品,开发出一套基于线扫描相机与同轴线光的金手指位置度检测方案,目标实现对金手指中心线偏移量的自动化测量,检测重复性控制在0.01mm以内,提升检测效率与标准化水平。 2.软件功能、核心功能模块介绍 本方案主要包括图像采集模块、位置度计算模块、重复性分析模块、结果输出模块。图像采集模块通过线扫相机和伺服移动系统获取高分辨率PCB图像;位置度计算模块以“两线平分中分线”为基准,测量左右第一根金手指到中心线的距离;重复性分析模块对多次测量结果进行极差计算,评估系统稳定性;结果输出模块生成检测数据表,支持数据追溯。 3.业务流程、功能路径描述 操作员将PCB放入固定载具 → 启动设备 → 将产品送至扫描位 → 线扫相机与同轴线光采集图像 → 软件计算金手指位置度数据 → 设备自动切换至背光,翻转产品后二次扫描 → 完成检测后送出产品。整个过程通过软件界面实时监控检测状态与结果,支持数据导出和重复性验证。
人工智能
C#、VBScript
onnx-wakeword https://github.com/voicute/onnx-wakeword
1、项目有哪些具体功能模块 跨平台推理适配模块、五层防误唤醒检测模块、模型加载解析模块、音频梅尔频谱转换模块、多唤醒词并行识别模块。 2、项目的主要功能描述 支持加载各类框架导出的 ONNX 唤醒词模型,内置五层独立可控防误触发检测逻辑,搭配倍率、阈值、置信度可视化调节;一套代码兼容 ESP32、Android、Linux、Web 四大平台,支持单唤醒词、多唤醒词批量配置,可对接 voicute 在线平台一键生成适配模型。
人工智能
Java、Python
潜语 — 心理学与精神分析 AI 对话 Agent(飞书机器人)
立项背景:市面上缺乏面向心理学专业领域的 AI 对话产品。本项目旨在构建一个基于大模型的知识型对话 Agent,整合精神分析六大学派(弗洛伊德、荣格、拉康、克莱因、温尼科特、科胡特)40 余部核心著作,为用户提供专业、安全的心理学知识问答服务。 核心功能:飞书群 @机器人 实时双向对话、私聊模式;自建心理学知识库,按学派/著作/概念三层索引,支持中文分词检索;自动检测自杀/自残等高风险输入,触发危机干预并引导拨打心理援助热线(北京 010-82951332);跨会话长期记忆,自动追踪用户情绪变化轨迹;每次回复后 AI 自评打分,低分回复自动归档待审队列。 业务流程:用户 @潜语 → WebSocket 接收 → 安全过滤(危机检测)→ 知识检索(RAG)→ DeepSeek 思考生成 → 回复用户 + 自评打分 + 情绪记录 + 记忆持久化。
医疗健康、在线教育
Python
中医+大模型
智能症状诊断(对话式问诊) 业务描述:用户以自然语言描述主诉(如“膝关节不能下蹲”),AI通过多轮追问,引导用户补充细节(如疼痛部位、活动受限幅度、伴随体征)。 典型界面: 用户发送“不能下蹲” → AI先提问“下蹲幅度:小幅度障碍还是不能站直?” → 再问“过伸试验强阳性?” → 逐步缩小范围,输出可能的病因(滑膜炎、髌骨嵌顿、腘肌损伤等)。 价值:模拟医生问诊逻辑,避免用户盲目猜测,提高诊断专业性。 2️⃣ 分层鉴别诊断(结构化推理) 业务描述:按照预设的临床路径(如“下蹲障碍”诊断树),AI自动输出分步骤的鉴别诊断列表,区分小幅度障碍、不能站直、后侧疼痛等不同分支。 截图体现: 小幅度障碍 → 肿胀(查滑膜炎) / 髌骨嵌顿(查股骨-髌骨关系) 不能站直 → 过伸试验强阳性(查膝后侧) / 过屈试验阳性(查膝前侧) 后侧疼痛 → 查臀后侧、腘斜韧带等具体结构 大幅度障碍 → 查脊柱侧弯、骨盆旋移、腿型等全身因素 价值:帮助医生/学员建立清晰的临床思维路径,减少漏诊。 3️⃣ 治疗靶点推荐(针刀/针灸定位) 业务描述:当AI完成诊断后,直接输出需要查治的具体解剖结构或压痛点,例如“查治臀后侧、腘斜韧带、腘肌下隐窝、籽骨、半腱肌、半膜肌”。 扩展功能:可进一步点击某个靶点,查看针刀松解进针方法、解剖图示、操作视频。 价值:从“是什么病”快速过渡到“怎么治”,尤其适合针刀医师临床参考。 4️⃣ 体征试验引导(辅助检查) 业务描述:AI主动建议用户或医生完成特定物理检查试验,如“正/反4字试验、直腿抬高试验、过屈/过伸试验”,并根据试验结果再推理。 交互方式:用户点击试验名称,可以查看操作图解或视频演示;也可输入试验结果为“阳性/阴性”,AI更新诊断结论。 价值:标准化体格检查,提升远程问诊的可靠性。 5️⃣ 多模态教学资源关联 业务描述:在诊断结果下方,直接推荐相关的教学视频、名医课程,例如截图中的“膝关节相关疾病的诊断及进针思路”、“唐国振膝关节临床操作演示”。 业务形态:可免费预览部分内容,完整课程需付费/订阅解锁。 价值:实现“即诊即学”,构建从诊疗到教育的闭环,增加用户粘性和付费转化。 6️⃣ 主动追问与健康档案记录 业务描述:在用户未主动提问时,AI可主动发起常见问题,例如截图底部的三个引导按钮: “下蹲时膝关节有无疼痛?” “膝关节活动时有响声吗?” “平时走路或站立时膝盖感觉如何?” 数据沉淀:用户回答内容自动归入个人健康档案,形成长期追踪记录,未来复诊时可对比变化。 价值:变被动问答为主动健康管理,提升用户活跃度和数据丰富度。 7️⃣ 再答一次/调整诊断(可控生成) 业务描述:用户若对当前AI诊断不满意,可以点击“再答一次”按钮,AI会重新生成一组诊断思路或换一种推理逻辑(例如增加考虑肌筋膜链)
人工智能、医疗健康
Python、UniApp、Vue
基于大语言模型的全能伴侣智能体-黄粱一梦
立项背景: 传统聊天机器人缺乏持续性人格和情感交互能力,每次对话都是"失忆"状态。本项目旨在构建一个具有完整情感模型、多层记忆系统和自主进化能力的智能伴侣系统,实现"有灵魂的AI"。 核心功能: 1. 情感引擎: 基于3D VAD(效价-唤醒度-掌控感)连续情绪模型,9个情绪锚点,支持刺激分类与指数衰减,E值系数影响回复风格强度; 2. 记忆系统: L1-L5五层认知分层,双相遗忘曲线(指数+幂律衰减),SQLite FTS5全文检索,Obsidian兼容格式; 3. 关系成长: 4阶段演进(初识→热恋→甜蜜→稳定),基于消息量和互动频率动态调整语言风格; 4. Agent循环: think→tool→result→continue架构,支持14种工具调用(文件操作、网络搜索、Shell执行、浏览器控制等); 5. 安全体系: K公式决策引擎、A5五维风险分级、Prompt注入检测、文件操作保护; 6. 自主行为: 稳态压力模型驱动主动消息,5个内部压力源竞争决策。 业务流程: 用户消息→情绪衰减→记忆检索→系统提示词组装→Agent工具调用循环→情绪解析→承诺调度→记忆存储→分片回复。
人工智能
Python、Electron、SQLi...
影像图检测分析平台
平台面向智慧城市场景,支持遥感影像的变化检测与智能分析。立项背景是城市基础设施监测依赖人工,效率低、响应慢。核心功能包括:影像图智能检测、变化分析、压占/突破分析、批量转换与空间分析。可服务于城市规划、环境监测、基础设施管理等场景。
工业互联网、政务服务
Flask、Redis、PaddlePa...
卫星轨道解算与天线自动跟踪测控系统-Satellite Tracking Control Platform
本项目为卫星测控与轨道跟踪系统,主要用于低轨(LEO)、中轨(MEO)、地球同步轨道(GEO)卫星的实时轨道解算、可见性分析以及天线自动跟踪控制。 系统支持导入标准TLE两行轨道数据,通过SGP4轨道模型完成卫星位置计算,并结合站点经纬度实时计算卫星方位角(AZ)、俯仰角(EL)、距离、多普勒频移等参数。 核心功能包括: TLE轨道数据导入与管理 卫星实时位置计算与轨迹显示 可见窗口预测与过境分析 天线自动跟踪控制 TCP/IP网络通信接口 设备状态监控与日志记录 数据导出与报表生成 系统广泛应用于卫星通信测试、遥测遥控、轨道分析及地面站设备管理等场景,可有效提高卫星跟踪效率和设备自动化程度。
工业互联网
C++、Qt、SQLite
智能AI Agent助手-Hermes Agent
基于开源框架 Hermes Agent 打造的智能AI助手系统,支持 DeepSeek/Claude 等多模型灵活切换。具备持久化记忆与技能自进化能力,集成工具调用(代码执行、文件操作、网页搜索、图片生成),实现复杂任务自动分解执行。通过消息网关支持微信/Telegram等多平台接入,让AI能力触手可及。
人工智能
Python、Transformers
基于MediaPipe的动作智能计数系统开发
参与外部企业项目外包,应用MediaPipe技术实现动作智能计数系统。负责开发后端程序,用于识别视频中的人体动作,包括俯卧撑和引体向上等。成功编写后端计数程序,确保动作识别的准确性和计数功能的稳定性。同时,负责前后端连接的实现,实现JAVA端和python端的数据传输并维护系统的稳定性。
人工智能、医疗健康
Python
yolo模型训练
在计算机视觉领域,人体姿态检测作为支撑动作分析、人机交互、智能安防、医疗康复等关键领域的核心技术,长期面临检测精度与实时性之间的平衡难题。这一挑战贯穿技术发展的多个阶段:早期基于手工设计特征的方法,如主动形状模型(ASM)和主动外观模型(AAM),依赖人工定义的几何特征模板与统计模型,在复杂光照变化、多角度姿态变换或遮挡场景中,特征表达能力呈现显著局限性,导致关节点定位精度难以突破物理瓶颈,尤其在低分辨率或模糊图像中,检测误差常超过 20 像素。基于图模型的条件随机场(CRF)虽通过概率图模型建模关节点间的空间依赖关系,但其推理过程的时间复杂度随关节点数量呈指数级增长(例如,17 个关节点的全连接CRF计算复杂度达O(N17),N为图像像素数),使得该方法在实时视频流处理场景中(如帧率要求≥ 25 FPS的监控系统)完全不可行。 深度学习技术的兴起推动姿态检测进入数据驱动时代,衍生出两大主流技术范式:自顶向下方法与自底向上方法。自顶向下方法以Mask R-CNN、HRNet为代表,通过“先检测人体实例,再逐例预测关节点”的两阶段流程,在单人场景中可实现较高精度(如HRNet在COCO数据集上mAP@0.5达0.91),但其计算成本随图像中人体数量线性增加——当画面包含10人时,推理时间较单人场景延长10倍,导致在人群密集的公共场景(如地铁站、体育场)中实时性显著下降。自底向上方法如OpenPose通过关键点检测与分组的解耦设计,理论上计算成本与人体数量无关,但其跨目标关节点分组依赖启发式规则(如距离阈值、外观特征匹配),在多人重叠或姿态相似场景中误关联率高达35%,尤其在舞蹈、体育竞技等关节点密集交互的场景中,分组错误导致的姿态结构断裂问题频发
人工智能
Python、PyTorch
智能户外机器人 AI 视觉感知与捡球决策系统-高尔夫捡球机器人 AI 感知模块
本项目面向户外高尔夫球场自动化作业场景,为移动机器人提供 AI 视觉感知、目标识别、状态判断和任务辅助决策能力。系统接入左右相机、激光点云、里程计、地图、设备状态等多源数据,完成高尔夫球识别、球满判断、卡球检测、三角标识识别、前方障碍检测、局部/全局球密度地图生成等功能。 机器人在作业过程中可根据视觉检测结果统计球量、判断是否需要返航卸球,并结合行为树状态、任务状态、电量信息和地图区域信息进行联动控制。同时系统支持动态参数配置、图像缓存、检测结果解析、ROS 服务调用、状态发布、异常告警和 rosbag 数据保存,便于现场调试、算法验证和后续数据回放分析。
人工智能、工业互联网
C++、OpenCV
PCB的xray瑕疵检测
业务定位 面向PCB制造商、SMT贴片厂及电子质检服务商,提供基于高分辨率X-ray成像的自动化无损检测方案,用于识别压合、焊接及内层结构中的隐蔽缺陷,避免故障板流入后续工序或成品市场。 核心功能 - BGA/LGA空焊虚焊检测:精准捕捉焊球内部气泡(空洞)比例、枕头效应及开路/短路。 - 埋盲孔与内层线路分析:可检内层铜箔断裂、叠孔错位、树脂填充不足等不易外观发现的问题。 -多层对位偏移量测:自动计算各层靶标偏移值,判断压合偏移是否超限。 - AI辅助判读:实时标记疑似缺陷,生成检测报告,支持与CAM设计数据比对。
人工智能
C++、Python、OpenCV、Py...
基于 VLM 的边端协同包裹守卫系统
场景:面向家庭安防场景,针对用户对包裹相关事件(投递、家人取件、快递员取件、包裹盗窃)的高关注需求,基于视觉大语 言模型(VLM)的视频理解能力,构建多类别事件识别系统。 任务:负责视频多模态大模型的选型、训练与压缩, 构建覆盖图文预训练 → 安防垂域微调 → 偏好对齐(DPO) 的完整训练体 系,并设计轻量化方案以支持边端部署。
人工智能
Python、PyTorch
工业设备时序数据异常检测算法Demo
基于工业设备采集的时序数据,开发了一套轻量级异常检测算法Demo。通过滑动窗口统计、3σ原则对设备运行指标进行异常识别,支持数据可视化展示与异常点标记,可用于快速发现设备运行中的异常波动,辅助工业运维人员进行故障预判,提升数据驱动运维的效率。
大数据、工业互联网
Python、Matplotlib、Nu...
图文广告设计,人像修复技术等等
本项目为餐饮连锁品牌的全案视觉设计项目,核心包含品牌 LOGO 设计、VI 视觉系统(门店物料 + 包装规范)、菜单版式设计三大模块。对甲方而言,实现了品牌视觉统一化、门店物料标准化、产品信息清晰传递的目标,解决了品牌形象零散、物料风格不统一的问题。主要设计路径为:品牌定位梳理→LOGO 多方案设计与优化→VI 系统规范制定→菜单与门店物料落地设计,形成完整的品牌视觉体系,助力品牌建立清晰的市场识别度。
广告营销
PHPMailer
DataAgent 数据智能体平台
这个项目最有价值的地方,是它把大模型从简单聊天能力落到了企业数据分析场景里。我们没有直接让模型生成答案,而是把问题拆成意图识别、证据召回、Schema 召回、SQL 生成、语义校验、SQL 执行、Python 分析和报告生成多个阶段。这样做的好处是链路更可控,出错后也更容易定位和重试。
企业内部管理、人工智能
Java、Spring Boot、Vue
RAG Agent
一、立项背景与目标 1. 立项背景 在传统的知识库问答系统中,普遍存在以下痛点: - 流程混乱:通用ReAct Agent在处理复杂业务时,容易发生步骤跳跃或逻辑错乱,导致回答质量不稳定。 - 上下文断裂:多轮对话中,用户常使用代词(如“它多少钱?”),传统向量检索缺乏指代消解能力,导致检索失败。 - 意图混杂:闲聊式提问(如“你好”)与知识检索式提问(如“XX产品参数是多少”)被统一处理,浪费算力且影响用户体验。 - 状态丢失:用户刷新页面或稍后再访问时,对话历史无法延续,每次都是“新会话”。 2. 项目目标 - 构建一个流程可控、意图可分流、上下文可理解、状态可持久的智能知识助手。 - 实现复杂业务逻辑的结构化解耦,提升系统的可维护性与稳定性。 - 显著提升多轮对话场景下的检索命中率与回答准确率。 二、软件功能与核心模块 1.整体功能概述 本系统是一个基于LLM的智能对话式知识库问答助手,支持用户通过自然语言提问,从向量知识库中精准检索并生成回答。系统特别强化了多轮对话中的指代消解能力与流程可控性。 2.核心功能模块介绍 模块名称 功能说明 Planner(规划器) 基于LLM + 专用Prompt,硬编码业务流程。负责解析用户请求,按固定流程调度执行,防止逻辑跳跃。 语义路由器 基于LLM的分类工具,动态识别用户意图为“chat”(闲聊)或“retrieval”(知识检索),实现分支分流。 历史加载与写入模块 与Redis集成,自动追加对话历史,确保跨会话的上下文连续性。 查询重写模块 结合历史对话,将存在指代或省略的用户问题(如“它多少钱?”)改写为语义完整的独立问句。 混合检索引擎 同时执行向量语义检索与关键词检索,通过RRF算法融合排序,提升召回效果。 Executor(执行器) 根据Planner的指令,调用重写、检索、生成等环节,最终输出回答。 系统流程严格遵循:语义路由 → 历史加载 → (分支判断) → 查询改写/直接回答 → 知识库检索 → 最终生成 三、业务流程与功能路径 以下为用户与系统交互的完整功能路径描述: 场景一:用户进行知识检索(多轮对话) 场景二:用户发起闲聊 场景三:用户首次访问 / 会话恢复
人工智能、大数据
Python、FastAPI、PyTor...
1
2
3
4
15
帮助文档
Copyright @ 2021-2024 程聚宝 | 浙ICP备2021014372号
人工客服
微信扫一扫直接聊
无需加好友