程聚宝
程序员
软件外包公司
项目案例
发布需求
人才入驻
登录
注册
原"程序聚合"
工作台
程序员
软件开发公司
软件案例
发布需求
开发者入驻
帮助文档
小程序
登录
注册
原“程序聚合”
人工智能 软件定制 案例
行业:
全部
电商
企业内部管理
社交
在线教育
金融
旅游
云计算
医疗健康
人工智能
物流仓储
外卖跑腿
企业服务(saas)
物联网
VR/AR
区块链
内容平台
出行
安全
人力资源/HR
大数据
广告营销
农业
搜索
音视频
生活服务
汽车
游戏/电竞
工业互联网
智慧数字孪生
能源
零售/新消费
政务服务
房地产
展开
收起
载体:
全部
安卓APP
IOS APP
网站
小程序
H5
爬虫/脚本
插件
游戏
Windows应用
Mac应用
嵌入式软件
硬件
电视应用
云服务/云平台
算法模型
框架或代码包
车载应用
操作系统
鸿蒙应用
展开
收起
程序聚合
软件案例
人工智能
全部
分类筛选
基于STM32的智能控制小车
承接单片机开发、STM32开发、PCB设计、电路设计、嵌入式项目开发 1. 单片机程序开发:STM32、51、Arduino、智能小车、传感器采集、电机/舵机控制、串口通信 2. PCB设计:原理图绘制、PCB版图设计、打样指导、单层/双层板设计、元件布局、走线优化 3. 项目调试:代码bug修改、程序优化、硬件调试、上位机配合调试
人工智能
Altium Designer
内部大模型应用管理平台
随着公司AI战略的深入,各类业务对基于领域知识的智能问答需求激增。同时对于不同的应用场景需要支持不同的系统能力,比如解析学城文档表格、大模型对长文本内容总结summary、提供通用AI检索API接口等后续部分应用可能会对文档文本、图片、表格等多模态AI检索能力有部分诉求,因此期望建设支持公司特殊业务场景专有知识管理平台,包括数据解析、知识管理、知识检索能力,大幅提升同类项目的搭建效率。另外随着多模态应用(如故障图片识别)的兴起,缺乏高效的数据标注工具,人工标注成本高昂,因此建设一个面向公司垂类的AI 基础设施平台,成为支撑业务快速创新与降本增效的关键。
企业内部管理、人工智能
Java、Python、Spring B...
华为昇腾NPU上部署大模型推理,实现pd分离
vLLM-Ascend :昇腾 NPU 上的大模型推理部署 前言:近两年大语言模型的推理需求爆发式增长,推理引擎成为了AI工程落地的核心基础设施。举个例子,爆发式增长的推理需求相当于一群车过马路,传统的推理引擎就是“单车道马路”,容易拥堵。而vLLM是业界领先的开源推理框架,相当于“十车道高速公路”,让AI的响应更快更迅速、成本也更低。 为了支持昇腾AI芯片生态,vLLM社区在去年年底推出了vLLM-Ascend硬件插件。就像是为昇腾芯片量身定制的“适配器”,巴适得很。截至 2025 年 12 月,vLLM-Ascend 已支持 Llama、Qwen、ChatGLM、Mixtral 等主流架构,并具备 Expert Parallelism(EP)、多模态、Embedding 模型等高级能力
人工智能
NumPy、Pandas、Transfo...
获取每日ai圈新闻工具-ai-new
立项背景: 随着人工智能领域快速发展,每天产生大量新闻资讯,传统人工筛选方式效率低下,无法及时捕捉重要信息。本项目旨在解决信息过载问题,通过AI技术自动聚合、筛选、总结AI领域新闻,帮助用户高效获取关键资讯。 核心功能: 智能抓取:自动从TechCrunch AI、MIT Technology Review、机器之心等5个权威新闻源抓取最新内容 AI双语总结:使用DeepSeek API自动生成中英文双语标题和摘要,提取3-5条核心要点 智能排序算法:综合时效性(30%)、来源权重(20%)、关键词匹配(25%)、AI评估(25%)四维度计算重要度评分(0-100分) 实时进度展示:抓取过程中实时显示进度条,包括当前处理文章数和状态 业务流程: 每日定时任务(上午9点)自动触发 → RSS订阅源抓取 → 新文章入库 → AI分析总结 → 重要度评分 → 用户访问时按分数排序展示 → 支持时间筛选(今天/本周/全部)和语言切换(中/英)
在线教育、人工智能
Tailwind CSS
大孙紫AI净饮机项目
该项目是将ai、康养陪护、日常净饮等方面融合的产物。涵盖了微信小程序端、后台运营端、安卓硬件端。用户可以通过微信扫码进行绑定设备和人员,设置自己喜爱的小辈们的声音作为安卓端音色,进行别样的人机交互生活,从而使得数据流入后台。通过算法或手动触发或语音唤醒等方式进行紧急情况的呼救
医疗健康、人工智能
Java、Kotlin、UniApp、V...
企业级多模态智能问答中台-Multimodal Agentic RAG (智能体检索增强系统)
立项背景与目标: 针对传统 RAG 系统在处理“图文混合文档”时无法识别图片内容,以及面对“复杂逻辑问题”时回答准确率低的痛点,本项目旨在构建一个生产级、多模态、具备推理能力**的企业知识问答中台,助力企业将非结构化文档(PDF/Word)转化为可交互的智能资产。 核心功能与业务流程: 1. Agentic RAG (智能体检索)**:基于 LangGraph 构建了具备“自我反思”能力的 Agent 状态机。 意图路由:精准区分闲聊/问答,避免资源浪费。 自我评估 (Self-Reflection):Agent 会对检索结果进行质量打分。如果发现相关性不足(Score < 0.8),会自动触发查询改写 (Query Rewrite) 并重新检索,直到找到满意答案或达到重试上限。 动态规划:针对复杂问题,自动拆解为多个子任务并行执行。 2. 多路混合检索 (Hybrid Search)**: 摒弃单一的向量检索,采用 Vector (语义) + BM25 (关键词) + Rerank (重排序)的黄金组合。 引入 Cross-Encoder 模型进行二次精排,像“阅卷老师”一样剔除伪相关文档,检索准确率提升至 89%。 3. 全链路多模态 (Multi-modal): 集成 VLM (视觉大模型),不仅能读懂文本,还能理解 PDF 中的图片、图表,实现真正的“图文跨模态检索”。 4. 生产级异步架构: 利用 Celery + Redis 构建高并发流水线,实现 GB 级大文件的异步解析与后台向量化,确保前端操作零卡顿。
人工智能
Python、FastAPI、React...
AI工具的自动化行为监控与审计工具
本项目是一款面向AI助手工具的自动化行为监控与审计工具。它能够7x24小时静默运行在后台,实时跟踪并记录目标工具在本地电脑上的所有关键操作行为,包括但不限于:系统API调用记录、文件读写访问的路径与行为、网络请求的域名与数据流量特征等。所有监控数据均被安全地本地化加密存储。工具会自动聚合分析每日的活动日志,生成一份清晰明了、包含行为摘要与潜在风险提示的审计报告,并通过配置的邮箱在每日固定时间自动发送给用户,让用户对AI工具的行为了如指掌,在享受效率提升的同时,牢牢掌控本地隐私与数据安全。
企业内部管理、人工智能
Python
toB灵感岛SAAS-企业级内容营销创作及管理平台,旨在借助AI之力,大幅度降低企业视频内容生产、分发、人员及管理成本-灵感岛SAAS
一、立项背景和目标 当前短视频、商业图文创作需求激增,传统模式效率低、门槛高、创意不足,企业及创作者需耗时处理素材剪辑、脚本撰写等,专业技能门槛拦住多数参与者。 核心目标:以 AI 技术赋能创作全流程,降低门槛、提升效率,保障内容质量与多样性,助力企业、自媒体人及普通创作者快速产出高质量商业短视频、高清图片及音频内容,覆盖多行业多场景,实现 “低成本、高效率、强创意” 目标。 二、软件功能及核心功能模块介绍 软件聚焦 “视频、图片、音频、数字人” 四大场景,构建全链路 AI 创作能力: (一)AI 视频智能生成模块 智能混剪:AI 脚本一键导入,上传多组素材,一分钟生成 1000 条视频,自带包装元素,系统去重算法保障原创性; 一键成片:内置爆款脚本库,支持批量改写,AI 匹配效果,上传素材即批量生成优质短视频; 热门视频解构:输入视频链接,系统毫秒级分析镜头画面,拆解流量密码,助力复刻爆款; 热门脚本库:定时更新多行业、多场景爆款脚本,支持一键使用。 (二)AI 图片能力模块 图片生成:提供丰富模板,AI 快速生成高清图片,创作便捷; 背景替换:上传产品图一键换背景,效果真实融合,无需专业布景; 图片审核:AI 替代人工审核,人机结合,效率提升 80%。 (三)AI 音频助力模块 文本转语音:输入文案自动生成配音,支持自定义语速、音调,选择多样; 音频提取:输入视频链接,毫秒级精准提取口播文案,方便二次创作。 (四)AI 数字人模块 通过一段视频训练,克隆定制专属数字人,满足商业代言、视频出镜等个性化需求。 三、业务流程、功能路径描述 (一)AI视频智能生成 智能混剪:登录→视频模块→选择功能→导入脚本 / 上传素材→设置偏好→生成→去重→获取视频; 一键成片:登录→视频模块→选择功能→挑选 / 改写脚本→上传素材→AI 匹配→批量生成; 热门解构:登录→视频模块→选择功能→输入链接→系统分析→生成报告→参考创作; (二)AI图片能力 图片生成:登录→图片模块→选择功能→选模板 / 输要求→AI 生成→预览获取; 背景替换:登录→图片模块→选择功能→上传原图→选背景→系统处理→预览确认; 图片审核:登录→图片模块→选择功能→输标准→上传图片→AI 初检→人工复核(可选)→获结果。 (三)AI音频助力 文本转语音:登录→音频模块→选择功能→输入文案→设参数→生成下载; 音频提取:登录→音频模块→选择功能→输入链接→解析→提取导出。 (四)AI数字人 登录→数字人模块→选择功能→上传训练视频→系统训练→生成数字人→确认使用或者重新训练。
人工智能、企业服务(saas)
Go、Python、Vue、Docker
toc AI漫剧推文生成-绘聚AI
立项背景 当前网文IP轻量化可视化需求激增,但传统小说转视频流程繁琐、门槛高,分镜、背景、字幕语音需专业操作且多工具协同,效率低下。现有AI工具多聚焦单一环节,缺乏全链路解决方案,且生成质量不稳定,无法满足高效创作需求,为此立项研发绘聚AI。 立项目标 1.打造全链路小说可视化工具,实现“上传小说即出视频”,大幅缩短制作周期; 2.提升AI生成精准度,解决语义偏差、质量不稳问题; 3.降低使用门槛,让普通用户无需专业技能即可完成创作; 4.适配多类型小说,支持个性化编辑,助力IP多元化传播。 整体软件功能 绘聚AI以“全流程自动化、精准化、便捷化”为核心,涵盖小说上传解析、自动分镜、背景生成、字幕语音拆分、视频合成导出五大核心功能,搭配辅助功能,实现文字到视频一站式转化。 核心功能模块介绍 四大核心模块协同联动,兼顾自动化与个性化编辑: 1.小说解析与自动分镜模块:解析小说信息,自动生成分镜脚本; 2.分镜背景图生成模块:联动分镜,自动生成适配风格的背景图; 3.字幕与语音生成模块:自动拆分子幕、合成贴合语气的语音; 4.视频合成模块:整合三大元素,自动合成视频。 整体业务流程 整体流程:用户添加小说→系统自动生成分镜→生成对应背景图→拆分字幕并合成语音→合成视频→用户导出视频,形成闭环创作流程。 详细功能路径描述 1. 初始路径:登录系统→配置添加小说; 2. 创建章节:创建任务添加章节内容; 3. 执行任务:自动生成分镜→自动生成背景→自动拆分合成语音和字幕→自动合成视频; 4. 视频导出。
人工智能、内容平台
Go、Vue、MySQL
ai视频通话实时换脸
上传图片实时换脸,接了两大人脸模型,可实时通话可直播,自动检测电脑配置实现加速保障实时同步,带激活码系统,需用户提供机器码才能获取激活码、全程傻瓜式操作无需其他部署,用户点击打包后的exe即可自动运行只需上传图片即可
人工智能
OpenCV
电商数字人
### 数字人模型训练 - **功能描述**:通过上传训练视频和音频,训练个性化的数字人模型 - **主要特性**: - 支持自定义模型名称和参数配置 - 多种图像尺寸选择(256×256、512×512、1024×1024) - 可配置批次大小、学习率、训练轮数等参数 - 实时训练进度监控和损失曲线展示 - 支持训练任务的暂停、继续和停止操作 ### 数字人推理 - **功能描述**:使用已训练的数字人模型,根据音频生成数字人视频 - **主要特性**: - 模型列表管理和选择 - 支持音频驱动和视频驱动两种模式 - 可配置输出质量和格式 - 实时推理进度显示
电商、人工智能
Python、ONNX Runtime、...
AI绘画
我成功构建了一套基于量化模型的图像生成系统。 通过对 Flux1-dev 模型进行量化处理,该系统能够在显存仅为 8GB 的 CUDA 设备上高效运行推理。 在 1920×1080 分辨率的单张图像生成任务中,平均合成时间约 20 秒。 后端采用 Python 开发,支持文生图与图生图功能,并提供了完整的 API 接口。所有生成记录及相关数据均通过 SQL 数据库实现本地持久化存储。 为进一步丰富图像风格,我还训练了多种不同风格的 LoRA 模型,可供灵活调用。 前端部分基于 Unity 引擎开发,实现了直观的图像生成交互界面,并与后端服务完全对接,形成从输入到生成、存储的可闭环工作流。 整个系统已具备稳定运行能力,在有限的硬件条件下实现了较高质量的图像生成与可扩展的风格支持。
人工智能、游戏/电竞
Python、Unity、PyTorch...
企业合规举报与投诉函撰写系统
### 1. 项目模块 - 信息录入模块 :收集违规原文、平台信息、账号信息和企业名称 - 分析处理模块 :验证输入、提取断言、匹配法规、生成举报函 - 对话交互模块 :支持用户与AI讨论举报函内容、法规解读等 - 文档导出模块 :将分析结果导出为Word文档 - 人工复核模块 :提供人工复核页面,确保举报函质量 ### 2. 主要功能描述 信息录入功能 - 支持输入企业名称及其代称(如:宁德时代,宁德,CATL) - 收集平台名称、账号信息和违规原文内容 - 提供清空功能,方便用户重新输入 分析处理功能 - 基础检查 :验证用户输入的完整性和相关性 - 断言提取 :从违规原文中提取可投诉的事实性断言 - 法规匹配 :将提取的断言与法规知识库进行匹配 - 举报函生成 :基于提取的断言和匹配的法规生成结构化的举报函 对话交互功能 - 展示分析结果和AI回复 - 支持用户与AI进行连续对话,讨论举报函内容、法规解读等 - 提供清除对话历史功能 文档导出功能 - 将分析结果导出为Word文档 - 支持选择部分对话内容进行导出 - 生成格式化的违规举报分析报告 人工复核功能 - 提供专门的人工复核页面 - 支持人工审核和修改举报函内容
人工智能
Flask
基于yolo训练的无人机多目标识别程序-Cerberusdet
立项背景 在无人机目标识别场景中,有时需要在同一系统中同时完成多类目标或多任务的识别。如果为每个任务分别部署独立模型,将导致模型参数量大、推理效率低、部署和维护成本高。 因此,有必要在保证检测效果的前提下,通过结构设计实现多任务目标检测的统一与优化。 立项目标 基于 YOLO 目标检测框架,设计并实现一种共享主干网络的多目标识别方案,通过引入多 Head / Neck 结构,在同一模型中完成多个检测任务,降低整体参数量和计算开销,提高系统的实用性与部署效率。 二、软件功能与核心模块介绍 1. 软件功能介绍 支持基于 YOLO 的多目标检测 支持多个检测任务在同一模型中并行执行 通过共享主干网络减少模型参数规模 支持图片与视频流输入 提供检测结果的可视化输出 2. 核心模块介绍 (1)特征提取模块(Backbone) 负责对输入图像进行统一的特征提取,作为多个检测任务的共享基础,减少重复计算。 (2)特征融合模块(Neck) 针对不同任务配置独立的特征融合结构,在共享特征的基础上增强各任务的表达能力。 (3)检测头模块(Head) 为不同任务分别设置检测头,完成各自的目标分类与位置回归。 三、业务流程与功能背景介绍 1. 功能背景介绍 在多任务目标检测场景中,传统方案通常采用多个独立模型分别处理不同任务,存在资源占用高、系统复杂度高的问题。本项目通过统一模型结构,实现多任务目标检测的集中处理,更适合对性能和资源敏感的应用场景。 2. 业务流程说明 2.1. 训练流程 收集多任务标注数据,每个任务拥有独立的训练集 数据统一格式,方便输入共享主干网络 所有任务的数据都会用于更新共享的 Backbone,确保基础特征表示能力适用于所有任务 Backbone 学习通用特征,减少模型参数重复 每个任务独立训练自己的 Neck 与 Head 模块 根据任务目标进行优化,保证任务专有特征有效提取 与共享 Backbone 协同工作,实现多任务并行优化 训练过程中,Backbone 与各任务分支交替优化 最终得到既共享通用特征,又具备多任务检测能力的模型 2.2 使用流程 Backbone 对输入数据提取通用特征,作为多任务检测基础 各任务独立的 Neck & Head 模块接收共享特征 输出各自的检测结果(如不同目标类别或任务指标) 将各任务检测结果汇总 支持视频流叠加显示或输出结构化数据(CSV/JSON) 汇总检测结果并进行可视化输出
人工智能
OpenCV、PyTorch
基于大模型的智能设备控制服务-某语音智能助手
基于大模型理解用户语音并准确控制智能设备基于大模型理解用户语音并准确控制智能设备基于大模型理解用户语音并准确控制智能设备基于大模型理解用户语音并准确控制智能设备
物联网、人工智能
Java、Spring Boot
沙轨道交通客流预测项目-流量预测
将历史的日期特征和天气特征数字化,结合历史客流量得到输入数据,组合为LSTM算法的输入,并将LSTM算法的输出经过全连接神经网络得到未来一天的客流量预测值,最后将未来一天的日期和天气特征通过另一个全连接神经网络计算得到一个权值,修正客流量预测值,为地铁运营部门提供参考,提前调整地铁运行系统。目前主要是预测整条线路的天粒度的客流量。
人工智能
Python
卷积神经网络稀疏计算优化
在这个项目中,我们三人一组,主要实现的功能是利用Vivado软件操作平台在ZedBoard-zynq-7000c484开发板平台上实现卷积神经网络算法优化的目标。 通过上述优化,在相同硬件资源条件下,最终实现的运算速度比传统计算快183倍,比硬件优化方法快20%。这个项目获得了全国集成电路创新创业大赛二等奖。 我们的总体设计方法是这样的,首先在 C++平台上实现卷积核算法和反卷积算法,然后通过 vivado HLS 仿真进行总线带宽、pipeline、内部缓存、计算单元等方面硬件的优化,仿真波形和实际相符后,生成相应的 IP 核,vivado 导入 IP 核和 zynq7000 进行实物仿真,经过验证正确后烧入 fpga。图像从电脑端通过串口输入开发板,由于片内缓存不足以一次性存储1024个channel的150*150的图像,所以采用动态缓存的办法,Zynq 边对图像进行卷积处理,边从特征 cache 读取图像数据,一个 channel 处理完成后立即输出至 SDSDRAM(输出数据量较小),并空出相应的缓存资源供后续 channel的图像使用。我们将开发板的 8 个 LED 设置为输出结果,板上运行时,可通过 LED判断输出波形。
电商、人工智能
C/C++、VHDL/Verilog
基于AdaBoost算法的脸控系统
本项目开发出基于人脸检测与跟踪算法的远程驾驶系统。驾驶员通过脸部的细微运动即可远程控制车辆的行驶,解放了双手。项目的核心是基于 AdaBoost 算法的人脸检测与跟踪技术以及基于 TCP-SOCKET 的远程通信技术。项目的关键技术难点在于人脸检测的准确性、判别算法的鲁棒性和通信系统的实时性。项目很好地满足了这几点要求。
人工智能
利用手机传感器测行人移动方向
计算出行人移动的方向和速度,开发出能显示行人移动方向的APP。并设计出了利用位移和姿态角计算运动方向的算法。 数据测试:获取运动传感器所得数值,进行数学解算得到行人移动的方向和速度; 进行实验反复验证,并根据情况修改,直到误差在允许范围内为止。 实验验证:利用手机传感器测运动方向,研发出能显示行人移动方向的APP。
人工智能、电商
C++、Python
机器人抓取物体的实现
实现了机器人机械爪抓取和放置物体的demo。实现了物体的自动识别与机械臂的运动规划,实现了机器人的即时导航与定位功能。在仿真平台上实现了机械爪的抓取和放置,并实现了人机协同。最终的机器人既可独立完成抓取任务,也可以在人工辅助下完成抓取任务。
人工智能
C++、Python
1
2
3
4
20
帮助文档
Copyright @ 2021-2024 程聚宝 | 浙ICP备2021014372号
人工客服
微信扫一扫直接聊
无需加好友