音视频 软件定制 案例

梵花田-梵花田
梵花田是一款专注于身心健康的应用,主要面向有睡眠困扰、焦虑情绪、需要放松和专注的用户群体。项目定位是提供高品质的白噪音、冥想课程、助眠故事等内容,帮助用户改善睡眠质量、缓解压力、提升专注力。 (业务模式) 采用 免费内容 + 会员订阅 的模式。用户可以免费使用部分白噪音和基础冥想内容,订阅会员后解锁全部冥想课程、原创助眠故事、高级混音功能等。 (核心功能介绍) 我将其后端核心功能分为以下几个模块: 声音模块 提供超过30种白噪音(如雨声、海浪、篝火、钢琴等),支持用户多轨混音(同时播放多个声音并独立调节音量)。 支持定时播放、收藏、最近播放记录。 冥想模块 包含 14天入门冥想计划,以及针对不同场景的主题课程(如“考前减压”、“职场焦虑缓解”、“睡前放松”等)。 记录用户的训练进度、连续打卡天数,支持课程评价。 睡眠助眠模块 提供原创的助眠故事(如“月光森林”、“海边小屋”等),配有舒缓的背景音乐和专业配音。 支持故事播放进度自动保存、定时关闭。 宝宝专区模块 专门为母婴群体设计,包含哄睡音乐、摇篮曲、睡前动画和短篇故事。 个人中心与会员模块 用户注册登录(手机号/微信)、会员购买与续费、历史记录、收藏夹、睡眠统计报告等。 后台管理系统 为运营人员提供内容发布(上传音频、配图、文字)、用户管理、数据看板(日活、播放量、会员转化率)等功能。
音视频、医疗健康
PHP、Laravel
音视频编辑引擎 WES 自动化测试平台-万兴喵影
WES 是公司中台部门自研的基于本地执行的 C++ SDK,主要实现时间线编辑、音视频处 理、特效添加以及各类音视频格式导出等功能。原先无中台自动化测试,依赖开发提供的 Demo 进行手工验证。个人主导从 0 到 1 逐步构建起自动化测试框架。
音视频
C++、Python
短剧 & 网文全链路内容服务平台(含分销 / 实验体系)
立项背景和目标:针对短剧与网文内容爆发式增长需求,搭建覆盖多端的全链路内容服务平台,实现内容分发、付费转化、广告变现及数据化运营的一体化闭环。目标是提升内容曝光效率与用户留存率,通过 A/B 实验优化产品体验,搭建分销体系拓展业务边界,支撑千万级日活用户的高并发稳定运行。 软件功能、核心功能模块的介绍: 内容分发模块:支撑短剧、网文多类型内容的个性化推荐,支持首页、单列、搜索等多场景内容展示,通过 A/B 实验框架动态调整内容样式与推荐策略。 付费与变现模块:集成短剧付费点播、广告变现(开屏、信息流)能力,对接 Pangle、IronSource 等第三方广告平台,实现广告精准投放与付费转化。 实验与运营模块:搭建 A/B 实验平台,支持多维度分组配置,实现不同用户组展示差异化内容 / 样式,配套数据埋点与效果统计。 分销结算模块:构建短剧分销后台,支持合作方管理、每日收入自动拆分、数据对账,保障分账数据准确与高效结算。 多端适配模块:IOS、安卓 APP 多端统一开发,保证跨端体验一致性与功能同步迭代。 业务流程、功能路径描述:用户从多端入口进入平台 → 后端通过 A/B 实验分组匹配差异化内容配置 → 前端渲染个性化内容页面 → 用户完成浏览、播放、付费 / 广告点击等行为 → 数据实时埋点上报至数据中心 → 结算模块异步处理分销收入拆分与对账 → 运营通过数据看板分析实验效果与业务数据,迭代优化内容策略与产品功能
内容平台、音视频
PHP、Laravel、MySQL、Re...
OTT直播流媒体编码服务器-LiveEncoder
1. 立项背景和目标 为内容供应商如体育联盟、电影电视产业、音视频行业提供专业卓越的音视频质量,采用高精度编码技术、广播级视频传输应用设计,在分发过程中最大限度保留原始视频的图像细节、清晰度和色彩梯度,成为提供OTT/IP视频平台的关键头端组件。 2. 主要功能和特性 - 多信源接入 支持开放标准的系统输入流协议, 支持采集卡(Decklink、AJA等)、Webcam、NDI、TS over TCP/UDP/RTP/RTMP/HTTP/HLS/SRT/ZIXI等。 - 多协议输出 支持开放标准的直播流协议,如RTMP/RTP/SRT/ZIXI/HLS/MP4等,可以接驳各种主流的流媒体服务器。 - 广泛的数据服务 除了音视频,提供标准的数据服务,如隐藏式字幕(CC 608/708)、DVB Subtitle、Teletext、SMPTE2038、广告信号SCTE-104/35透传/转换/插入等,为视频提供合规、增值服务。 - 可靠的冗余设计 提供输入输出信号级别、工作流级别、节点实例和设备级别的故障转移冗余设计,支持自动手动、手动、预设方式的1+1/N+M故障转移方式。 3. 业务流程 工作流:工作配置 -> 输入 -> 预处理 -> 编码 -> 输出 - 工作配置 音视频格式,编码参数设置,数据支持等模版 - 输入 接收客户提供的信号,分解信号内容 - 预处理 如果需要,解码成工作配置的音视频格式,解析各种包含在信号里的数据如字幕、广告点,添加台标,等 - 编码 根据编码参数设置编码成输出格式,支持CPU/GPU编码 - 输出 交织并封装音视频,支持各种流媒体协议输出
音视频、企业服务(saas)
C++、Node.js、TypeScri...
某政府单位电视监测业务仿真测试平台
同时操控多个测试测量仪器和前端(待测物),使用多个通讯协议; 模板化复杂测试,节约大量人力成本和时间成本; 支持人工定制化,控制各测量仪器对前端进行自定义测试; 多线程以及线程间同步, 支持同时测试多台前端
音视频
C#、C/C++、Microsoft P...
基于 Java/Go/Vue/Flutter 技术栈开发的全平台短剧系统-盾卫短剧
盾卫短剧是一款基于 Java/Go/Vue/Flutter 技术栈开发的全平台短剧 APP,面向安卓、iOS 双端用户,提供一站式短剧内容消费服务。系统核心覆盖短剧全链路业务:用户可浏览海量短剧内容、按分类 / 热度筛选剧集,支持在线高清播放、选集续看、收藏追剧;集成会员订阅、单集付费、充值打赏等商业化功能,满足用户付费追剧需求;同时搭建完善的用户中心,支持账号管理、订单查询、观看历史、消息通知等个性化服务。 后台配套完整运营管理体系,可实现短剧内容上传、审核、上架、分类管理,用户权限管控、订单结算、数据统计分析等功能,支持多维度运营配置,助力平台高效运营。系统兼顾流畅的用户体验与稳定的高并发承载能力,为短剧内容平台提供从内容分发到商业化变现的完整解决方案
音视频、内容平台
Go、Java
基于java/vue 开发的直播管理系统-筛赚直播
本项目是一套全栈式直播电商 / 娱乐直播系统,基于 Java+Vue 技术栈搭建,采用 SpringCloud Alibaba 微服务架构,支持高并发、高可用的直播场景,可满足娱乐直播、电商带货、才艺展示等多场景运营需求。 系统核心功能覆盖直播全链路:支持主播开播、连麦 PK、礼物打赏、弹幕互动、直播间管理;用户端可实现观看直播、送礼评论、关注订阅、购物下单;后台提供主播管理、用户管理、礼物管理、订单结算、数据统计、权限管控等完整运营模块,同时支持多终端适配、高并发承载与弹性扩容,为直播平台提供一站式技术解决方案。
音视频、企业服务(saas)
Java、JavaScript
AI智能写歌创作平台
具体功能模块: AI 驱动的全维度音乐创作体系: 双模式创作:支持AI 作词写歌、灵感写歌双模式,搭载 AI 歌词优化、一键生成功能,适配零基础爱好者与专业音乐人多元需求; 多维度定制:提供风格标签、人声性别、参考音乐、明星声音等参数定制,支持创作参数智能优化,精准匹配不同创作构想; 实时预览反馈:实现边生成边播放的预览机制,完成创作全流程实时反馈,提升创作体验与效率。 作品全生命周期管理: 支持作品检索、编辑、续写、分享等功能,打造便捷的作品运营体系,方便用户管理创作成果; 版本管理与数据沉淀:记录创作历史与版本迭代,辅助用户复盘优化,沉淀个人创作资产。 全链路商业变现服务: 一站式商业服务:提供全网发行、版权注册、商用授权、伴奏 / 乐谱制作等服务,打通作品变现通道; 商业化运营体系:搭建标准化付费与会员体系,配套订单、创作次数精细化管理,实现平台可持续运营。 多端适配交互: web 端:提供专业级创作界面,支持复杂参数调节与作品深度管理; 移动端:轻量化创作入口,支持随时随地灵感捕捉与快速创作,实现多场景无缝衔接。 主要功能描述:平台以 “AI 赋能创作 + 全链路商业化” 为核心,构建从灵感输入到商业变现的完整闭环:通过 AI 技术降低音乐创作门槛,让零基础用户也能快速生成个性化作品;通过完善的作品管理与商业化服务,帮助音乐人实现作品价值落地,既解决了传统创作模式的效率与门槛问题,又打通了创作到变现的最后一公里,成为音乐创作领域的智能化标杆平台。
人工智能、音视频
Java、Vue
AI工作流自动化SaaS平台
一、立项背景与目标 随着 AI 大模型能力的快速发展,企业对"AI 能力即服务"的需求日益增长。本项目旨在构建一个 SaaS 化的 AI 工作流自动化平台,让用户通过订阅套餐获取积分,按需消费平台上集成的各类 AI 模型与组件服务(文本生成、图像处理、视频合成、音频转写等)。项目核心目标包括:提供灵活的套餐订阅与积分计费体系、支持多租户隔离的 B2B 模式、构建可扩展的 AI 组件与模型管理后台。 二、核心功能模块 系统采用 FastAPI + MongoDB + Redis 后端 + React 18 + Ant Design 5 前端的技术架构,分为以下核心模块: 1. 系统管理模块(module_admin) 用户、角色、菜单、部门、岗位、字典、系统配置等基础 RBAC 权限管理,基于 RuoYi 框架改造,已全面迁移至 MongoDB(Motor 异步驱动)。 2. AI 服务管理模块(module_package) 管理 AI 模型(多通道路由、厂商品牌标识)、模型别名、功能组件库、组件与模型关联关系、定价模板(按 quality/quantity/duration 等维度配置积分倍率)。 3. 套餐订阅模块(module_subscription) 套餐类型(月付/季付)、套餐定义(含服务项目与积分额度)、用户订阅管理(聚合视图 + 明细记录双表模式)、积分体系(套餐积分/购买积分/赠送积分,支持月度重置与滚存)、套餐升级(新购叠加模式)。 4. 支付模块(module_payment) 集成 Stripe 与 Airwallex 支付网关,支持订阅制 Checkout、自动续费、Webhook 回调处理。 5. 定时任务模块(module_task) 套餐过期清理、积分月度重置、购买积分过期、超时订单取消等后台调度任务。 6. 多租户体系 采用共享数据库 + tenantId 字段方案,所有业务集合均支持租户级数据隔离。 三、业务流程与功能路径 用户订阅消费主流程: 用户注册 → 系统自动分配免费默认套餐 → 用户浏览套餐列表选择升级 → 通过 Stripe/Airwallex 完成支付 → 系统创建购买记录与用户套餐明细 → 用户获得对应积分额度 → 用户在前端选择 AI 组件与模型 → 系统根据基础积分×各维度倍率计算最终消耗 → 按优先级(叠加积分→当前套餐积分→购买积分)扣减 → 调用 AI 服务返回结果。 套餐升级路径: 用户发起升级 → 新购高级套餐 → 原套餐标记为 SUPERSEDED(剩余积分保留叠加至新套餐)→ 新套餐生效,积分合并可用。 管理后台路径: 管理员通过后台配置 AI 模型与组件 → 设置定价模板(维度与倍率)→ 关联组件与模型 → 创建套餐并绑定服务项目与积分额度 → 发布后用户端可见可购。
音视频
Python、FastAPI、Redis...
自动剪辑视频工作流
一、立项背景和目标 随着短视频电商的快速发展,带货视频需求量激增,传统人工剪辑存在效率低、成本高、产出不稳定等痛点。运营团队每天需从多个平台采集素材视频,经过下载、精剪、配音、字幕、水印等多道工序才能产出成品,流程高度依赖人工,重复劳动多且容易出错。 本项目旨在构建一套智能视频剪辑工作流系统,将任务管理、自动化编排与后端微服务相结合,实现从素材采集到成品输出的全链路自动化。核心目标:大幅提升视频生产效率、降低人力成本;借助 AI 大模型实现智能场景评分与内容筛选,保障剪辑质量;通过标准化流水线确保产出视频在时长、画幅、字幕、配音等维度上的一致性。 二、软件功能与核心功能模块 系统采用微服务架构,由三大核心服务构成: 1. 视频下载服务:支持抖音、快手、B站、YouTube 等主流平台的视频采集,自动转码为标准格式并提取元数据,为后续环节提供规范化输入。 2. 智能剪辑服务:核心处理引擎,包含七步流水线——速度调整、智能精剪(场景检测 + AI 评分 + 最优选取)、9:16 竖屏裁剪与镜像翻转、字幕翻译烧录、背景模糊填充、BGM 替换与音量调节,将长视频自动精剪为符合投放标准的竖屏短视频。 3. 视频合成服务:负责成品的多层合成,包括水印、Logo、主副标题、分段文案字幕、数据截图定时叠加,以及 TTS 口播语音混音,输出最终成品。 辅助模块包括:字幕处理(AI 硬字幕检测 → 嵌入字幕提取 → 语音转写,三级降级)、双通道翻译、文案智能分割与时间轴分配、集中式配置管理等。 三、业务流程与功能路径 任务触发:运营人员在任务管理平台创建任务,填入视频链接、文案、标题等信息。自动化工作流定时轮询,检测到新任务后启动处理流水线。 素材获取:工作流调用下载服务,自动采集并转码原始视频,返回标准化素材。 智能剪辑:素材自动流转至剪辑服务,系统进行场景检测,调用 AI 大模型对各场景进行商品相关性评分,选取最优场景组合无缝拼接,再依次完成画幅适配、字幕处理、背景模糊、BGM 混音等后处理。 成品合成:剪辑后的视频连同文案、标题、截图等素材传入合成服务,系统完成文案分割、TTS 口播生成、多层视觉与音频元素合成,输出成品视频。 状态回写:合成完成后任务状态自动更新为"剪辑完成",运营人员可直接取用投放。 整条链路实现了从任务创建到成品交付的全程自动化,将原本数小时的人工剪辑缩短至分钟级完成。
电商、音视频
Python、FastAPI、PyTor...
WaveCV
在RK3676的板卡上,智能摄像头NVR,后续可配置,授权切换到不同的具体产品。包括 人脸捕捉和识别(8人,30FPS) 行人det+动作识别pose+行为分析(22FPS), 车辆det+车牌det+车牌号码识别(22FPS), Heat Map (热力图渲染输出) Real-time People Counting (实时人员统计) Suspicious activity monitoring (可疑活动监测) Object detection & tracking (物体检测与追踪) People tracking (人员追踪) Vehicle detection & identification (车辆检测与识别) Vests and helmets (反光背心与安全帽检测) Fall Detection (反光背心与安全帽检测)
物联网、音视频
C++、Python
远程云桌面-客户端&服务端
通过客户端连接远程云桌面服务端,用户可以像操作本地机器一样操作远程桌面,具有文件传输,剪切板相互拖拽,可动态增减桌面显示器数量,通过高效的编码方案实现高帧率高画质低带宽的桌面体验,适配windows桌面客户端、linux桌面客户端,国产化桌面客户端
云计算、音视频
C++
车载播放器SDK
基于现有C++端提供的API实现完善的Android 播放器SDK,并与知名的车载企业播放器集成,最终发布到某知名车企车载平台。 1.基于高通某高级车载芯片,视频采用硬解码 2.支持常见的播控功能,播放,暂停,倍速,SEEK 3.支持AudioFocus,音效渐进检出 4.支持使用统一API,支持多种歌词格式 5.支持企业定制的16声道音频播放 6.支持静态和动态音效的设置 7.支持前端组动态设置音效,后端设置成组内两个声道独立的声道音效设置
音视频、汽车
C++、Java
用于批量下载Kemono帖子内容的高度可自定义性的命令行工具-KToolBox
该项目是一个用于批量下载 Kemono 中帖子内容的实用命令行工具,在 GitHub 上开源,500+ stars。 ## 功能 - 支持多文件并发下载 - API 调用和下载失败后 **自动重试** - 支持下载单个帖子以及指定的画师的 **全部帖子** - 可 **更新已下载** 的画师目录至最新状态 - 支持自定义下载的帖子/画师的 **文件和目录名格式**、**目录结构** - 例如帖子目录可设置为 `[2025-01-02]_TheTitle` 的格式,图片文件设置为按顺序的 `1.jpg`、`2.jpg` 等 - 当你希望将某作者的所有帖子图片统一存放至一个目录下,以便预览,可以使用 `job.mix_posts` 配置项搭配自定义文件名格式,你将得到几百上千张图片的目录 - 如 `[2025-01-02]_TheTitle_1.jpg`、`[2025-01-02]_TheTitle_2.jpg`、`[2025-01-02]_TheTitle_3.jpg` 等 - 支持排除 **指定格式** 的文件或仅下载指定格式的文件 - 例如当你不想下载庞大重复的 PSD 和压缩包文件时,可以在配置中排除 `.psd` 和 `.zip` 文件 - 支持按**文件大小**过滤下载 - 例如,如果你想在磁盘空间不足时避免下载大型视频文件,可以在配置中设置最大文件大小限制 - 你也可以设置最小文件大小,以跳过下载缩略图或预览图片 - 支持按帖子**标题关键词**过滤下载 - 例如你只想下载标题中包含“表情、効果音差分”的帖子,可以使用 `sync-creator` 命令的 `--keywords` 选项 - 如果你想排除标题中包含指定关键词的帖子,可以使用 `--keywords-exclude` 选项 - 支持按帖子发布日期**时间范围**过滤下载 - 能够解析帖子页面 HTML 多信息文本中包含的图片并下载 - 这类帖子特征为:浏览器页面刚进入时图片可能没有加载出来,且没有预览图 - 能够收集帖子页面中列出的**网盘链接**并保存至文本文件 - 可搜索画师和帖子,并导出结果 - 如果你希望自己处理画师和帖子数据,可以使用该功能导出 JSON 数据 - 支持全平台,并提供 iOS 快捷指令 - 纯 Python 分支可在 iOS 的 a-Shell 或浏览器的 Pyodide 上运行
内容平台、音视频
Python、Pytest、dotenv
CMS-内容管理和播放系统
各楼层和区域的房间及工位预订楼层地图显示,带有以颜色区分的实时预订状态。可自定义用户界面/用户体验。 今日会议目录来自访客管理系统的即将举行的会议活动。可自定义用户界面/用户体验。 仪表板显示实时 ESG 信息,例如室内空气质量、室内和室外温度、碳排放;实时香港天文台天气及风暴警报、RSS 实时新闻推送等。 在入口/接待区域播放宣传视频和电子海报。 提供数字标牌管理系统(CMS)以控制和监控多个办公地点的多个标牌播放器。功能包括内容管理、布局设计、排程与播放列表、播放器分组与监控、紧急消息广播等。 提供可自定义的数字标牌显示模板。 提供工业级数字标牌播放器(安卓和 Windows 平台),支持单路或多路视频输出,适用于各种尺寸和分辨率的液晶显示屏和拼接屏。 支持多媒体内容格式,如视频、图片、音频、文字、PowerPoint、Facebook & YouTube Live、流媒体视频、RSS 推送、实时天气信息、HTML5 等。 提供各种尺寸的 4K 专业显示屏。 与房间与工位预订系统及访客管理系统实现完全整合。
内容平台、音视频
C++、Java、JavaScript、...
客服系统话务管理
1、客服系统的功能越来越复杂,承接的业务越来越多,话务的复杂程度增加。为了应对这些问题设计并实现客服系统的话务控制功能。 2、对通话进行控制,封装媒体接口,对前端提供接口实现话务的转接、会议的控制、数据业务的存储、等其它功能控制的实现。 3、用户进入后进行控制使其进入智能控制流程,对办理各类业务时进行支撑,根据需要实现转人工,然后对各类功能进行实现。
音视频、工业互联网
C++
素描机器人
核心技术:路径规划,图像识别、图像处理、阴影处理响应式GUI设计、arduino uno.a4988.CncShield V4 项目描述:为实现图像处理,路径规划从而完成显示自动绘图的目标,需要设计一款简易素描机器人 实现流程: 使用Pycharm设计完成GUI控制的响应式界面程序。 在进行图像处理后,对处理后的图像线条进行路径规划,这里采取的路径规划方式为标点定位的方法,通过每次遍历九,个点来进行规划路径。 使用arduino传输电信号,通过十三个引脚完成对于cncshield电路板的控制通过step传递信号用a4988控制电机的转动,dec控制方向。 通过arduino程序将规划好的路径改为电信号传递给相关电路板。 电路板通过拆卸下的光盘驱动电机形成的X、Y左右两轴进行移动,从而完成绘画
音视频
Python
基于大模型的语音转写-音频转写
立项背景:公司内部本地部署使用。 核心能力:支持实时麦克风转写、本地音频文件转写、SRT 字幕导出,兼顾离线使用和高准确率需求。 业务流程:运行app,初始化后点击相应功能按钮,进行实时语音转写或上传音频文件进行文字转写,将文本导出。
音视频
Python
手机原生相机开发
业务: 手机自带相机的功能开发 功能: 原生安卓ui绘制,包含各种自定义view。 相机拍照功能实现,包括对焦,曝光,白平衡等一系列功能的实现。 相机录制功能实现,包含对视频编解码的处理,包含原生mediacodec的使用。
音视频
Java、Kotlin
基于STM32的有线视频分配器
1.此项目主要为满足商业场景下有线视频信号一分多路显示的需求。 2.产品主要包含MCU(STM32)和视频传输芯片,其中MCU通过模拟I2C与视频传输芯片的I2C寄存器进行交互,实现有线视频传输的接收与分配。接收芯片将接收到的一路视频信号,分成完全相同的4路输出,输出到不同的显示设备上。
音视频
STM32CubeIDE、STM32
  • 1
  • 2
  • 3
  • 4
  • 7
帮助文档   Copyright @ 2021-2024 程聚宝 | 浙ICP备2021014372号
人工客服