音视频软件定制 | 软件外包案例-程聚宝

万能水印相机打卡

本项目为外勤工作场景打造的水印相机工具，旨在解决传统照片无时间、地点、人员信息，导致考勤、工程验收、巡检记录无法溯源、易篡改的问题。业务背景覆盖建筑施工、物业巡检、物流配送、环卫检查、外勤打卡等行业，用户需要快速拍摄带可篡改水印的现场照片，作为工作留痕与合规凭证，提升管理效率与数据可信度。

音视频

AndroidX、DevEco Stud...

直播平台-嗨播谷

一站式短视频生态APP全部开发完成，集内容浏览、视频创作、直播带货、流量分润于一体。完善创作者激励、商家入驻、订单交易系统，适配多端流畅运行，依托智能分发机制高效引流，为个人创作者与商家提供完整流量变现渠道。

生活服务、音视频

PHP、Laravel

Go+FFmpeg 抖音财经股票指标视频自动化生成系统

一、项目简介本人自1993年接触证券市场，2004年尝试用PHP开发自动化指标筛选程序，因并发性能限制，批量数据运算耗时过长。2015年转向Go语言，依托原生并发模型，将运算耗时由半小时优化至1分钟内，期间对比Python、Julia等语言后，最终选定Go为主力开发语言。 2025年启动本项目：基于自研股票指标函数体系，搭建财经短视频自动化流水线，将量化指标可视化内容批量生成视频并适配抖音平台分发标准。技术迭代上，初期采用fogleman/gg生成PNG图片序列，再由FFmpeg合成视频。经持续优化，现绝大部分素材渲染直接交由FFmpeg完成，仅在FFmpeg耗时过高、分辨率无法满足需求时，回退使用GG生成静态图片。整套系统已实现数据解析、图表渲染、视频合成一站式自动化。二、业务功能批量指标运算：批量读取量化数据，自动运算生成股票指标信号。数据可视化渲染：支持FFmpeg滤镜实时绘图，兼容GG静态PNG绘图兜底方案。短视频自动合成：按平台规范自动合成视频，适配抖音等主流短视频平台分辨率与码率要求。全流程自动化调度：从数据到视频全链路自动化，支持持续产出可视化素材。智能渲染链路切换：根据耗时、画质需求，自动选择最优渲染方案（FFmpeg主链路/GG兜底）。三、技术栈 Go、FFmpeg、fogleman/gg、股票量化接口、自动化调度脚本

金融、音视频

Go、FFmpeg

基于多模态与大模型的短视频智能分析 Agent 系统

针对短视频平台内容爆炸式增长带来的推荐精准度不足、用户理解粗粒度等问题，设计并实现一个融合多模态理解与大语言模型决策能力的智能 Agent 系统，实现视频内容自动分类与动态用户画像构建，支撑个性化推荐、广告投放与内容治理等核心业务。技术栈：Python, YOLOv8, Whisper, Qwen-VL, LangChain, Kafka, Flink, Milvus, Neo4j, FastAPI, Docker, Kubernetes

音视频、社交

Python、OpenCV、PyTorc...

触发式自动讲解系统-循位智讲

场景触发式讲解系统是一款面向线下实体场景的自动语音导览应用。它通过持续追踪移动设备的 GPS 位置，在设备靠近预设的讲解点位时自动播放对应的语音讲解音频，无需人工干预，实现"人走到哪里，讲解跟到哪里"的沉浸式导览体验。

旅游、音视频

Java、Vue

智能工牌系统-智能工牌终端

智能工牌系统是一款基于ESP32-S3-WROOM-1-N16双核主控设计的企业级智能穿戴终端，面向中大型企业现场作业人员实现语音录音及音频文件智能下传等核心管理功能，系统由智能工牌终端、云平台、管理后台及移动端APP四部分组成。终端侧集成ES8388音频Codec与MEMS麦克风，支持长按录音后自动以MP3格式缓存至TF卡，并通过Wi-Fi STA模式连接企业局域网，采用三级下传策略（SOS录音实时上传、普通录音闲时批量上传、大文件断点续传）配合自适应带宽探测算法将音频文件可靠上传至阿里云OSS存储，同时具备Wi-Fi指纹定位、一键SOS上传GPS与现场录音、电子围栏越界告警及NFC自动考勤打卡功能；云平台基于阿里云IoT Core实现设备接入与设备影子同步，OSS管理音频文件归档，规则引擎联动告警与事件处理；管理后台采用Vue3与Leaflet地图提供实时人员定位热力图、音频回放与下载、电子围栏绘制及任务工单闭环管理；移动端基于Flutter实现管理员实时监控与SOS响应以及员工端签退打卡与工单接收。

企业内部管理、音视频

Vue

一帆视频

一帆视频是一款集移动端原生应用与Web 管理 / 播放平台于一体的视频服务产品，核心采用 Swift 开发 iOS 客户端，Vue.js 开发 Web 前端（含用户端、运营管理后台），后端配套接口服务支撑数据交互、视频处理、播放调度等核心能力，实现视频上传、转码、存储、分发、播放、管理、权限控制等完整业务流程。

音视频

Swift、Vue

某些热成像项目

本类项目是基于非制冷红外探测器的成像模组项目。旨在实现低功耗、小体积、高质量图像以及视频接口高兼容性。本项目是团队合作项目，我主要负责FPGA工程架构设计、软核软件架构设计，并参与某些具体的算法/视频接口/外设驱动的实现及调试。

人工智能、音视频

C++、Python、VHDL/Veri...

语音转文字

开发环境：golang，gin 本程序主要利用阿里云提供的录音文字转译功能API，对有需要的录音进行文字转换，用于新规划的关键字、词自动QC系统，增加QC速度主要用于技术验证，在批量使用过程中发现单通录音文件在转换文字后，接线员与客户两个角色无法安全分离，不符合规划需求

社交、音视频

Go、Gin

CCMS3.0 API

开发环境：python Django gevent nginx mysql 为正在使用的CCMS3开发第三使用的API接口，分为两个分支，普通的web api接口，基于websocket的长连接API接口。本人完成架构设计，API代码及文档（错误代码文档、使用文档）编写（数据、功能整理与归类由别的同事完成）。关于CCMS API简介： API Service 旨在将 CCMS 的服务（接听电话、外呼电话等）进行标准化封装，允许客户将呼叫中心功能模块整合到自己的应用系统（如CRM 等系统）中，降低呼叫中心平台的使用门槛，提升呼叫中心平台的灵活性。

音视频

Python、Django、MySQL、...

IVR Server

开发环境：centos，python，redis，mysql，agispeed，asterisk1.8 用于为客户提供专业的IVR服务以及survey功能 IVR主要功能是语音导航,通过按键的输入,走不同的语音提示流程,或获取用户的输入信息. IVR的配置,先要配置好IVR项目,然后根据IVR项目的需求,启用不同的模块,最将各个模块连接在一起,实现整个IVR

音视频

Python、MySQL、Redis

本地HiFi无损音乐播放器-自研音频DSP音效APP-音乐播放器

业务背景针对安卓手机原生播放器音质差、SRC重采样底噪大、缺少专业调音的痛点，自研本地无损音乐播放器，仅支持本地歌曲文件播放，无在线音乐资源，规避版权风险，主打HiFi无损音质输出。核心功能模块 1. 解码层：集成FFmpeg多格式无损解码，支持MP3/FLAC/WAV/DSD音频文件，区分硬解MediaCodec与自研软解双链路； 2. 音频输出：Oboe底层音频流，支持USB DAC独占直通模式，绕过系统强制48kHz SRC，原生44.1kHz无损输出，消除转换底噪； 3. 专业DSP音效引擎（C++ Native实现）：20段参量PEQ均衡器，自定义Q值0.4~3.0可调；内置高通HPF滤波、全局峰值限制器、立体声M/S拓宽、Haas声场3D丽音、微量短混响，解决人声尖锐齿音、低音单薄、乐器分离度差问题； 4. UI交互：Compose自定义滑动进度条、唱片旋转联动控件、20段EQ独立调节滑块，底部导航多页面切换，独立音效设置弹窗； 5. 配套工具：本地MP3 ID3标签自动识别、批量修正歌手/歌曲名，音频频谱可视化绿黄红电平监测，熄屏后台稳定播放无卡顿；业务流程本地扫描读取手机存储音频文件→标签解析分类列表→解码输出PCM原始音频→Native DSP全套音效处理→Oboe低延迟音频流输出至耳机/USB DAC，完整实现高保真离线音乐播放。

音视频

C++、Java、Kotlin、Pyth...

视频对抗攻击系统

1、立项背景和目标：针对主流视频识别系统开发对抗攻击能力，测试深度学习模型的鲁棒性与安全性。项目目标是实现视频帧级对抗样本的自动化生成，验证目标模型在对抗扰动下的误判率。 2、软件功能和核心模块：支持CPU和GPU双版本运行，包含视频解码与帧序列提取、基于TensorFlow的对抗扰动生成（FGSM/PGD等算法）、扰动后视频重组编码、攻击效果评估（扰动强度、PSNR、攻击成功率）四大模块。 3、业务流程：输入待测试视频 → 帧序列提取 → 选择攻击算法与参数 → 逐帧注入对抗扰动 → 视频编码输出 → 喂入目标识别模型测试 → 统计攻击成功率与扰动质量指标。

电商、音视频

FastAPI

痕迹

痕迹软件介绍 1. 立项背景和目标在物质世界高速发展的今天，人类社会正悄然进入精神价值觉醒的时代。人们物质生活日益丰富，却普遍面临精神空虚、意义缺失的问题：做好事往往转瞬即逝、难以坚持、缺乏社会认可；传统公益存在透明度低、参与感弱的问题；短视频平台以娱乐为主，正能量内容碎片化，难以形成持续的精神成长闭环。痕迹软件正是为解决这一时代痛点而诞生。项目核心目标是：通过移动互联网技术，让每一次真实善行都被记录、被看见、被激励，帮助亿万用户逐步养成“精神层面追求”的日常习惯，最终构建一个“爱有痕迹、价值可见”的全球精神价值记录与传播平台。长期愿景是：让“痕迹榜单”成为一个人人生价值的直观表现，激励每个人为活得更有意义而主动为世界贡献力量，推动世界更加充满爱、更加文明、让每个人活得更加幸福。 2. 软件功能、核心功能模块的介绍痕迹App是一款专注于记录真实善行的短视频社交平台，目前已完成MVP开发，核心分为四大板块：首页：短视频推荐与直播页面以算法推荐其他人发布的真实公益短视频为主，支持点赞、评论、分享，并通过#助人为乐#等话题形成正能量内容生态。用户可直接发布自己帮助他人、参与公益的真实视频。榜单：价值激励核心模块包含个人榜、企业榜、影响力榜、社区榜样等。用户通过发布善行视频、参与公益获得“痕迹数”和“爱心值”，实时上榜。榜单最终将成为全球人生价值的直观表现，激励用户持续行善。账本（阳光账本）：透明度保障模块记录爱心善款的收入、支出和具体用途，实现100%资金透明追踪。每一笔捐赠都可关联对应善行视频，让公益真正“看得见、信得过”。我（个人中心）：精神成长系统展示个人痕迹数、关注、粉丝、影响力值、公益等级（Lv.系统）和勋章。用户可在此查看自己的成长轨迹、接收消息、管理设置，形成完整的个人精神价值积累闭环。此外，软件支持实名认证、AI辅助内容审核，确保所有视频内容的真实性与正能量导向。 3. 业务流程、功能路径描述用户使用痕迹App的主要流程如下：注册登录 → 通过手机号/用户名快速注册，完成实名认证。首页浏览与创作 → 浏览推荐的公益短视频，受到触动后拍摄并发布自己的真实善行视频（支持添加话题、位置等）。互动与积累 → 其他用户点赞、评论、分享；系统根据视频质量和互动数据自动计算“痕迹数”和“爱心值”。榜单激励 → 用户的善行数据实时进入个人榜/影响力榜，形成正向激励循环。公益参与与透明追踪 → 通过平台进行爱心捐赠，资金进入阳光账本，并可关联具体善行视频查看用途，实现全程透明。个人成长闭环 → 在“我”页面查看自己的精神成长轨迹、解锁公益等级与勋章，持续获得成就感与社会认可。整个业务流程形成“记录善行 → 获得认可 → 积累价值 → 持续激励”的完整正反馈闭环，让用户从“偶尔做好事”逐步转变为“一生以爱为本”的精神

内容平台、音视频

Java、Composer、Androi...

视频问诊app-健康咨询

这是一个医疗在线问诊系统，核心功能是医生与患者通过视频进行远程咨询。前端（App） UniApp（Android原生插件）,后端 (Spring Boot 3)视频会议SDK,Android原生插件集成,患者提交咨询 → 后端创建云屋会议号 → 保存到患者表 ↓ 医生收到咨询（已预先绑定独立账号）→ 进入会议 ↓ 患者凭会议号进入同一会议 → 视频通话开始。关键业务规则:一医一患：每个会议号最多 2 人（1 医生 + 1 患者），第 3 人会被踢出会议号隔离：不同会议号之间互不影响医生优先：医生先入会，患者后入会每咨一议：每次咨询创建新会议号（非复用），患者在提交咨询时即生成。

音视频

Java、UniApp

热榜视频分析创作系统-热榜视频分析创作系统

1、用户根据关键词，检索选择抖音垂类热榜视频，获取垂类热榜视频粉丝画像详细数据。根据粉丝画像详细数据，选择要参考的热榜视频。 2、选择扣子工作流，进行二次创作，如视频详情解析、视频文案解析、视频文案改写、视频二次创作等等。 3、热榜视频一站式分析和创作，极大提升视频创作效率。

音视频、内容平台

Python

高性能 QUIC 通信框架设计与实现 (AI 辅助全栈实现)

项目背景：该系统适用于弱网、高丢包、高抖动等复杂网络环境下的实时数据与音视频传输场景，涵盖多人会议、直播连麦、在线教育、远程协作、工业采集、车载回传、安防监控及物联网边缘上传等业务。同时，该系统可作为中心转发与媒体中继节点，承担上行流的接入、解析、转发、路由和分发能力，并支持视频流与结构化业务数据在服务端的统一接入、存储与后续处理，从而提升整体传输效率、系统稳定性与用户体验。

音视频

C++、OpenGL、OpenSSL

车载智能座舱音视频娱乐系统-车机影音平台-车机音影平台

立项背景：随着智能汽车普及，车主对车内影音播放、多媒体交互需求提升，项目目标搭建适配小米座舱的一体化音视频播放底座。核心模块包含多路音视频解码、车载多媒体播放器、蓝牙音源接入、音效均衡调节。车机识别U盘/蓝牙/车联网流媒体音源，调用FFmpeg完成多格式音视频硬软解，用户通过中控屏切换音源、调节环绕音效，系统适配车载降噪算法，同步联动车内扬声器分区发声，满足行车影音娱乐需求。

音视频、汽车

GDB、Android SDK

安防集成平台

安防集成平台开发（C#、WPF、C++，MFC,VS2019，BOOST，FFMPEG，LIVE555, MPEG4，H.264，GB28181，SQLSERVER2016，插件）集成接入各厂家视频相关平台、设备、协议，提供统一对外接口SDK，给上层应用或第三方客户二次开发使用。实现功能：实时视频播放、远程录像播放、本地文件播放、播放控制、PTZ操作、数字PTZ操作、图像显示调整、本地抓取图像、本地抓取录像、录像查询、录像下载、音视频原始码流、标准码流、解码后码流输出、报警、电视墙视频切换等。

音视频、物联网

C#、C++、Microsoft SQL...

跨设备 P2P 实时音视频与协作

面向同一局域网或跨网络设备的实时协作与媒体共享,提供房间加入/发布/观看，支持屏幕/摄像头视频、麦克风音频与文本聊天同步分发；优先采用纯 P2P 传播，在需要时通过网关与信令增强连通性与可用性。房间与路由：主页/房间页/P2P 测试/设置等入口文本聊天：房间内消息广播与展示视频发布与观看：桌面端采集屏幕/相机并编码后 P2P 广播；浏览器侧 WebCodecs 编解码与渲染音频发布与播放：桌面端麦克风采集并广播；浏览器侧 WebAudio 采集/播放，接收端按序播放与积压控制网络连接与诊断：连接状态、Peer 数、监听地址与排障提示网关能力（可配置）：WebSocket 网关用于 Web/WASM 接入与片段请求

音视频

Rust、TypeScript、Vue、...

音视频 软件定制 案例

音视频软件定制案例