程聚宝
程序员
软件外包公司
项目案例
发布需求
人才入驻
登录
注册
原"程序聚合"
工作台
程序员
软件开发公司
软件案例
发布需求
开发者入驻
帮助文档
小程序
登录
注册
原“程序聚合”
音视频 软件定制 案例
行业:
全部
电商
企业内部管理
社交
在线教育
金融
旅游
云计算
医疗健康
人工智能
物流仓储
外卖跑腿
企业服务(saas)
物联网
VR/AR
区块链
内容平台
出行
安全
人力资源/HR
大数据
广告营销
农业
搜索
音视频
生活服务
汽车
游戏/电竞
工业互联网
智慧数字孪生
能源
零售/新消费
政务服务
房地产
展开
收起
载体:
全部
安卓APP
IOS APP
网站
小程序
H5
爬虫/脚本
插件
游戏
Windows应用
Mac应用
嵌入式软件
硬件
电视应用
云服务/云平台
算法模型
框架或代码包
车载应用
操作系统
鸿蒙应用
展开
收起
程序聚合
软件案例
音视频
全部
分类筛选
音视频-新维短剧
随着短剧 “短平快、强冲突” 的内容形态在国内爆发,海外市场(东南亚、欧美、拉美)成为新增长点。本项目聚焦 “精品短剧出海 + 多渠道分发推广运营 + 付费变现” 核心模式,面向全球用户提供涵盖多种热门语言和字幕翻译、本地化的短剧内容服务以达到最佳观剧体验,覆盖 “免费看广告 + 付费解锁全集 + 会员订阅” 三种变现路径, ,目标打造海外头部短剧聚合与分发平台。
音视频
Java、MyBatis、MySQL、R...
dida语音
1、项目整体基于Spring Boot 2 + Spring Cloud 构建,使用eureka做为注册中心,使用Apollo做为配置中心,整个产品拆分为帐户、直播、礼物、勋章、游戏、搜索、公会平台、管理平台、营销平台、活动平台等多个服务模块,进行分布式部署和运维。 2、使用MySql做为数据库,业务接口使用Redis缓存提高查询效率和接口性能,使用MongoDB和ES对数据做多维度终态聚合,方便快速索引完整数据。 3、引入RabbitMQ,解耦业务流程,如广播登录事件在独立业务场景及活动端处理数据,使用延迟消息队列进行直播有效性认定等 4、使用XXL-JOB进行定时数据刷新及聚合,包括列表缓存数据刷新,过期数据清理等。 5、基于EMQ与客户端进行实时通信及消息广播,如房间送礼、全局跑马灯,点歌互动等。 6、使用第三方声网和即构进行直播和聊天室服务,包括语音直播、语音聊天室、视频直播、视频聊天室以及Unity游戏中的实时语音通信。 7、使用第三方融云进行IM实时消息聊天,以及部分事件通知。 8、使用第三方数美进行业务风控识别,包括IM聊天消息、用户文字动态、直播间公屏消息、用户昵称等文字风控审核,用户动态图片、用户头像等图片风控审核以及语音及视频直播、聊天时的旁路流实时审核,确保线上业务风控稳定。 9、使用第三方极光推送、短信推送以及自己的站内信功能进行活动通知、事件触达、异步消息、营销类通知消息等功能。 10、基于APP埋点及业务行为数据进行大数据离线标签清洗,配合运营侧进行营销平台功能实现,包括老用户召回、精准活动推送、个性化直播间及聊天室推荐等。
社交、音视频
Java、Kubernetes、MySQ...
Cooraft
Cooraft 将人工智能的力量带到您的指尖,将普通图像转变为令人惊叹的艺术作品。借助 Cooraft,您可以用有趣的表情为脸部照片制作动画,并创建艺术表情符号。您还可以将各种艺术风格应用于您的照片,从 3D 卡通到古典绘画。除了风格化肖像之外,Cooraft 还可以将各种输入(例如草图、绘图、绘画和线条艺术)转换为逼真、3D 或艺术灵感的新渲染。
社交、音视频
Kotlin、Android Jetpa...
亿级用户在线播放器产品-MxPlayer
1. 参与设计并推进项目的模块化、组件化建设,解耦逻辑、提升开发效率,并针对各个模块落实责任人,加强代码管控; 2. 参与项目的品质优化和稳定性建设,例如:优化首页启动速度和卡顿问题、构建gradle task屏幕适配脚本等 3. 推进团队由Java向Kotlin逐步转型,推动每周学习分享活动,建立RD与QA之间问题复盘机制
音视频
Android SDK、EventBus...
商显一体机
该一体机产品基于MTK9630 Android11平台开发,并搭配windows OPS,可安装使用第三方Android应用,也可切换到搭配的OPS通道使用windows系统,同时支持USB-A/C口,HDMI/VGA/DP,有线/Wifi/BT等基础功能。可根据客制化应用于教育机、会议机、广告机等使用场景,覆盖教育、会议、广告等不同领域的需求。
人工智能、音视频
C++、Java
音箱-app
项目背景:由于设备本地按键和显示屏资源受限,本地操作很不方便。通过手机app,来控制设备,提高用户的体验。 功能:设备发现,设备连接和断开,给设备OTA升级,控制设备音量,音效,显示屏亮度;DAB,FM,蓝牙,USB,HDMI,Auracast RX/TX等通道控制;问题排查手册,用户使用手册,Bass+等
音视频
Java、Kotlin、Jetpack、...
M3U8 视频批量下载与合成工具
使用技术(1-4 个) Python、aiohttp、FFmpeg、正则表达式 业务和功能介绍 立项背景和目标:针对基于 M3U8 协议的网络视频,解决其批量下载与格式合成的需求,实现高效、稳定的 TS 片段下载及 MP4 格式合成,支持并发控制、失败重试,提升视频下载的成功率与效率。 软件功能、核心功能模块的介绍: M3U8 地址提取模块:从视频播放页动态提取 M3U8 链接,适配不同网站格式。 M3U8 文件处理模块:下载并解析 M3U8 文件,递归处理嵌套 M3U8(如清晰度分级场景)。 TS 片段异步下载模块:基于异步编程实现高并发下载,支持失败重试与进度展示。 视频合成模块:调用 FFmpeg 将 TS 片段无损合成为 MP4 视频。 环境初始化模块:自动创建存储目录,检查 FFmpeg 环境依赖。 业务流程、功能细节描述:用户配置视频播放页 URL 和本地保存路径后,程序自动提取 M3U8 地址→下载并解析 M3U8 文件(处理嵌套逻辑)→异步并发下载所有 TS 片段(含失败重试)→最终调用 FFmpeg 将 TS 片段合成 MP4 视频,全流程自动化完成
音视频、生活服务
Scrapy
录制程序-Violetcam
一款基于Qt框架开发的高性能桌面屏幕录制软件。 简洁直观的用户界面,操作简单,上手零门槛。 强大的录制控制:支持开始、暂停、继续录制。 暂停/继续功能让您轻松跳过无需录制的片段,提升后期编辑效率。 内置高性能视频编码器,确保录制过程流畅稳定。 采用先进的H.264视频编码格式(根据实际二选一或写“先进的H.26x系列编码”)。 H.264编码保障了高清晰度视频的小文件体积,节省存储空间。 输出主流格式的MP4视频文件,兼容各类播放器和编辑软件。 录制帧率可调,满足从普通教学到高速操作的不同需求。 支持多种视频质量预设,从草稿到超清,随心选择。 录制结束后自动保存视频,防止内容丢失。 生成的视频文件体积小,便于通过网络分享和传输。 纯C\C++编写,底层优化,资源占用低,运行速度快。
音视频
C++
短视频平台应用-数字人视频生成工具
1、项目目标 基于AI生成技术、语音合成技术和人脸驱动技术,构建一套可量产、可私有化部署的数字人短视频生成软件,降低制作成本。 2、软件功能 该短视频数字人生成软件面向短视频创作与内容生产场景,支持用户上传照片生成数字人形象,并提供多风格语音库供选择。用户只需输入一段文本,系统即可通过语音合成和面部驱动技术自动生成口型同步、表情自然的数字人短视频。软件操作简单、无需拍摄和配音经验,可快速、低成本地批量创作短视频内容。
人工智能、音视频
C#、Python
智能工牌是一款便携式辅助工作并实时监控的项目-智能工牌
立项背景与目标: 为了解决移动作业,需要方便录像、记录信息、快速寻求解决方案、呼叫平台等问题。 软件功能、核心功能模块的介绍: 该项目分为基于Android平台的硬件设备及配套APP。 硬件端: 1.知识库问答功能,问答相关知识库的问题,方便问题及时得到解决方案; 2.语音对讲功能,方便与平台及时联系; 3.类似摄像监控一样的录像、实时推流、抓图等功能实现; 4.开发接口,供局域网Web调用,用来调整工牌配置参数。 5.语音识别、语音合成功能,可以使用语音进行知识库问答。 配套APP: 1.设备录像、实时视频、抓图等信息查看; 2.与设备进行对讲; 3.知识库问答,支持语音问答; 硬件设备开机上线后,就可以通过配套APP查看在线视频、抓图、和设备相互呼叫。 同时硬件设备也可以通过按键操作,发起呼叫、实时抓图。
音视频
Android Jetpack、Andr...
字幕大师工具
最简单高效的视频字幕制作软件 支持自动中英文语音转文字 支持字幕翻译,直接导出双语字幕 内置丰富的字幕背景条,更可DIY设计背景条 快速合并视频和字幕,直接导出加好字幕的视频 多功能字幕编辑器,支持导出多种格式的字幕文件 支持导出XML+PNG序列,无缝对接第三方视频制作软件
音视频
C++、Qt
墨香诗韵
1、 在数字化浪潮席卷生活的当下,传统文化的传承与传播面临着 “认知断层” 与 “体验单一” 的双重挑战。一方面,年轻群体对诗词文化的接触多局限于课本,缺乏沉浸式、生活化的感知场景,导致传统诗词的 “文化温度” 难以传递;另一方面,现有诗词类平台或偏向学术化的典籍查询,或聚焦碎片化的知识问答,未能将 “诗词赏析” 与 “生活美学” 深度融合,无法满足大众对传统文化 “可看、可感、可互动” 的需求。 2、 一、多维度精准检索:让诗人与诗词 “一查即得” 针对 “找诗词、识诗人” 需求,小程序构建全场景检索体系,支持按朝代、题材、关键词、诗人信息等多维度精准匹配,含 “模糊查询”(输入部分诗句匹配完整内容)。检索结果页呈现诗词原文、译文、作者简介及创作背景,平均耗时≤10 秒,成功率超 95%,解决 “想找却找不到” 的痛点。 二、个性化智能推送:让诗词 “懂你所爱” 依托用户行为分析模型,通过收集分析浏览、收藏、互动记录构建专属兴趣画像,实现 “千人千面” 推送:如向山水诗爱好者推王维、孟浩然作品,节日推应景诗句,情绪低落时推励志诗词。推送含原文、赏析与场景推荐,贴合用户需求,个性化内容点击率超 40%,二次互动率提升 30%,让诗词融入日常。 三、AI 大模型辅助:让诗词 “可懂可创” 小程序搭载经海量诗词语料训练的专属大模型,从 “理解”“创作” 双维度提供智能支持:理解端,用户可提问解析诗句意象、深层内涵、跨作对比,结合历史与作者生平延伸解读,准确率超 90%,破解 “读不懂、悟不深” 问题;创作端,支持按主题、风格、字数生成诗词草稿并提供优化建议,开放续写、对联功能,月均使用超 2 万次,分享率超 25%,让普通用户也能体验创作乐趣。 四、论坛社区 采用 Jweixin 搭建前端架构,深度适配微信小程序生态,保障主页、信息展示及论坛模块的流畅交互;后端依托 MySQL 数据库,高效存储诗词资源、用户数据及论坛内容,支撑多维度检索、个性化推荐与社区互动,兼顾数据安全性与读写性能。
音视频
SQL、JWeixin、jQuery
音视频短剧管理平台
1. 分布式微服务架构设计: 基于DDD领域驱动设计构建六边形架构微服务,将系统拆分为广告投放、音频处理、用户分析三大领域。核心服务采用Rust+Axum框架实现,包含自定义中间件链与请求上下文传播;运营平台基于Go+Fiber开发,使用sqlx与sqlc实现类型安全的数据库操作;后台系统基于Bun+Elysia+TypeScript构建,利用Bun:sqlite高性能数据库连接;MCN平台采用Kotlin+Quarkus实现反应式API。服务间通信使用Protocol Buffers与基于etcd的服务发现系统,实现请求追踪与熔断降级,服务间平均调用延迟降至12ms 2. 高性能容器化部署与CI/CD流水线: 设计基于Kubernetes 1.26的多集群架构,应用ArgoCD实现GitOps工作流,配合Drone CI构建完整CI/CD流水线。引入Kustomize管理多环境配置,实现canary与blue/green两种发布策略,部署时间优化至3分钟,版本回滚时间控制在30秒内 3. Rust音频处理核心引擎: 基于Rust+tokio异步运行时构建事件驱动架构,设计无锁数据结构与内存池优化音频处理流程,实现单节点处理10万并发连接,延迟控制在5ms以内,服务内存占用仅为同等Node.js实现的15% 4. AI语音识别与广告点位智能识别: 集成FunASR 2.0引擎与Whisper large-v3模型构建多模型融合的ASR系统,词错率(WER)低至4.2%。基于transformers架构设计上下文理解模型,识别语音内容中的自然停顿与主题转换点,实现精准广告点位自动标注,准确率达92% 5. 多级缓存与高性能存储设计: 采用MongoDB 6.0集群作为持久化存储,设计基于业务域的分片策略,配合基于Redis Cluster的三级缓存架构:L1本地缓存、L2分布式缓存、L3持久化缓存。引入BloomFilter过滤无效查询,缓存命中率提升至95%,核心API响应时间降至25ms 6. 流式音频处理管道设计: 基于FFMPEG 6.0封装自研音频处理库,支持AAC、MP3、FLAC等多种格式实时转码,实现SIMD指令集优化的音频特征提取算法,开发基于Tokio channels的流式处理管道,音频段切换延迟低至2ms,用户无感知过渡
音视频
Go、Rust、TypeScript
趣爪印APP-趣爪印
趣爪印APP 是爱宠人士记录有宠生活、分享养宠经验、发现有爱宠友的平台。 前公司自有平台,长期迭代。 APP功能主要集中在视频、图文、设备三大块。视频部分包括视频拍摄、视频处理、上传、播放;图文部分包括上传、显示;设备部分包括设备管理、定位数据接收、数据处理、地图展示。 此外还有后台管理系统,用于管理设备、订单。 具有商城功能的微信小程序,用于上架销售定位设备及其他宠物周边,充值等。
音视频、物联网
Java、Flutter、Spring ...
小程序-视频平台
项目主要负责对在线直播课程的再播放 项目职责 按照需求对界面进行设计 使用ajax技术获取后台的数据 与后端工程师配合实现数据交互 应用技术 采用前后端分离的开发模式 使用UniApp以及各插件完成小程序页面
音视频、内容平台
UniApp
音视频AI数据识别标注平台
该项目主要为将用于ai模型训练的各类音视频内容进行人工标注和审核,以优化ai识别的准确性。项目分为语音识别标注、语音合成标注和视频标注三大模块,平台需求包括音视频内容的可视化显示和操作,基于可视化音视频工具的点击、拖拽标注功能,以及质检模式下标注内容的核准、批注和修改。
人工智能、音视频
JavaScript、Vue
一站式音频处理与文字识别平台
1. 立项背景和目标 FunAudio是一个集成了语音识别(ASR)、文字转语音(TTS)和文字识别(OCR)功能的Web应用。项目旨在提供简洁友好的用户界面和强大的音频处理能力,满足用户在不同场景下的语音、文字转换需求,提高工作效率和信息获取体验。 2. 软件功能、核心功能模块的介绍 语音识别 (ASR) - 支持实时录音识别和音频文件上传识别 - 提供多语言支持(中文、英文、日语等) - 集成语音活动检测(VAD)技术 文字转语音 (TTS) - 支持多种语音类型(男声、女声及多语言) - 可调节语速、音调、音量参数 - 支持多种输出格式(wav、mp3、flac、aac) - 提供音频预览和下载功能 文字识别 (OCR) - 支持图片上传识别功能 - 多语言识别支持 - 文本提取和复制功能 - 边界框检测技术 3. 业务流程、功能路径描述 用户通过Web界面访问应用,可选择三大核心功能模块。以语音识别为例,用户可以选择实时录音或上传音频文件,系统进行语音转文字处理后展示结果,用户可进行复制或清除操作。文字转语音模块允许用户输入文本,选择语音类型和参数,生成并下载音频文件。文字识别模块支持图片上传,提取图片中的文字内容并展示。
音视频、金融
Python、Flask、Vue、PyT...
音乐/日记-音绪日记
开发背景: 公益项目,仅用于学习 1、提供音乐免费播放功能(接入api解析平台音乐) 2、提供日记功能 3、从项目开发中学习新技能,了解音频播放器业务开发的流程 功能介绍: 1、登录/注册模块 成本原因使用邮箱服务器实现账号注册验证 2、"喜欢","歌单","最近播放"模块 需登录才可使用,使用Redis存储 3、日记模块 需登录才可使用,考虑到日记的字符偏多,内存占用大,所以使用MongoDB存储,由用户指定一个字符密钥进行AES加密,该密钥不存储以确保数据安全 4、情绪模块 情绪设置放在首页便于快速设置,并结合当前时间段进行音乐推荐,并通过LLM接口向用户生成相应的安慰话语提供情绪价值 5、音乐,情绪,天气,相片,日记结合模块 日记存储最基础的文本或手写轨迹,用户可以选择性的添加音乐、日记中不同场景的情绪和天气以及相片,可以更加清晰地让用户记录日常,提高用户体验以及产品的独特性 6、定时关闭模块 提供15,30,45,60min关闭的快捷设置,同时支持自定义时长结束,均以min为单位,最少1min,最大1440min(24h) 7、在线反馈模块 当用户登录时反馈会自动带着用户的邮箱号,若反馈的问题或建议得以解决或采用并优化,会手动向该用户的邮箱发送感谢信以及处理完成通知 8、音乐搜索模块 使用异步请求确保多个音乐平台搜索结果快速显示 9、音乐下载模块 所有可播放的音乐都可以免费下载,进度会在一个小的播放状态面板上显示 10、音乐分享模块 允许自定义音乐名,歌词默认色,歌词高亮色以及背景色。允许添加"全屏播放"和"横屏播放"选项。创建分享后会自动保存一张带有二维码的音乐卡片图片,用户可以通过扫码识别方式在多个app上进行在线播放,在线播放提供"前往首页"和"下载app"功能,其余必要功能全都可以使用
音视频、生活服务
Python、Vue
直播音频助手Pro
当前直播行业竞争激烈,主播需高频次与观众互动。手动寻找并播放音效(如欢迎、感谢、掌声)会严重打断直播节奏,影响内容流畅性与主播专业性。现有解决方案或操作复杂,或需昂贵硬件支持。 通过集成VB-Cable等虚拟声卡技术,将软件音频输出单独路由至虚拟设备,供OBS等直播软件捕获,实现音效与人声/背景音乐的完美混音,无需更改主播原有物理设备设置。
音视频
Python
百度春晚摇红包项目
1. 立项背景与目标 背景:随着移动支付和红包文化的普及,春晚红包已成为互联网巨头争夺用户流量的关键战场。百度在2019年与央视春晚达成独家合作,旨在通过发放巨额红包(总价值超10亿元),吸引新用户、提升百度App和其矩阵App(贴吧、地图、百度钱包、好看视频、百度网盘等)的知名度和活跃度,并应对往年类似活动(如微信2015年、阿里2018年红包系统崩溃)的挑战。背景因素包括:百度需要突破搜索业务的局限,进军移动生态;同时,春晚作为国民级事件,能覆盖全球观众,提供巨大的曝光机会。 目标: 业务目标:发放总值9亿元的现金红包,包括1000万个20.19元红包、100万个88元红包等,并推广小度AI音箱等产品。 技术目标:处理高并发流量,峰值目标为每秒超过1000万次请求(千万级),确保系统稳定运行,避免类似往年红包活动的卡顿或崩溃问题。 用户体验目标:实现零故障互动,用户参与门槛低(摇一摇操作),完成“赚十亿”的小目标营销。 2. 核心功能模块 百度春晚红包项目涉及多个关键模块, 主要包括: 用户互动模块、红包发放与支付模块和高并发处理模块。 3. 整体业务流程 百度春晚红包项目采用分层架构和分阶段流程,确保从用户参与到底层处理的顺畅性: 整体流程: 互动分为四轮,每轮持续30分钟,总时长2小时。 用户流程:打开百度App → 进入春晚页面 → 摇一摇触发红包请求 → 系统验证并发放红包 → 自动入账百度钱包。 后台流程:请求入口 → 流量网关(拦截恶意请求) → 业务逻辑层(处理红包算法) → 数据库层(红包库存管理) → 支付网关。
搜索、音视频
Koa、Webpack、jQuery
1
2
3
4
帮助文档
Copyright @ 2021-2024 程聚宝 | 浙ICP备2021014372号
人工客服
微信扫一扫直接聊
无需加好友