程聚宝
程序员
软件外包公司
项目案例
发布需求
人才入驻
登录
注册
原"程序聚合"
工作台
程序员
软件开发公司
软件案例
发布需求
开发者入驻
帮助文档
小程序
登录
注册
原“程序聚合”
人工智能 安卓APP 软件定制 案例
行业:
全部
电商
企业内部管理
社交
在线教育
金融
旅游
云计算
医疗健康
人工智能
物流仓储
外卖跑腿
企业服务(saas)
物联网
VR/AR
区块链
内容平台
出行
安全
人力资源/HR
大数据
广告营销
农业
搜索
音视频
生活服务
汽车
游戏/电竞
工业互联网
智慧数字孪生
能源
零售/新消费
政务服务
房地产
展开
收起
载体:
全部
安卓APP
IOS APP
网站
小程序
H5
爬虫/脚本
插件
游戏
Windows应用
Mac应用
嵌入式软件
硬件
电视应用
云服务/云平台
算法模型
框架或代码包
车载应用
操作系统
鸿蒙应用
展开
收起
程序聚合
软件案例
人工智能
安卓APP
分类筛选
人工智能-音色音准鉴别APP
核心功能: 1.一键录音,通过AI对用户的声音进行音高,音准进行分析 2.通过AI,对共鸣位置进行检测,以及音色的检查 3.首次嗓音监测,并生成个人嗓音档案 3.将各项指标展示成雷达图,并对其各个分项进行评分,以及简要问题说明和建议
人工智能、音视频
Java、Python、UniApp
个性化导学-基于豆包大模型实现学生教育素质扩展
提示(最少80个中文字符): 本项目是一个基于人工智能的素质教育智能导师服务系统,通过整合语音识别、大语言模型和语音合成三大AI能力,为学生提供实时语音交互、智能问答和启发式教学服务。系统采用响应式编程和事件驱动架构,支持高并发实时交互,能够通过苏格拉底式对话引导学生思考,培养科学思维和解决问题的能力。 1. 立项背景和目标 立项背景: 随着人工智能技术发展和教育数字化转型,学生对个性化、互动式学习体验的需求日益增强,而传统教育模式面临教师资源有限、一对一辅导成本高昂的问题。本项目旨在构建一个支持语音交互、具备启发式教学能力的智能导师服务系统。 项目目标: - 技术目标:构建高性能、高可用的智能对话系统,支持实时语音交互和流式响应处理 - 功能目标:实现语音转文字、智能问答、文字转语音的完整流程,支持多轮对话和上下文理解 - 业务目标:为学生提供24小时智能学习助手服务,提升学习效率,培养批判性思维 - 质量目标:系统可用性达到99.9%以上,具备完善的监控和故障恢复机制 2. 软件功能、核心功能模块的介绍 2.1 语音识别模块(STT) 将用户语音转换为文本。支持实时流式识别,边说话边识别;支持多方言识别;自动检测语音开始和结束。 2.2 大语言模型模块(LLM) 系统的智能核心,负责理解问题并生成回复。提供苏格拉底式对话引导,启发学生思考;支持科学问题的多步骤推理;维护对话上下文,支持连贯的多轮对话;实时流式返回回复内容。 2.3 语音合成模块(TTS) 将文本回复转换为语音输出。支持多音色选择,可调语速、音量和音调;实时流式输出,低延迟反馈。 2.4 实时通信模块 通过WebSocket实现客户端与服务端的双向通信。支持语音、文本、心跳等多种消息类型;具备连接状态检测和自动清理机制。 2.5 事件驱动架构模块 采用事件驱动架构统一处理业务事件,包括语音转文字、文字转语音、大模型请求、对话记录存储等,实现业务逻辑的松耦合。 2.6 数据存储模块 使用MySQL存储对话记录和配置信息,Redis缓存提升性能,Neo4j知识图谱支持知识查询和推理。 3. 业务流程、功能路径描述 3.1 语音对话流程 用户发送语音 → 语音转文字 → 识别完成后调用大语言模型 → 生成智能回复 → 文字转语音 → 返回语音给用户 3.2 对话记录存储 对话完成后自动保存对话记录到数据库,包括用户问题、AI回复、会话信息等。 3.3 多轮对话管理 系统维护每个会话的对话历史,确保后续对话能够理解上下文,提供连贯的交流体验。 3.4 异常处理 当AI服务调用失败时,系统自动捕获错误并提示用户,支持重试操作,记录日志便于问题排查。
在线教育、人工智能
Java、Jackson、Spring、...
toB 机器人屏幕控制软件-RoboPad
- 基于控制器协议在 App 侧实现 **TCP Socket 通信层**:消息帧封装与粘包拆包、心跳保活、超时重试、退避重连、异常兜底;关键指令增加幂等与状态校验 - 实现 **实时状态同步**:对接状态接口并抽象统一状态模型,位置、任务、电量、告警;使用 Flow 驱动 UI 差量刷新,完善断线与恢复状态管理 - 实现 **OpenGL ES 地图渲染**:点云、激光点、机器人位姿叠加显示;处理 map 与 robot 坐标系与 mat4 变换;点数据采用 VBO 批量更新并进行渲染节流 - 实现 **任务系统**:点位选择、路径组合、下发前检查、执行监控;覆盖单任务、循环任务、多点路径;输出进度、失败原因与可恢复提示 - 手机端实现 **开环远动控制逻辑**:输入、指令下发、状态回显;提供实时位置与地图查看能力用于现场操作
人工智能、物联网
Kotlin
AI大模型开发-盘古大模型
盘古大模型:全栈自主的行业智能赋能者 盘古大模型是华为云打造的全栈自主AI大模型体系,自2021年发布以来,始终以“AI for industries”为核心定位,聚焦B端行业赋能,凭借分层架构与技术创新,成为推动千行万业智能升级的核心引擎。 其核心优势在于独创的“L0基础大模型-L1行业大模型-L2场景模型”分层解耦架构,以五大基础模型为能力底座:718B参数的NLP深度思考模型采用MOE架构,跻身国内第一梯队;30B视觉MOE模型支持多类型图像生成;多模态世界模型可构建可交互数字空间;预测模型擅长结构化数据趋势分析;科学计算模型则深耕气象、生物医药等前沿领域。全栈自主技术体系依托昇腾芯片,实现高效训推,保障数据与模型安全可控。 技术突破持续引领行业,最新发布的盘古5.0系列涵盖从十亿级到万亿级多规格参数模型,适配端侧、低时延推理、复杂任务处理等多元场景。Ultra MoE模型以7180亿参数实现128k长序列处理,算力利用率达国际领先水平;可控时空生成技术让多模态内容更贴合物理规律,10K超高分辨率处理能力满足工业级需求。在权威评测中,盘古大模型成为首个获得信通院卓越级(5级)评分的产品,政务领域六项评估指标斩获满分。 落地应用遍布30多个行业、400多个场景:气象领域实现秒级全球预报,台风路径预测准确率超90%;医药领域将先导药研发周期缩短70%,助力新型抗生素研发;铁路巡检中4毫秒完成单张图像故障识别,漏报率归零;钢铁行业通过参数优化使钢板成材率提升0.5%,年增收益9000余万元。从矿山智能开采到建筑设计提速,从自动驾驶数据生成到媒体内容高效生产,盘古大模型正以“解难题、做难事”的实践重塑产业价值。 依托ModelArts Studio一站式开发平台,盘古大模型构建了开放生态,支持三方模型接入与快速部署,让企业与开发者轻松实现AI创新。作为国产大模型的标杆,盘古大模型以技术扎根行业、以创新赋能实体,持续推动人工智能从技术突破走向产业实效,加速智能世界的全面到来。
人工智能、云计算
Apache Airflow
Lumx智能音箱APP
立项背景和目标:智能音箱的配套APP 软件功能:用户登录注册、日志本地存储、多语言、google第三方登录、消息推送、设置(清空缓存、)等 核心模块:蓝牙配网、国外开源第三方音乐库spotify接入、远程IOT设备控制(音量、灯光)、大模型聊天、语音转文字stt、文字生成语音tts
人工智能、物联网
Flutter
语音人工知智能助手-recorder assistant
项目效果请参考视频 https://m.bilibili.com/video/BV1T84y1Q7XZ ## 1、立项背景和目标 项目名称: 声产力(Assistant Recorder) 立项背景: 这是一个面向专业录音和语音处理需求的Android移动应用。项目旨在为用户提供高质量的录音功能,并结合智能语音处理技术,实现录音文件的自动摘要、说话人分离等高级功能。 项目目标: - 开发一个功能完整的移动录音应用 - 集成先进的音频处理技术(包括MP3编码、WAV格式支持) - 实现智能语音分析和摘要生成 - 提供用户友好的录音管理和分享功能 - 支持在线支付和账户管理 ## 2、软件功能和核心功能模块 ### 主要功能模块: 1. 录音模块(核心功能) - 支持多种音频格式:MP3、WAV、PCM - 实时音频录制和播放 - 音频质量配置和参数设置 - 录音文件管理和存储 2. 用户管理模块 - 用户注册、登录、密码找回 - 用户信息管理 - 账户余额查询和充值 - 微信支付集成 3. 语音处理模块 - 录音文件自动摘要生成 - 说话人分离(Diarization)功能 - 历史摘要查看和管理 - 智能语音分析 4. 文件管理模块 - 录音文件列表展示 - 文件上传和下载 - 本地存储管理 - 文件分享功能 5. 支付模块 - 微信支付集成 - 账户余额管理 - 充值记录查询 ## 3、业务流程和功能路径 ### 主要业务流程: 1. 用户注册登录流程 启动应用 → 登录界面 → 用户验证 → 主界面 ↓ 注册/忘记密码 → 完成注册 → 登录 2. 录音业务流程 主界面 → 录音界面 → 开始录音 → 实时录制 → 停止录音 ↓ 保存录音 → 文件管理 → 上传服务器 → 语音处理 → 生成摘要 3. 语音处理流程 录音文件 → 上传服务器 → 说话人分离 → 语音转文本 → 智能摘要 ↓ 用户查看 → 摘要编辑 → 保存/分享 4. 支付充值流程 个人中心 → 充值界面 → 选择金额 → 微信支付 → 支付确认 ↓ 账户余额更新 → 充值记录 ### 核心功能路径: 录音功能路径: MainActivity:30 → RecorderFragment:1 → MsRecorder → 音频文件存储 摘要生成路径: SummaryUI:1 → 网络请求 → 服务器处理 → 结果显示 用户管理路径: LoginUI:1 → 身份验证 → User 模型管理 → 权限控制 支付集成路径: RechargeUI:1 → 微信SDK → 支付回调 → 账户更新
人工智能
Java、Spring、Android ...
Android终极保活:Android4.1 到 Android15.0 完美的保活方案
该项目完全自主开发,个人项目网址https://github.com/Pangu-Immortal?tab=repositoriesKeepAlivePerfect Fw是一个通过 JNI 技术实现进程复活的项目,进一步通过 ioctl 提高了复活率,最大程度地增强了应用的持久性。安全研究用途:完整复现市面上所有的保活机制,穷尽展示所有保活手段,适配所有的主流机型和 ROM。 为了拉齐全网共同认知,让小团队开发不在迷茫,开源了全套所有私密函数和私密策略。会长期持续迭代,会陆陆续续的公开所有的隐私策略,ecpm 策略等等,欢
人工智能、音视频
Kotlin、Python、Gradle
ide-phoneide
雇主想要在手机上面进行开发 便想让我与一些队友开发出一个安卓平台的aiide,复刻了基本的一些aiide的功能,也有取舍, 基本上对代码编辑, ai厂商与聚合平台的集成, 联网,思考,agent分层对话,页面动态,ui设计 termux的接人,实现终端一些功能
人工智能、智慧数字孪生
Ability JS、Alamofire...
智能家居/穿戴-IOT
1、智能穿戴、智能家居,智能机器人、车载应用等蓝牙、WiFi、串口、NFC通讯; 2、地图定位、人工智能、即时通讯、AI大模型等物联网应用程序; 3、Android:基于Swift/Objective-C语言,使用iOS SDK开发的原生应用,直接运行在iOS系统上; 4、IOS:基于Java/Kotlin语言,使用Android SDK开发的原生应用,直接运行在Android系统上; 5、React Native:基于JavaScript/TypeScript语言,采用"原生组件渲染"方式,实现跨平台开发; 6、FLutter:基于Dart语言,采用"自绘UI"渲染方式,实现一套代码多平台运行。
人工智能、物联网
Flutter、React Native...
上医帮
主要用于医生和患者交流的平台,给患者提供咨询服务,结合AI智能体给患者建议,也可以扮演医生的角色。平台采用前后端分离 + 跨端适配架构,以 “医疗场景合规性、交互实时性、跨端一致性” 为核心设计原则,前端基于 Vue2+UniApp 实现多端(微信小程序、App)统一开发,后端通过 WebSocket 保障实时通信,各模块解耦且数据互通,同时严格遵循医疗数据隐私保护规范 主要功能: 1、AI智能体 2、聊天功能 3、朋友圈 4、AI文章 5、销售 6、接单服务、等等
医疗健康、人工智能
UniApp、Vue、Webpack、u...
双模手表App
《双模手表App》是一款搭配蓝牙4G双模手表使用的app,主要功能有健康检测(心率、徐亚、血糖、血氧、呼吸、睡眠、情绪、体温等)、运动(跑步、跳绳、游泳等)、 家庭(家庭成员管理、监控状态、微聊)、服务(上门服务、陪诊服务)、我的(个人信息管理、手表管理、文件管理、固件管理等)
物联网、人工智能
Node.js、PHP、Flutter、...
公安系统管理
1.项目背景 当前公安监所面临着在押人员管理精细化不足、安防防控智能化水平偏低、业务流程协同效率不高、数据价值挖掘不充分等挑战。为响应 “智慧公安” 建设号召,落实监所 “安全、规范、高效” 管理要求,构建 “科技赋能、数据驱动、全流程管控” 的现代化监所管理体系,特启动公安监所实战平台项目。 2.核心功能模块 智能安防模块 在押人员管理模块 管教工作模块 决策分析模块
政务服务、人工智能
Java、Node.js、SQL、Typ...
智能语音交互平台,集成实时语音识别、AI对话和语音合成功能。支持连续对话、历史记录管理、故事阅读系统等功能-NEXUS Unified
NEXUS Unified 是一个企业级智能语音交互平台,集成实时语音识别、AI对话和语音合成功能。支持连续对话、历史记录管理、故事阅读系统等功能。 核心功能: 实时语音识别:基于Dolphin ASR模型,支持16kHz高质量音频 智能AI对话:集成DeepSeek API,支持流式对话和上下文理解 多音色语音合成:5种中文音色,支持实时播放 故事阅读系统:30天循环故事,支持文字和音频双模式阅读 现代化UI:Jetpack Compose构建,支持主题切换和字体调节 MySQL数据库:企业级数据存储,支持用户管理和交互记录
智慧数字孪生、人工智能
Kotlin、Python
Android设备USB智能回传功能(BYOD)
会议设备的Camera/MIC效果一般比PC更好,在开会时可以将支持BYOD功能的会议设备通过usb连接至PC,作为一个usb音视频外设使用,如果是大屏会议设备还支持将触摸事件进行回传,实现大屏触摸反控,充分利用会议设备的软/硬件能力。
人工智能、物联网
C++
基于大模型开发控灯助手
1、编写并完善AI功能模块,实现智能光效生成、场景识别与自动推荐等核心能力,并通过标准化API接口形式开放,供APP端调用与交互使用。 2、APP端主要负责灯具的连接与控制,支持对单灯或多灯进行分组管理、亮度与色温调节、动态特效播放等操作。同时结合AI接口,可一键生成多样化灯光效果与氛围场景,满足用户的创意表达与个性化需求,实现智能与美感兼具的灯光体验。
企业内部管理、人工智能
Python、FastAPI
商显一体机
该一体机产品基于MTK9630 Android11平台开发,并搭配windows OPS,可安装使用第三方Android应用,也可切换到搭配的OPS通道使用windows系统,同时支持USB-A/C口,HDMI/VGA/DP,有线/Wifi/BT等基础功能。可根据客制化应用于教育机、会议机、广告机等使用场景,覆盖教育、会议、广告等不同领域的需求。
人工智能、音视频
C++、Java
基于大规模预训练语言模型聊天机器人-chatgpt
1. 智能灵魂:大模型驱动的深度对话 接入先进的大语言模型作为核心大脑,使机器人具备丰富的知识储备和强大的上下文理解能力。 支持多轮、深度的自然语言对话,能够进行情感交流、创意写作、逻辑推理、知识问答等,让每一次交流都富有价值且生动有趣。 2. 生动形象:Spine 2D骨骼动画机器人 采用 Spine-runtimes 引擎,为机器人打造了灵活的2D骨骼动画形象。 机器人不再是冰冷的文字,而是能够根据对话内容实时呈现丰富的表情、口型和肢体动作(如点头、挥手、思考),极大增强了交互的趣味性与亲和力。 3. 能听会说:全双工实时语音交互 高精度实时语音识别 (ASR):用户可直接通过麦克风说话,小程序实时将语音转换为文字,交由大模型处理,实现“所说即所输”的便捷体验。 流畅逼真的语音播放 (TTS):机器人的回复可通过文本转语音技术,以自然流畅的语音播报出来,同时驱动Spine模型的口型与表情同步变化,实现真正的“声形同步”。 4. 实时稳定:WebSocket持久化通信 基于 WebSocket 协议构建了稳定、低延迟的全双工通信信道。 确保所有消息(文字、语音数据、动画指令)的即时送达与反馈,为流畅的实时对话和动画联动提供了坚实的技术基础,有效避免了传统HTTP协议的延迟与卡顿问题。
人工智能、生活服务
Python、Three.js、UniA...
瓦特AI
瓦特星球是一款融合多功能 AI 服务的一站式智能创作软件,版本 v3.1.1。它集成了强大的 AI 对话引擎,支持多轮深度交流和专业角色咨询;拥有多模态内容生成功能,可一键生成文章、诗歌、脚本;内置 AI 视觉工坊,能根据文字描述生成图片和短视频;还提供 AI 视频通话、音乐制作等多种创意工具。软件界面简洁,操作便捷,支持离线使用,是创作者提升效率的全能助手。
人工智能、企业内部管理
PHP、Flutter、Vue、MySQ...
爬虫-库下载
使用Python脚本进行开发,可以爬取许多网站,但会遵守robots协议,不做违法爬取。 也可以使用Python制作一些偏只能的东西 web前端也可以制作,反正这俩基本都能做 其他的也没有什么了,以后可能会继续学习较为困难的爬虫技术。web后端也会逐渐接触 库下载慢都用清华库
人工智能
Python
户口本及营业执照识别
该项目的主要需求为实现户口本以及营业执照上所有信息的准确识别,同时保证识别速度,通过Flask部署为服务接口,供网站以及app端调用。用户拍照或上传包含户口本以及营业执照的图片,服务器端接受base64编码,模型推理后返回json形式的解析结果
人工智能
Python、Flask、OpenCV、...
1
2
3
帮助文档
Copyright @ 2021-2024 程聚宝 | 浙ICP备2021014372号
人工客服
微信扫一扫直接聊
无需加好友