程序聚合 软件案例 百度AI开放平台 边缘端核心推理组件EdgeKit的设计与开发-EdgeKit

百度AI开放平台 边缘端核心推理组件EdgeKit的设计与开发-EdgeKit

2025-06-09 16:51:00
行业:云计算
载体:云服务/云平台、算法模型
技术:C++、ONNX Runtime

业务和功能介绍

公有云是云计算概念的主流解决方案,但是对于边缘端部署情况,需要面临如网络延迟太大,网络连接不稳定等诸多问题。提供离线SDK部署方案可以解决以上问题
百度智能云平台包含模型的训练和发布全流程,模型发布阶段会对接训练阶段的模型产出,对于离线部署的客户需要生成离线推理SDK包。EdgeKit对接适配多款硬件如Nvidia-GPU,高通骁龙芯片等。同时为了压缩部署成本,需要对已有的模型实施一系列模型压缩算法,以达到加速目的。

项目实现

EdgeKit
1. 负责EdgeKit在Nvidia-GPU端上落地,基于TensorRT推理框架开发边缘端推理引擎;负责EdgeKit在高通骁龙系列DSP、GPU端上落地,基于SNPE推理框架的边缘端推理引擎,支持包括SE-ResNeXt、YoloV3、Faster-RCNN等多个CV模型;
2. 拓展网络支持范围和优化推理性能,TensorRT自定义包括relu6、broadcast_mul、upsample等算子,优化算子性能,单线程推理延迟平均减少~5%;开发SNPE INT8量化组件,针对不同的网络结构适配量化算法。
3. 负责开发EdgeKit针对经典机器学习模型的推理引擎,支持包括决策树、逻辑回归等多种机器学习模型,支持框架包括SkLearn、XGBoost、PMML;建设经典机器学习model zoo。
4. 跨平台移植,负责利用MSVC和MinGW工具将EdgeKit的多个C/C++组件适配到Windows平台。

Juicer模型压缩
1. 开发Juicer针对Paddle模型的量化、通道剪枝、知识蒸馏等模型压缩组件,模型压缩方法支持多个CV网络结构,包括SE-ResNeXt、YoloV3、Faster-RCNN等;将压缩后的模型适配到包括Intel-x86、Nvidia-GPU、ARM等多种设备端。
2. 设计并实现组合压缩策略,基于airflow开发相关调度组件显著提升原模型性能,如在Intel x86平台上实现YoloV3单线程推理延迟平均降低155%,模型体积减小153%、内存占用降低237%;主导模型压缩组件升级到动态计算图;优化通道剪枝策略,利用敏感度分析方法搜索更佳的模型结构以达到更优的压缩效果,mAP/Top1平均提升~1%。

示例图片视频


k
30天前活跃
方向: 人工智能-计算机视觉与图像处理、人工智能-机器学习与深度学习、
交付率:100.00%
相似推荐
贷款业务管理平台 -基于Node.js+React的全栈金融管理系统
一个功能完整、界面优美的贷款业务管理系统,包含Web管理后台和移动端App。系统实现了贷款业务的完整闭环管理,包括用户管理、贷款管理、还款审核、合同生成、数据统计等核心功能。 核心功能亮点: 数据统计仪表板 - 实时展示总用户数、贷款金额、还款金额、逾期统计等关键数据,支持图表可视化展示近6个月还款趋势和还款状态分布。 用户管理 - 支持手动录入和Excel批量导入用户数据,一键导入可自动创建用户、贷款记录、还款计划和借款合同,大幅提升工作效率。 还款审核 - 在线审核用户上传的还款凭证图片,支持一键通过/拒绝操作,审核通过自动更新还款状态和已还款金额。 合同管理 - 自动生成电子借款合同,支持在线查看,合同模板可自定义配置。 移动端App - 借款用户可通过手机App查看待还款项、上传还款凭证、查看电子合同、管理个人账户。 系统设置 - 配置微信/支付宝收款码和银行账户信息,方便用户还款。
中信人平台H5+后台管理系统
1、业务员分享活动赚取积分换好礼 2、企业微信分享和微信分享好友及朋友圈 3、活动的上新及活动内容可配置 4、对接麦当劳、书店等平台权益 5、图表展示平台日活量、月活量的统计及页面的埋码功能 6、咨询订阅管理
港美A交易行情SDK数据
为招商国际证券、互信、清科等领先的互联网券商,提供高性能、多市场的企业级行情数据解决方案。通过标准化的 SDK 与低延迟、高并发的数据流推送服务,我们赋能其终端应用,向千万投资者稳定、实时地展示全球核心资产(涵盖港股、美股、A股)的全貌行情、精细化分时K线以及深度数据模型,最终助力券商提升其App的用户体验、交易转化与市场竞争力
股票量化分析系统
基于sina金融和腾讯金融的股票量化分析系统扩展方案‌ ‌数据收集与存储‌ 使用akshare(历史附件中已包含)获取A股/港股实时行情、历史K线、财务数据等,结合pandas进行结构化存储。 通过SQLAlchemy将数据持久化到本地数据库(如SQLite/MySQL),支持增量更新与去重。 ‌量化指标实现‌ 利用backtrader(附件中已列出)构建回测框架,集成MACD、KDJ等指标(可通过TA-Lib优化计算效率)。 扩展自定义指标:如RSI、布林带,结合numpy和scipy进行数值计算。 ‌本地数据处理‌ 使用dask加速大规模数据预处理(如缺失值填充、标准化),matplotlib和mplfinance可视化分析结果。 通过psutil监控系统资源,确保长时间运行的稳定性。 ‌系统增强建议‌ 添加实时预警:基于websocket-client监听行情,触发邮件/短信通知(需集成requests调用第三方API)。 扩展多数据源:若sina/腾讯接口受限,可接入tushare或Wind(需额外安装)。
报刊采集系统-数据采集
主导报刊采集项目,成功采集了162种报刊的内容及PDF。负责数据处理,采用Scrapy和BS4技术栈,设计并实施了三通道架构以优化分布式数据采集。有效应对反爬机制,通过登录验证和cookie验证确保数据的准确性和完整性。利用pandas进行数据分析,结合正则表达式、机器学习(数据标注)和AI大模型进行深入解析,提升了数据处理的效率和准确性。
帮助文档   Copyright @ 2021-2024 程聚宝 | 浙ICP备2021014372号
人工客服