GPU虚拟化

2025-08-30 23:39:02
行业:云计算
载体:框架或代码包
技术:C、C++

业务和功能介绍

为更大效率利用公司GPU资源、节省成本,通过对NVIDIA的驱动库、运行库和函数库进行劫持,将公司k8s集群中GPU卡的算力和显存资源进行统计和管理,使单卡资源利用率提高13%;并引入远程共享池化的概念,使没有GPU卡的机器能通过网络使用GPU池中的资源。
为更大效率利用公司GPU资源、节省成本,通过对NVIDIA的驱动库、运行库和函数库进行劫持,将公司k8s集群中GPU卡的算力和显存资源进行统计和管理,使单卡资源利用率提高13%;并引入远程共享池化的概念,使没有GPU卡的机器能通过网络使用GPU池中的资源。

项目实现

1)确定资源值统计方案:在抓取资源值的间隔中,多进程间通过IPC计数、进程内多线程间通过原子变量计数来保证正确性,并让不同资源种类和不同卡单独使用一套IPC管理,提高并发度;最终按此方案实现后顺利上线,并通过公司名义发表专利一篇。
2)使用RAII机制解决了资源频繁申请和释放引发的漏释放问题,并对IPC回收增加巡检机制,确保进程异常崩溃后机器的IPC仍能正常回收,保证系统稳定运行。
3)为减少劫持逻辑耗时,设计异步日志系统并通过recover机制保证日志完整性,利用线程变量缓存优化系统时间的获取,最终减少耗时50%+。
4)通过阅读brpc源码和demo测试验证,确定采用brpc通信;规定了通信的应用层协议和数据排列形式;将通信模块和逻辑模块解耦,完成服务端/客户端的劫持入口逻辑开发,并通过脚本生成各个劫持函数的雏形,提升开发效率。
5)按模块完成功能设计与开发,包括:i、守护进程模块,包含配置文件处理、端口号维护、请求监听和fork创建server等工作,采用无锁队列替代加锁操作优化端口号维护;ii、客户端模块,包括上下文、网络连接器的维护等,使用double check方式保证网络连接器的唯一性;iii、服务端和客户端在显存的分配、拷贝和回收等劫持逻辑映射,并适配pinned memory、有参launch kernel等特殊功能。最终顺利完成项目交付。

示例图片视频


六边形战士
30天前活跃
方向: 后端-Go、后端-C++、
交付率:100.00%
相似推荐
电商平台订单系统重构(微服务版)
该项目是为一家中型电商企业重构其订单交易模块。原系统为单体架构,大促期间订单处理缓慢、库存超卖频发。目标是构建高可用、可横向扩展的订单中台,支撑日均10万级订单量。 核心功能包括: 订单下单、支付回调、状态流转管理 库存扣减与回滚 订单超时自动取消 订单数据分库分表存储
Word文档批量文本替换工具
Word文档批量文本替换工具,主要功能: 遍历指定目录,查找所有.docx文件 批量替换文本内容(支持配置多组替换规则) 保留原格式(字体、颜色、大小等样式) 处理复杂元素: 正文段落 表格 页眉页脚 文本框(VML旧格式 + DrawingML新格式)
easyMeeting
1. 产品定位 EasyMeeting 是一款基于 Java 开发的即时会议与社交协作平台,旨在提供轻量级、低延迟的在线会议体验,同时融合即时通讯(IM)功能,满足用户从预约、入会到会后交流的全流程需求。 2. 核心业务模块 用户体系与社交关系 账号管理:支持用户注册、登录及个人信息维护。 好友/联系人系统:实现好友申请、审批、列表管理及状态同步,支持双向确认机制。 会议全生命周期管理 会议预约:支持创建预定会议,设置时间、主题及参与成员。 即时会议:支持快速发起会议,生成会议号或链接。 成员管理:实时管理会议中的加入、退出、角色变更(主持人/普通成员)及状态追踪。 实时互动与通讯 即时聊天:在会议期间或私聊场景下,支持文本消息的实时发送与接收。 信令交互:通过 Netty 处理 WebRTC 所需的信令交换,实现音视频流的点对点连接。 文件与资源管理 文件服务:支持头像、聊天记录附件等文件的上传与下载。 版本更新:提供客户端 APP 的版本检测与增量/全量更新包管理。 后台管理 系统配置:管理员可调整系统全局参数。 数据监控:查看会议记录、用户列表及系统运行状态。 3. 目标用户场景 企业内部日常站会、远程协作。 小型团队的项目沟通与文件共享。 需要即时建立连接的低延迟视频通话场景。
智能生产大屏
智能化生产运行交付管理体系由左、中、右三个主要模块构成。左侧模块专注于展示当前规模化生产的整体运营概况。其上半部分通过一系列累积数据直观展现了从订单到交付的全过程。数据分析从进度、成本、质量和效率四个关键维度展开,清晰呈现了各生产要素的趋势变化。下半部分则重点展示与运营相关的核心指标,以便全面监控和优化生产运营状况。
踩踩停车物联网车位共享
对接小区车牌识别摄像头,通过Lora通讯协议接受车牌数据,实现超时计费机制,超时先短信提醒,超过10分钟自动计费,支持车位车主电话提醒,实现已预约车辆自动抬杆。依据ui设计稿,使用小程序原生语法完成前端界面开发与页面适配。对接小区车牌识别摄像头,通过Lora通讯协议接受车牌数据,实现超时计费机制,超时先短信提醒,超过10分钟自动计费,支持车位车主电话提醒,实现已预约车辆自动抬杆。依据ui设计稿,使用小程序原生语法完成前端界面开发与页面适配
帮助文档   Copyright @ 2021-2024 程聚宝 | 浙ICP备2021014372号
人工客服