安全公司报告
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210621765.1 (22)申请日 2022.06.02 (71)申请人 杭州海康威视数字技 术股份有限公 司 地址 310051 浙江省杭州市滨江区阡 陌路 555号 (72)发明人 陈双平 邹佳林  (74)专利代理 机构 北京中博世 达专利商标代理 有限公司 1 1274 专利代理师 申健 (51)Int.Cl. G06T 1/20(2006.01) G06F 9/50(2006.01) (54)发明名称 一种GPU资源调度方法、 装置、 设备及存储介 质 (57)摘要 本申请提供一种GPU资源调度方法、 装置、 设 备及存储介质, 涉及计算机技术领域, 可 以充分 利用GPU的资源且避免GPU资源冲突。 该方法包 括: 获取应用程序的应用资源描述, 确定满足应 用资源描述的目标GPU; 应用资源描述用于指示 应用程序的GPU能力需求; 获取用于启动应用程 序的启动应用 请求, 启动应用程序; 在获取到应 用程序的资源请求时, 若确定目标GPU的当前可 用资源满足应用资源描述指示的资源, 向应用程 序分配目标GPU中应用资源描述指示的资源; 或 者, 在获取到应用程序的资源请求后, 在应用程 序使用目标GPU资源的过程中, 控制应用程序使 用目标GPU资源小于或等于应用资源描述指示的 资源。 本申请可用于GPU资源调度的过程中。 权利要求书3页 说明书12页 附图7页 CN 115063282 A 2022.09.16 CN 115063282 A 1.一种图形处 理器GPU资源调度方法, 其特 征在于, 所述方法包括: 获取应用程序的应用资源描述, 确定满足所述应用资源描述的目标GPU; 所述应用资源 描述用于指示应用程序的GPU能力需求; 获取用于启动所述应用程序的启动应用请求, 启动所述应用程序; 在获取到所述应用程序的资源请求时, 若确定所述目标GPU的当前可用资源满足所述 应用资源描述指示的资源, 向所述应用程序分配所述 目标GPU中所述应用资源描述指示的 资源; 或者, 在获取到所述应用程序的资源请求后, 在所述应用程序使用所述目标GPU资源 的过程中, 控制所述应用程序使用所述目标GPU资源小于或等于所述应用资源描述指示的 资源。 2.根据权利要求1所述的方法, 其特征在于, 在启动所述应用程序之前, 所述方法还包 括: 创建所述应用程序对应的虚拟GPU; 所述在获取到所述应用程序的资源请求时, 若确定所述目标GPU的当前可用资源满足 所述应用资源描述指示的资源, 向所述应用程序分配所述目标GPU中所述应用资源描述指 示的资源, 包括: 在获取到所述应用程序的资源请求时, 所述虚拟GPU在确定所述目标GPU的当前可用资 源满足所述应用资源描述指示的资源的情况下, 向所述应用程序分配所述 目标GPU中所述 应用资源描述指示的资源; 所述在获取到所述应用程序的资源请求后, 在所述应用程序使用所述目标GPU资源的 过程中, 控制所述应用程序使用所述目标GPU资源小于或等于所述应用资源描述指示的资 源, 包括: 在获取到所述应用程序的资源请求后, 在所述应用程序使用所述目标GPU资源的过程 中, 所述虚拟GPU控制所述应用程序使用所述目标GPU资源小于或等于所述应用资源描述指 示的资源。 3.根据权利要求1或2所述的方法, 其特征在于, 所述应用资源描述包括所述应用程序 的额定显存; 所述资源请求用于分配显存; 所述若确定所述目标GPU的当前可用资源满足所述应用资源描述指示的资源, 向所述 应用程序分配所述目标GPU中所述应用资源描述指示的资源, 包括: 若确定所述目标GPU的可用显存大于或等于所述额定显存, 向所述应用程序分配所述 目标GPU中所述 额定显存大小的显存, 更新所述目标GPU的可用显存。 4.根据权利要求3所述的方法, 其特 征在于, 所述方法还 包括: 获取所述应用程序的资源释放请求, 所述资源释放请求包括存储标识, 所述存储标识 指示所述目标GPU中由所述应用程序使用的显存; 释放所述目标GPU中所述存 储标识指示的显存, 更新所述目标GPU的可用显存。 5.根据权利要求1或2所述的方法, 其特征在于, 所述应用资源描述包括所述应用程序 的额定算力 利用率; 所述资源请求用于请求使用所述目标GPU的算力; 所述在所述应用程序使用所述目标GPU资源的过程中, 控制所述应用程序使用所述目 标GPU资源小于或等于所述应用资源描述指示的资源, 包括: 在所述应用程序使用所述目标GPU资源的过程中, 获取所述应用程序对所述目标GPU的权 利 要 求 书 1/3 页 2 CN 115063282 A 2实时算力 利用率; 在所述实时算力利用率大于所述额定算力利用率的情况下, 延迟执行所述应用程序使 用所述目标GPU算力的指令, 直至获取的实时算力 利用率小于或等于所述 额定算力 利用率。 6.根据权利要求2所述的方法, 其特征在于, 所述创建所述应用程序对应的虚拟GPU, 包 括: 函数劫持所述目标GPU的用于调用资源的底层功能函数, 得到所述虚拟GPU。 7.根据权利要求5所述的方法, 其特征在于, 所述算力包括下述一项或多项: 计算算力、 编码算力、 解码算力。 8.一种图像处理器GPU资源调度装置, 其特征在于, 所述装置包括: 获取模块和处理模 块; 所述获取模块用于, 获取应用程序的应用资源描述, 确定满足所述应用资源描述的目 标GPU; 所述应用资源描述用于指示应用程序的GPU能力需求; 所述获取模块还用于, 获取用于启动所述应用程序的启动应用请求, 启动所述应用程 序; 所述处理模块用于, 在获取到所述应用程序的资源请求 时, 若确定所述目标GPU的当前 可用资源满足所述应用资源描述指示的资源, 向所述应用程序分配所述 目标GPU中所述应 用资源描述指示的资源; 或者, 在获取到所述应用程序的资源请求后, 在所述应用程序使用 所述目标GPU资源的过程中, 控制所述应用程序使用所述目标GPU资源小于或等于所述应用 资源描述指示的资源。 9.根据权利要求8所述的装置, 其特 征在于, 所述装置还 包括: 创建模块; 所述创建模块用于, 创建所述应用程序对应的虚拟GPU; 所述处理模块具体用于, 在获取到所述应用程序的资源请求时, 所述虚拟GPU在确定所 述目标GPU的当前可用资源满足所述应用资源描述指示的资源的情况下, 向所述应用程序 分配所述目标GPU中所述应用资源描述指示的资源; 所述处理模块具体用于, 在获取到所述应用程序的资源请求后, 在所述应用程序使用 所述目标GPU资源的过程中, 所述虚拟GPU控制所述应用程序使用所述目标GPU资源小于或 等于所述应用资源描述指示的资源; 所述应用资源描述包括所述应用程序的额定显存; 所述资源请求用于分配显存; 所述 处理模块具体用于, 若确定所述目标GPU的可用显存大于或等于所述额定显存, 向所述应用 程序分配所述目标GPU中所述 额定显存大小的显存, 更新所述目标GPU的可用显存; 所述获取模块还用于, 获取所述应用程序的资源释放请求, 所述资源释放请求包括存 储标识, 所述存 储标识指示所述目标GPU中由所述应用程序使用的显存; 所述处理模块还用于, 释放所述目标GPU中所述存储标识指示的显存, 更新所述目标 GPU的可用显存; 所述应用资源描述包括所述应用程序的额定算力利用率; 所述资源请求用于请求使用 所述目标GPU的算力; 所述处理模块具体用于, 在所述应用程序使用所述目标GPU资源的过 程中, 获取所述应用程序对 所述目标GPU的实时算力利用率; 在所述 实时算力利用率大于所 述额定算力利用率的情况下, 延迟执行所述应用程序使用所述目标GPU算力的指 令, 直至获 取的实时算力 利用率小于或等于所述 额定算力 利用率;权 利 要 求 书 2/3 页 3 CN 115063282 A 3

.PDF文档 专利 一种GPU资源调度方法、装置、设备及存储介质

文档预览
中文文档 23 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共23页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种GPU资源调度方法、装置、设备及存储介质 第 1 页 专利 一种GPU资源调度方法、装置、设备及存储介质 第 2 页 专利 一种GPU资源调度方法、装置、设备及存储介质 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 13:25:39上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。