安全公司报告
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210297726.0 (22)申请日 2022.03.24 (71)申请人 腾讯科技 (深圳) 有限公司 地址 518057 广东省深圳市南 山区高新区 科技中一路腾讯大厦3 5层 (72)发明人 黄剑辉  (74)专利代理 机构 北京三高永信知识产权代理 有限责任公司 1 1138 专利代理师 李文静 (51)Int.Cl. G06F 16/75(2019.01) G06F 16/783(2019.01) G06F 40/295(2020.01) G06F 40/30(2020.01) G06K 9/62(2022.01)G06N 3/04(2006.01) G06N 3/08(2006.01) (54)发明名称 类别确定方法、 装置、 设备、 存 储介质和产品 (57)摘要 本申请实施例公开了一种类别确定方法、 装 置、 设备、 存储介质和产品, 属于计算机技术领 域, 可应用于计算机技术中的视频分类、 人工智 能以及车载等场景。 方法包括: 获取目标视频的 第一视频描述信息, 所述第一视频描述信息用于 描述所述目标视频的视频内容; 对 所述第一视频 描述信息进行 实体识别, 得到所述第一视频描述 信息中的第一实体; 获取所述第一实体的第一知 识扩展信息; 基于所述第一视频描述信息和所述 第一知识扩展信息, 确定所述目标视频的类别。 该方案通过引入知识扩展信息使得实体的信息 更加丰富, 也使得该实体能够被更加准确地理 解, 因此, 基于该知识扩展信息和视频描述信息 能够更加准确地确定视频类别, 提高了视频类别 的准确性。 权利要求书3页 说明书21页 附图8页 CN 114676285 A 2022.06.28 CN 114676285 A 1.一种类别确定方法, 其特 征在于, 所述方法包括: 获取目标视频的第 一视频描述信 息, 所述第 一视频描述信 息用于描述所述目标视频的 视频内容; 对所述第一视频描述信息进行实体识别, 得到所述第一视频描述信息中的第一实体; 获取所述第一实体的第一知识扩展信息; 基于所述第一视频描述信息和所述第一知识扩展信息, 确定所述目标视频的类别。 2.根据权利要求1所述的方法, 其特征在于, 所述目标视频的类别包括一级类别和二级 类别; 所述基于所述第一视频描述信息和所述第一知识扩展信息, 确定所述 目标视频的类 别, 包括: 基于所述第一视频描述信息, 确定所述目标视频的一级类别; 基于所述第一视频描述信息和所述第一知识扩展信息, 确定所述目标视频的二级类 别。 3.根据权利要求2所述的方法, 其特征在于, 所述基于所述第一视频描述信息, 确定所 述目标视频的一级类别, 包括: 确定所述第一视频描述信息的描述语义特征, 基于所述描述语义特征, 确定所述目标 视频的一级类别; 所述基于所述第 一视频描述信 息和所述第 一知识扩展信 息, 确定所述目标视频的二级 类别, 包括: 确定所述第 一知识扩展信 息的扩展语义特征, 对所述描述语义特征和所述扩展语义特 征进行融合, 得到融合特 征, 基于所述融合特 征, 确定所述目标视频的二级类别。 4.根据权利要求1所述的方法, 其特征在于, 所述目标视频的类别包括一级类别和二级 类别; 所述基于所述第一视频描述信息和所述第一知识扩展信息, 确定所述 目标视频的类 别, 包括: 将所述第一视频描述信 息和所述第 一知识扩展信 息输入类别识别模型, 输出所述目标 视频的一级类别和二级类别, 所述类别识别模型用于基于所述第一视频描述信息, 确定所 述目标视频的一级类别, 基于所述第一视频描述信息和所述第一知识扩展信息, 确定所述 目标视频的二级类别。 5.根据权利要求 4所述的方法, 其特 征在于, 所述类别识别模型的训练过程包括: 获取样本数据, 所述样本数据包括样本视频的第二视频描述信息、 所述样本视频的样 本一级类别和样本二级类别; 获取第二实体的第二知识扩展信息, 所述第二实体为所述第二视频描述信息中的实 体; 通过训练前的类别识别模型, 对所述第 二视频描述信 息和所述第 二知识扩展信 息进行 类别识别, 得到所述样本 视频的预测一级类别和预测二级类别; 基于所述预测一级类别、 所述样本一级类别、 所述预测二级类别和所述样本二级类别, 对所述训练前的类别识别模型进行训练, 得到所述类别识别模型。 6.根据权利要求5所述的方法, 其特征在于, 所述基于所述预测一级类别、 所述样本一 级类别、 所述预测二级类别和所述样本二级类别, 对所述训练前的类别识别模型进 行训练, 得到所述类别识别模型, 包括:权 利 要 求 书 1/3 页 2 CN 114676285 A 2基于所述预测一级类别和所述样本一级类别, 确定第一损失值; 基于所述预测二级类别和所述样本二级类别, 确定第二损失值; 将所述第一损失值与所述第二损失值进行融合, 得到第三损失值; 基于所述第三损 失值, 对所述训练前的类别识别模型进行训练, 得到所述类别识别模 型。 7.根据权利要求5所述的方法, 其特征在于, 所述基于所述预测一级类别、 所述样本一 级类别、 所述预测二级类别和所述样本二级类别, 对所述训练前的类别识别模型进 行训练, 得到所述类别识别模型, 包括: 确定第一概率和第 二概率, 所述类别识别模型用于确定所述目标视频属于多个一级类 别的概率和所述目标视频属于多个二级类别的概率, 所述第一概率为所述类别识别模型确 定的至少一个一级类别的概率, 所述第二概率为所述类别识别模型确定的至少一个二级类 别的概率; 基于所述预测一级类别、 所述样本一级类别、 所述预测二级类别、 所述样本二级类别、 所述第一概率和所述第二概率, 对所述训练前 的类别识别模型进行训练, 得到所述类别识 别模型。 8.根据权利要求7所述的方法, 其特征在于, 所述确定第一概率和第二概率, 包括以下 任一项: 将所述类别识别模型确定的正确一级类别的概率确定为所述第 一概率, 将所述类别识 别模型确定的正确二级类别的概率确定为所述第二概率, 所述正确一级类别是与所述样本 一级类别相同的类别, 所述 正确二级类别是与所述样本二级类别相同的类别; 将所述预测一级类别的概率确定为所述第 一概率, 将所述预测二级类别的概率确定为 所述第二 概率; 将所述预测一级类别的概率确定为所述第 一概率, 将所述类别识别模型确定的多个二 级类别的概 率确定为所述第二 概率; 将所述类别识别模型确定的多个一级类别的概率确定为所述第 一概率, 将所述类别识 别模型确定的多个二级类别的概 率确定为所述第二 概率。 9.根据权利要求7所述的方法, 其特征在于, 所述基于所述预测一级类别、 所述样本一 级类别、 所述预测二级类别、 所述样本二级类别、 所述第一概率和所述第二概率, 对所述训 练前的类别识别模型进行训练, 得到所述类别识别模型, 包括: 基于所述预测一级类别和所述样本一级类别, 确定第一损失值; 基于所述预测二级类别和所述样本二级类别, 确定第二损失值; 基于所述第一 概率和所述第二 概率, 确定第四损失值; 将所述第一损失值、 所述第二损失值和所述第四损失值进行融合, 得到第五损失值; 基于所述第五损失值, 对所述类别识别模型进行训练。 10.根据权利要求9所述的方法, 其特征在于, 所述基于所述第 一概率和所述第 二概率, 确定第四损失值, 包括: 在所述第一概率小于所述第 二概率的情况下, 基于所述第 一概率和所述第 二概率的差 值, 确定所述第四损失值, 所述第四损失值与所述差值呈正相关; 在所述第一 概率不小于所述第二 概率的情况 下, 确定所述第四损失值 为0。权 利 要 求 书 2/3 页 3 CN 114676285 A 3

.PDF文档 专利 类别确定方法、装置、设备、存储介质和产品

文档预览
中文文档 33 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共33页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 类别确定方法、装置、设备、存储介质和产品 第 1 页 专利 类别确定方法、装置、设备、存储介质和产品 第 2 页 专利 类别确定方法、装置、设备、存储介质和产品 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 17:51:58上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。