(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202210297726.0
(22)申请日 2022.03.24
(71)申请人 腾讯科技 (深圳) 有限公司
地址 518057 广东省深圳市南 山区高新区
科技中一路腾讯大厦3 5层
(72)发明人 黄剑辉
(74)专利代理 机构 北京三高永信知识产权代理
有限责任公司 1 1138
专利代理师 李文静
(51)Int.Cl.
G06F 16/75(2019.01)
G06F 16/783(2019.01)
G06F 40/295(2020.01)
G06F 40/30(2020.01)
G06K 9/62(2022.01)G06N 3/04(2006.01)
G06N 3/08(2006.01)
(54)发明名称
类别确定方法、 装置、 设备、 存 储介质和产品
(57)摘要
本申请实施例公开了一种类别确定方法、 装
置、 设备、 存储介质和产品, 属于计算机技术领
域, 可应用于计算机技术中的视频分类、 人工智
能以及车载等场景。 方法包括: 获取目标视频的
第一视频描述信息, 所述第一视频描述信息用于
描述所述目标视频的视频内容; 对 所述第一视频
描述信息进行 实体识别, 得到所述第一视频描述
信息中的第一实体; 获取所述第一实体的第一知
识扩展信息; 基于所述第一视频描述信息和所述
第一知识扩展信息, 确定所述目标视频的类别。
该方案通过引入知识扩展信息使得实体的信息
更加丰富, 也使得该实体能够被更加准确地理
解, 因此, 基于该知识扩展信息和视频描述信息
能够更加准确地确定视频类别, 提高了视频类别
的准确性。
权利要求书3页 说明书21页 附图8页
CN 114676285 A
2022.06.28
CN 114676285 A
1.一种类别确定方法, 其特 征在于, 所述方法包括:
获取目标视频的第 一视频描述信 息, 所述第 一视频描述信 息用于描述所述目标视频的
视频内容;
对所述第一视频描述信息进行实体识别, 得到所述第一视频描述信息中的第一实体;
获取所述第一实体的第一知识扩展信息;
基于所述第一视频描述信息和所述第一知识扩展信息, 确定所述目标视频的类别。
2.根据权利要求1所述的方法, 其特征在于, 所述目标视频的类别包括一级类别和二级
类别; 所述基于所述第一视频描述信息和所述第一知识扩展信息, 确定所述 目标视频的类
别, 包括:
基于所述第一视频描述信息, 确定所述目标视频的一级类别;
基于所述第一视频描述信息和所述第一知识扩展信息, 确定所述目标视频的二级类
别。
3.根据权利要求2所述的方法, 其特征在于, 所述基于所述第一视频描述信息, 确定所
述目标视频的一级类别, 包括:
确定所述第一视频描述信息的描述语义特征, 基于所述描述语义特征, 确定所述目标
视频的一级类别;
所述基于所述第 一视频描述信 息和所述第 一知识扩展信 息, 确定所述目标视频的二级
类别, 包括:
确定所述第 一知识扩展信 息的扩展语义特征, 对所述描述语义特征和所述扩展语义特
征进行融合, 得到融合特 征, 基于所述融合特 征, 确定所述目标视频的二级类别。
4.根据权利要求1所述的方法, 其特征在于, 所述目标视频的类别包括一级类别和二级
类别; 所述基于所述第一视频描述信息和所述第一知识扩展信息, 确定所述 目标视频的类
别, 包括:
将所述第一视频描述信 息和所述第 一知识扩展信 息输入类别识别模型, 输出所述目标
视频的一级类别和二级类别, 所述类别识别模型用于基于所述第一视频描述信息, 确定所
述目标视频的一级类别, 基于所述第一视频描述信息和所述第一知识扩展信息, 确定所述
目标视频的二级类别。
5.根据权利要求 4所述的方法, 其特 征在于, 所述类别识别模型的训练过程包括:
获取样本数据, 所述样本数据包括样本视频的第二视频描述信息、 所述样本视频的样
本一级类别和样本二级类别;
获取第二实体的第二知识扩展信息, 所述第二实体为所述第二视频描述信息中的实
体;
通过训练前的类别识别模型, 对所述第 二视频描述信 息和所述第 二知识扩展信 息进行
类别识别, 得到所述样本 视频的预测一级类别和预测二级类别;
基于所述预测一级类别、 所述样本一级类别、 所述预测二级类别和所述样本二级类别,
对所述训练前的类别识别模型进行训练, 得到所述类别识别模型。
6.根据权利要求5所述的方法, 其特征在于, 所述基于所述预测一级类别、 所述样本一
级类别、 所述预测二级类别和所述样本二级类别, 对所述训练前的类别识别模型进 行训练,
得到所述类别识别模型, 包括:权 利 要 求 书 1/3 页
2
CN 114676285 A
2基于所述预测一级类别和所述样本一级类别, 确定第一损失值;
基于所述预测二级类别和所述样本二级类别, 确定第二损失值;
将所述第一损失值与所述第二损失值进行融合, 得到第三损失值;
基于所述第三损 失值, 对所述训练前的类别识别模型进行训练, 得到所述类别识别模
型。
7.根据权利要求5所述的方法, 其特征在于, 所述基于所述预测一级类别、 所述样本一
级类别、 所述预测二级类别和所述样本二级类别, 对所述训练前的类别识别模型进 行训练,
得到所述类别识别模型, 包括:
确定第一概率和第 二概率, 所述类别识别模型用于确定所述目标视频属于多个一级类
别的概率和所述目标视频属于多个二级类别的概率, 所述第一概率为所述类别识别模型确
定的至少一个一级类别的概率, 所述第二概率为所述类别识别模型确定的至少一个二级类
别的概率;
基于所述预测一级类别、 所述样本一级类别、 所述预测二级类别、 所述样本二级类别、
所述第一概率和所述第二概率, 对所述训练前 的类别识别模型进行训练, 得到所述类别识
别模型。
8.根据权利要求7所述的方法, 其特征在于, 所述确定第一概率和第二概率, 包括以下
任一项:
将所述类别识别模型确定的正确一级类别的概率确定为所述第 一概率, 将所述类别识
别模型确定的正确二级类别的概率确定为所述第二概率, 所述正确一级类别是与所述样本
一级类别相同的类别, 所述 正确二级类别是与所述样本二级类别相同的类别;
将所述预测一级类别的概率确定为所述第 一概率, 将所述预测二级类别的概率确定为
所述第二 概率;
将所述预测一级类别的概率确定为所述第 一概率, 将所述类别识别模型确定的多个二
级类别的概 率确定为所述第二 概率;
将所述类别识别模型确定的多个一级类别的概率确定为所述第 一概率, 将所述类别识
别模型确定的多个二级类别的概 率确定为所述第二 概率。
9.根据权利要求7所述的方法, 其特征在于, 所述基于所述预测一级类别、 所述样本一
级类别、 所述预测二级类别、 所述样本二级类别、 所述第一概率和所述第二概率, 对所述训
练前的类别识别模型进行训练, 得到所述类别识别模型, 包括:
基于所述预测一级类别和所述样本一级类别, 确定第一损失值;
基于所述预测二级类别和所述样本二级类别, 确定第二损失值;
基于所述第一 概率和所述第二 概率, 确定第四损失值;
将所述第一损失值、 所述第二损失值和所述第四损失值进行融合, 得到第五损失值;
基于所述第五损失值, 对所述类别识别模型进行训练。
10.根据权利要求9所述的方法, 其特征在于, 所述基于所述第 一概率和所述第 二概率,
确定第四损失值, 包括:
在所述第一概率小于所述第 二概率的情况下, 基于所述第 一概率和所述第 二概率的差
值, 确定所述第四损失值, 所述第四损失值与所述差值呈正相关;
在所述第一 概率不小于所述第二 概率的情况 下, 确定所述第四损失值 为0。权 利 要 求 书 2/3 页
3
CN 114676285 A
3
专利 类别确定方法、装置、设备、存储介质和产品
文档预览
中文文档
33 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共33页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-18 17:51:58上传分享