专利 类别确定方法、装置、设备、存储介质和产品

(19)国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 202210297726.0 (22)申请日 2022.03.24 (71)申请人腾讯科技（深圳）有限公司地址 518057 广东省深圳市南山区高新区科技中一路腾讯大厦3 5层 (72)发明人黄剑辉　 (74)专利代理机构北京三高永信知识产权代理有限责任公司 1 1138 专利代理师李文静 (51)Int.Cl. G06F 16/75(2019.01) G06F 16/783(2019.01) G06F 40/295(2020.01) G06F 40/30(2020.01) G06K 9/62(2022.01)G06N 3/04(2006.01) G06N 3/08(2006.01) (54)发明名称类别确定方法、装置、设备、存储介质和产品 (57)摘要本申请实施例公开了一种类别确定方法、装置、设备、存储介质和产品，属于计算机技术领域，可应用于计算机技术中的视频分类、人工智能以及车载等场景。方法包括：获取目标视频的第一视频描述信息，所述第一视频描述信息用于描述所述目标视频的视频内容；对所述第一视频描述信息进行实体识别，得到所述第一视频描述信息中的第一实体；获取所述第一实体的第一知识扩展信息；基于所述第一视频描述信息和所述第一知识扩展信息，确定所述目标视频的类别。该方案通过引入知识扩展信息使得实体的信息更加丰富，也使得该实体能够被更加准确地理解，因此，基于该知识扩展信息和视频描述信息能够更加准确地确定视频类别，提高了视频类别的准确性。权利要求书3页说明书21页附图8页 CN 114676285 A 2022.06.28 CN 114676285 A 1.一种类别确定方法，其特征在于，所述方法包括：获取目标视频的第一视频描述信息，所述第一视频描述信息用于描述所述目标视频的视频内容；对所述第一视频描述信息进行实体识别，得到所述第一视频描述信息中的第一实体；获取所述第一实体的第一知识扩展信息；基于所述第一视频描述信息和所述第一知识扩展信息，确定所述目标视频的类别。 2.根据权利要求1所述的方法，其特征在于，所述目标视频的类别包括一级类别和二级类别；所述基于所述第一视频描述信息和所述第一知识扩展信息，确定所述目标视频的类别，包括：基于所述第一视频描述信息，确定所述目标视频的一级类别；基于所述第一视频描述信息和所述第一知识扩展信息，确定所述目标视频的二级类别。 3.根据权利要求2所述的方法，其特征在于，所述基于所述第一视频描述信息，确定所述目标视频的一级类别，包括：确定所述第一视频描述信息的描述语义特征，基于所述描述语义特征，确定所述目标视频的一级类别；所述基于所述第一视频描述信息和所述第一知识扩展信息，确定所述目标视频的二级类别，包括：确定所述第一知识扩展信息的扩展语义特征，对所述描述语义特征和所述扩展语义特征进行融合，得到融合特征，基于所述融合特征，确定所述目标视频的二级类别。 4.根据权利要求1所述的方法，其特征在于，所述目标视频的类别包括一级类别和二级类别；所述基于所述第一视频描述信息和所述第一知识扩展信息，确定所述目标视频的类别，包括：将所述第一视频描述信息和所述第一知识扩展信息输入类别识别模型，输出所述目标视频的一级类别和二级类别，所述类别识别模型用于基于所述第一视频描述信息，确定所述目标视频的一级类别，基于所述第一视频描述信息和所述第一知识扩展信息，确定所述目标视频的二级类别。 5.根据权利要求 4所述的方法，其特征在于，所述类别识别模型的训练过程包括：获取样本数据，所述样本数据包括样本视频的第二视频描述信息、所述样本视频的样本一级类别和样本二级类别；获取第二实体的第二知识扩展信息，所述第二实体为所述第二视频描述信息中的实体；通过训练前的类别识别模型，对所述第二视频描述信息和所述第二知识扩展信息进行类别识别，得到所述样本视频的预测一级类别和预测二级类别；基于所述预测一级类别、所述样本一级类别、所述预测二级类别和所述样本二级类别，对所述训练前的类别识别模型进行训练，得到所述类别识别模型。 6.根据权利要求5所述的方法，其特征在于，所述基于所述预测一级类别、所述样本一级类别、所述预测二级类别和所述样本二级类别，对所述训练前的类别识别模型进行训练，得到所述类别识别模型，包括：权　利　要　求　书 1/3 页 2 CN 114676285 A 2基于所述预测一级类别和所述样本一级类别，确定第一损失值；基于所述预测二级类别和所述样本二级类别，确定第二损失值；将所述第一损失值与所述第二损失值进行融合，得到第三损失值；基于所述第三损失值，对所述训练前的类别识别模型进行训练，得到所述类别识别模型。 7.根据权利要求5所述的方法，其特征在于，所述基于所述预测一级类别、所述样本一级类别、所述预测二级类别和所述样本二级类别，对所述训练前的类别识别模型进行训练，得到所述类别识别模型，包括：确定第一概率和第二概率，所述类别识别模型用于确定所述目标视频属于多个一级类别的概率和所述目标视频属于多个二级类别的概率，所述第一概率为所述类别识别模型确定的至少一个一级类别的概率，所述第二概率为所述类别识别模型确定的至少一个二级类别的概率；基于所述预测一级类别、所述样本一级类别、所述预测二级类别、所述样本二级类别、所述第一概率和所述第二概率，对所述训练前的类别识别模型进行训练，得到所述类别识别模型。 8.根据权利要求7所述的方法，其特征在于，所述确定第一概率和第二概率，包括以下任一项：将所述类别识别模型确定的正确一级类别的概率确定为所述第一概率，将所述类别识别模型确定的正确二级类别的概率确定为所述第二概率，所述正确一级类别是与所述样本一级类别相同的类别，所述正确二级类别是与所述样本二级类别相同的类别；将所述预测一级类别的概率确定为所述第一概率，将所述预测二级类别的概率确定为所述第二概率；将所述预测一级类别的概率确定为所述第一概率，将所述类别识别模型确定的多个二级类别的概率确定为所述第二概率；将所述类别识别模型确定的多个一级类别的概率确定为所述第一概率，将所述类别识别模型确定的多个二级类别的概率确定为所述第二概率。 9.根据权利要求7所述的方法，其特征在于，所述基于所述预测一级类别、所述样本一级类别、所述预测二级类别、所述样本二级类别、所述第一概率和所述第二概率，对所述训练前的类别识别模型进行训练，得到所述类别识别模型，包括：基于所述预测一级类别和所述样本一级类别，确定第一损失值；基于所述预测二级类别和所述样本二级类别，确定第二损失值；基于所述第一概率和所述第二概率，确定第四损失值；将所述第一损失值、所述第二损失值和所述第四损失值进行融合，得到第五损失值；基于所述第五损失值，对所述类别识别模型进行训练。 10.根据权利要求9所述的方法，其特征在于，所述基于所述第一概率和所述第二概率，确定第四损失值，包括：在所述第一概率小于所述第二概率的情况下，基于所述第一概率和所述第二概率的差值，确定所述第四损失值，所述第四损失值与所述差值呈正相关；在所述第一概率不小于所述第二概率的情况下，确定所述第四损失值为0。权　利　要　求　书 2/3 页 3 CN 114676285 A 3

专利 类别确定方法、装置、设备、存储介质和产品

专利类别确定方法、装置、设备、存储介质和产品