专利 表情包图片的处理方法、装置和服务器

(19)国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 202210445438.5 (22)申请日 2022.04.26 (71)申请人中国建设银行股份有限公司地址 100033 北京市西城区金融大街25号 (72)发明人熊伊　 (74)专利代理机构北京三友知识产权代理有限公司 11127 专利代理师贾磊　李辉 (51)Int.Cl. G06F 16/583(2019.01) G06F 40/30(2020.01) (54)发明名称表情包图片的处理方法、装置和服务器 (57)摘要本说明书提供了表情包图片的处理方法、装置和服务器。该方法涉及人工智能技术领域，基于该方法，在智能客服场景中，当目标用户在对话界面中使用诸如动态表情包图片等目标表情包图片时，服务器可以先根据预设的提取规则，从目标表情包图片所对应的目标图片序列中提取出多个关键帧图片，得到目标图片组；再根据预设的语义处理规则，处理目标图片组，得到并根据目标表情包图片的文本语义内容和/或图像语义内容，确定出目标表情包图片所表征的目标语义内容。从而能够自动且精准地识别确定目标用户使用的目标表情包图片所表征出的目标语义内容，并根据该目标语义内容准确地确定出相匹配的目标答复内容以及时进行回复，提高了用户的交互体验。权利要求书3页说明书17页附图6页 CN 114880512 A 2022.08.09 CN 114880512 A 1.一种表情包图片的处理方法，其特征在于，包括：获取目标表情包图片；其中，所述目标表情包图片包括目标用户在对话界面中使用的表情包图片；所述目标表情包图片包括动态表情包图片；根据预设的提取规则，从目标表情包图片所对应的目标图片序列中提取出多个关键帧图片，得到目标图片组；根据预设的语义处理规则，处理目标图片组，以得到目标表情包图片的文本语义内容和/或图像语义内容；其中，预设的语义处理规则至少包括预设的文本语义处理规则和预设的图像语义处理规则；根据目标表情包图片的文本语义内容和/或图像语义内容，确定出目标表情包图片所表征的目标语义内容。 2.根据权利要求1所述的方法，其特征在于，根据预设的提取规则，从目标表情包图片所对应的图片序列中提取出多个关键帧图片，得到目标图片组，包括：解析目标表情包图片，得到目标表情包图片所对应的目标图片序列；根据预设的提取规则，从所述目标图片序列中的第一图片序列中提取第一数量个关键帧图片；从所述目标图片序列中的第二图片序列中提取第二数量个关键帧图片；其中，所述第一图片序列中的图片在目标图片序列中的显示排序早于第二图片序列中的图片；所述第一数量的数值小于第二数量的数值；根据显示排序，排列所述多个关键帧图片，得到目标图片组。 3.根据权利要求2所述的方法，其特征在于，根据预设的语义处理规则，处理目标图片组，以得到目标表情包图片的文本语义内容，包括：根据预设的文本语义处理规则，检测目标图片组中的关键帧图片是否存在文本字符；在确定目标图片组中的关键帧图片存在文本字符的情况下，将存在文本字符的关键帧图片确定为第一类关键帧图片；通过调用预设的OCR识别模型处理所述第一类关键帧图片，以得到第一类关键帧图片的文本语义内容；根据第一类关键帧图片在目标图片序列中的显示排序，组合多个第一类关键帧图片的文本语义内容，得到目标表情包图片的文本语义内容。 4.根据权利要求3所述的方法，其特征在于，通过调用预设的OCR识别模型处理所述第一类关键帧图片，以得到第一类关键帧图片的文本语义内容，包括：调用预设的OCR识别模型处理第一类关键帧图片，以提取出第一类关键帧图片中的文本字符；调用预设的字符分类模型处理第一类关键帧图片中的文本字符，以确定文本字符的字符类型；其中，所述字符类型包括印刷体和非印刷体；根据文本字符的字符类型，利用相匹配的语义识别方式对第一类关键帧图片中的文本字符进行语义识别，以得到第一类关键帧图片的文本语义内容。 5.根据权利要求4所述的方法，其特征在于，在确定文本字符的字符类型为印刷体的情况下，根据文本字符的字符类型，利用相匹配的语义识别方式对第一类关键帧图片中的文本字符进行语义识别，以得到第一类关键帧图片的文本语义内容，包括：根据预设的文本语义处理规则，利用预设的字符模板与第一类关键帧图片中的文本字权　利　要　求　书 1/3 页 2 CN 114880512 A 2符进行文本特征匹配，得到对应的文本匹配结果；根据所述文本匹配结果，确定出第一类关键帧图片的文本语义内容。 6.根据权利要求4所述的方法，其特征在于，在确定文本字符的字符类型为非印刷体的情况下，根据文本字符的字符类型，利用相匹配的语义识别方式对第一类关键帧图片中的文本字符进行语义识别，以得到第一类关键帧图片的文本语义内容，包括：根据预设的文本语义处理规则，利用预设的文本字符语义识别模型处理第一类关键帧图片中的文本字符，得到初始的语义识别结果；其中，预设的文本字符语义识别模型为利用包含有非印刷体的文本字符的字符样本数据训练得到的；在目标用户的对话界面中获取目标表情包图片的上下文关联数据；根据所述上下文关联数据对初始的语义识别结果进行调整，以得到第一类关键帧图片的文本语义内容。 7.根据权利要求2所述的方法，其特征在于，根据预设的语义处理规则，处理目标图片组，以得到目标表情包图片的图像语义内容，包括：根据预设的图像语义处理规则，提取关键帧图片的图像特征；将关键帧图片的图像特征与预设的表情数据库进行图像特征匹配，得到对应的图像匹配结果；其中，所述预设的表情数据库中存储有多个预设的表情包图片，以及与预设的表情包图片对应的语义标签；根据图像匹配结果，确定出与关键帧图片的图像特征相匹配的预设的表情包图片的语义标签，作为关键帧图片的图像语义内容；根据关键帧图片在目标图片序列中的显示排序，组合多个关键帧图片的图像语义内容，得到目标表情包图片的图像语义内容。 8.根据权利要求7所述的方法，其特征在于，在将关键帧图片的图像特征与预设的表情数据库进行图像特征匹配之后，所述方法还包括：在根据图像匹配结果，确定预设的表情数据库中未存在与关键帧图片的图像特征相匹配的预设的表情包图片的情况下，根据预设的图像语义处理规则，在目标用户的对话界面中获取目标表情包图片的上下文关联数据；组合关键帧图片的图像特征和目标表情包图片的上下文关联数据，得到组合特征；利用预设的综合语义识别模型处理所述组合特征，得到对应的综合识别结果；其中，所述预设的综合语义识别模型为利用包含有图像特征和上下文关联数据的综合样本数据训练得到的；根据综合识别结果，确定出关键帧图片的图像语义内容。 9.根据权利要求1所述的方法，其特征在于，根据目标表情包图片的文本语义内容和/ 或图像语义内容，确定出目标表情包图片所表征的目标语义内容，包括：检测目标表情包图片的文本语义内容的可靠度是否符合预设的可靠性要求；在确定目标表情包图片的文本语义内容的可靠度符合预设的可靠性要求的情况下，将所述目标表情包图片的文本语义内容，确定为目标表情包图片所表征的目标语义内容。 10.根据权利要求9所述的方法，其特征在于，在检测目标表情包图片的文本语义内容的可靠度是否符合预设的可靠性要求之后，所述方法还包括：在确定目标表情包图片的文本语义内容的可靠度不符合预设的可靠性要求的情况下，权　利　要　求　书 2/3 页 3 CN 114880512 A 3

专利 表情包图片的处理方法、装置和服务器

专利表情包图片的处理方法、装置和服务器