(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202210445438.5
(22)申请日 2022.04.26
(71)申请人 中国建设银行股份有限公司
地址 100033 北京市西城区金融大街25号
(72)发明人 熊伊
(74)专利代理 机构 北京三友知识产权代理有限
公司 11127
专利代理师 贾磊 李辉
(51)Int.Cl.
G06F 16/583(2019.01)
G06F 40/30(2020.01)
(54)发明名称
表情包图片的处 理方法、 装置和服 务器
(57)摘要
本说明书提供了表情包图片的处理方法、 装
置和服务器。 该方法涉及人工智 能技术领域, 基
于该方法, 在智 能客服场景中, 当目标用户在对
话界面中使用诸如动态表情包图片等目标表情
包图片时, 服务器可 以先根据预设的提取规则,
从目标表情包图片所对应的目标图片序列中提
取出多个关键帧图片, 得到目标图片组; 再根据
预设的语义处理规则, 处理目标图片组, 得到并
根据目标表情 包图片的文本语义内容和/或图像
语义内容, 确定出目标表情包图片所表征的目标
语义内容。 从而能够自动且精 准地识别确定目标
用户使用的目标表情包图片所表征出的目标语
义内容, 并根据该目标语义内容准确地确定出相
匹配的目标答复内容以及时进行回复, 提高了用
户的交互体验。
权利要求书3页 说明书17页 附图6页
CN 114880512 A
2022.08.09
CN 114880512 A
1.一种表情包图片的处 理方法, 其特 征在于, 包括:
获取目标表情包图片; 其中, 所述目标表情包图片包括目标用户在对话界面中使用的
表情包图片; 所述目标表情包图片包括动态 表情包图片;
根据预设的提取规则, 从 目标表情包图片所对应的目标图片序列中提取出多个关键帧
图片, 得到目标图片组;
根据预设的语义处理规则, 处理目标图片组, 以得到目标表情包图片的文本语义内容
和/或图像语义内容; 其中, 预设的语义处理规则至少包括预设的文本语义处理规则和预设
的图像语义处理规则;
根据目标表情包图片的文本语义内容和/或图像语义内容, 确定出目标表情包图片所
表征的目标语义内容。
2.根据权利要求1所述的方法, 其特征在于, 根据预设的提取规则, 从目标表情包图片
所对应的图片序列中提取 出多个关键帧图片, 得到目标图片组, 包括:
解析目标表情包图片, 得到目标表情包图片所对应的目标图片序列;
根据预设的提取规则, 从所述目标图片序列中的第 一图片序列中提取第 一数量个关键
帧图片; 从所述目标图片序列中的第二图片序列中提取第二数量个关键帧图片; 其中, 所述
第一图片序列中的图片在目标图片序列中的显示排序早于第二图片序列中的图片; 所述第
一数量的数值小于第二数量的数值;
根据显示 排序, 排列所述多个关键帧图片, 得到目标图片组。
3.根据权利要求2所述的方法, 其特征在于, 根据预设的语义处理规则, 处理目标图片
组, 以得到目标表情包图片的文本语义内容, 包括:
根据预设的文本语义处 理规则, 检测目标图片组中的关键帧图片是否存在文本 字符;
在确定目标图片组中的关键帧图片存在文本字符的情况下, 将存在文本字符的关键帧
图片确定为第一类关键帧图片;
通过调用预设的OCR识别模型处理所述第一类关键帧图片, 以得到第一类关键帧图片
的文本语义内容;
根据第一类关键帧图片在目标图片序列中的显示排序, 组合多个第 一类关键帧图片的
文本语义内容, 得到目标表情包图片的文本语义内容。
4.根据权利要求3所述的方法, 其特征在于, 通过调用预设的OCR识别模型处理所述第
一类关键帧图片, 以得到第一类关键帧图片的文本语义内容, 包括:
调用预设的OCR识别模型处理第一类关键帧图片, 以提取出第一类关键帧图片中的文
本字符;
调用预设的字符分类模型处理第 一类关键帧图片中的文本字符, 以确定文本字符的字
符类型; 其中, 所述字符类型包括印刷体和非印刷体;
根据文本字符的字符类型, 利用相匹配的语义识别方式对第 一类关键帧图片中的文本
字符进行语义识别, 以得到第一类关键帧图片的文本语义内容。
5.根据权利要求4所述的方法, 其特征在于, 在确定文本字符的字符类型为印刷体的情
况下, 根据文本字符的字符类型, 利用相匹配的语义识别方式对第一类关键帧图片 中的文
本字符进行语义识别, 以得到第一类关键帧图片的文本语义内容, 包括:
根据预设的文本语义处理规则, 利用预设的字符模板与第 一类关键帧图片中的文本字权 利 要 求 书 1/3 页
2
CN 114880512 A
2符进行文本特 征匹配, 得到对应的文本匹配结果;
根据所述文本匹配结果, 确定出第一类关键帧图片的文本语义内容。
6.根据权利要求4所述的方法, 其特征在于, 在确定文本字符的字符类型为非印刷体的
情况下, 根据文本字符的字符类型, 利用相匹配的语义识别方式对第一类关键帧图片 中的
文本字符进行语义识别, 以得到第一类关键帧图片的文本语义内容, 包括:
根据预设的文本语义处理规则, 利用预设的文本字符语义识别模型处理第 一类关键帧
图片中的文本字符, 得到初始的语义识别结果; 其中, 预设的文本字符语义识别模型为利用
包含有非印刷体的文本 字符的字符样本数据训练得到的;
在目标用户的对话界面中获取目标表情包图片的上 下文关联 数据;
根据所述上下文关联数据对初始的语义识别结果进行调整, 以得到第 一类关键帧图片
的文本语义内容。
7.根据权利要求2所述的方法, 其特征在于, 根据预设的语义处理规则, 处理目标图片
组, 以得到目标表情包图片的图像 语义内容, 包括:
根据预设的图像 语义处理规则, 提取关键帧图片的图像特 征;
将关键帧图片的图像特征与 预设的表情数据库进行图像特征匹配, 得到对应的图像匹
配结果; 其中, 所述预设的表情数据库中存储有多个预设的表情包图片, 以及与预设的表情
包图片对应的语义标签;
根据图像匹配结果, 确定出与关键帧图片的图像特征相匹配的预设的表情包图片的语
义标签, 作为关键帧图片的图像 语义内容;
根据关键帧图片在目标图片序列中的显示排序, 组合多个关键帧图片的图像语义内
容, 得到目标表情包图片的图像 语义内容。
8.根据权利要求7所述的方法, 其特征在于, 在将关键帧图片的图像特征与 预设的表情
数据库进行图像特 征匹配之后, 所述方法还 包括:
在根据图像匹配结果, 确定预设的表情数据库中未存在与关键帧图片的图像特征相匹
配的预设的表情包图片的情况下, 根据预设的图像语义处理规则, 在目标用户的对话界面
中获取目标表情包图片的上 下文关联 数据;
组合关键帧图片的图像特 征和目标表情包图片的上 下文关联 数据, 得到组合特 征;
利用预设的综合语义识别模型处理所述组合特征, 得到对应的综合识别结果; 其中, 所
述预设的综合语义识别模型为利用包含有图像特征和上下文关联数据的综合样本数据训
练得到的;
根据综合识别结果, 确定出关键帧图片的图像 语义内容。
9.根据权利要求1所述的方法, 其特征在于, 根据目标表情包图片的文本语义内容和/
或图像语义内容, 确定出目标表情包图片所表征的目标语义内容, 包括:
检测目标表情包图片的文本语义内容的可靠度是否符合预设的可靠性要求;
在确定目标表情包图片的文本语义内容的可靠度符合预设的可靠性要求的情况下, 将
所述目标表情包图片的文本语义内容, 确定为目标表情包图片所表征的目标语义内容。
10.根据权利要求9所述的方法, 其特征在于, 在检测目标表情包图片的文本语义内容
的可靠度是否符合预设的可靠性要求之后, 所述方法还 包括:
在确定目标表情包图片的文本语义内容的可靠度不符合预设的可靠性要求的情况下,权 利 要 求 书 2/3 页
3
CN 114880512 A
3
专利 表情包图片的处理方法、装置和服务器
文档预览
中文文档
27 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共27页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-18 17:52:13上传分享