(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 20221027837 7.8
(22)申请日 2022.03.21
(71)申请人 马上消费金融股份有限公司
地址 401120 重庆市渝北区黄山大道中段
52号渝兴广场B2栋4至8楼
(72)发明人 邓泽贵 蒋宁 王洪斌 吴海英
(74)专利代理 机构 北京国昊天诚知识产权代理
有限公司 1 1315
专利代理师 徐晨影
(51)Int.Cl.
G06F 40/30(2020.01)
G06F 40/279(2020.01)
G06F 16/332(2019.01)
G06F 16/33(2019.01)
(54)发明名称
实体链接方法、 装置及电子设备
(57)摘要
本申请公开了一种实体链接方法、 装置及电
子设备。 所述方法包括: 从实体库中召回与目标
对话内容对应的候选实体; 分别对目标对话内
容、 与目标对话内容相关的历史对话内容、 候选
实体及候选实体对应的关联 实体进行特征提取,
得到各对话内容及各实体各自的语义向量; 基于
历史对话内容、 候选实体及关联 实体各自的语义
向量以及注 意力机制, 对目标对话内容的语义向
量进行语义增强, 得到目标对话内容的目标语义
向量; 基于关联实体、 目标对话内容及历史对话
内容各自的语义向量以及注意力机制, 对候选实
体的语义向量进行语义增强, 得到候选实体的目
标语义向量; 基于目标对话内容及候选实体各自
的目标语义向量, 对目标对话内容进行实体链
接。
权利要求书5页 说明书23页 附图4页
CN 114638231 A
2022.06.17
CN 114638231 A
1.一种实体链接方法, 其特 征在于, 包括:
从实体库中召回与待处 理的目标对话内容对应的候选实体;
分别对所述目标对话内容、 与所述目标对话内容相关的历史对话内容、 所述候选实体
及所述候选实体对应的关联实体进行特征提取, 得到所述 目标对话内容、 所述历史对话内
容、 所述候选实体及所述关联实体各自的语义向量;
基于所述历史对话内容、 所述候选实体及所述关联实体各自的语义向量以及注意力 机
制, 对所述 目标对话内容的语义向量进行语义增强, 得到所述 目标对话内容的目标语义向
量;
基于所述关联实体、 所述目标对话内容及所述历史对话内容各自的语义向量以及注意
力机制, 对所述 候选实体的语义向量进行语义增强, 得到所述 候选实体的目标语义向量;
基于所述目标对话内容及候选实体各自的目标语义向量, 将所述目标对话内容中的实
体及片段链接 至与所述目标对话内容对应的候选实体。
2.根据权利要求1所述的方法, 其特征在于, 所述基于所述历史对话内容、 所述候选实
体及所述关联实体各自的语义向量以及注意力机制, 对所述目标对话内容的语义向量进 行
语义增强, 得到所述目标对话内容的目标语义向量, 包括:
基于自注意力 机制和所述历史对话内容的语义向量, 对所述目标对话内容的语义向量
进行语义增强, 得到所述目标对话内容的增强语义向量;
基于自注意力 机制和实体集合中各实体的语义向量, 对所述实体集合中其他实体的语
义向量进 行语义增强, 得到所述实体集合中各实体的增强语义向量, 其中, 所述实体集合包
括所述候选实体和所述关联实体;
基于交叉注意力 机制和所述实体集合中各实体的增强语义向量, 对所述目标对话内容
的增强语义向量进行语义增强, 得到所述目标对话内容的目标语义向量。
3.根据权利要求1所述的方法, 其特征在于, 所述基于所述关联实体、 所述目标对话内
容及所述历史对话内容各自的语义向量以及注意力机制, 对所述候选实体的语义向量进 行
语义增强, 得到所述 候选实体的目标语义向量, 包括:
基于自注意力 机制和所述关联实体的语义向量, 对所述候选实体的语义向量进行语义
增强, 得到所述 候选实体的增强语义向量;
基于自注意力 机制和对话集合中各对话内容的语义向量, 对所述对话集合中其他对话
内容的语义向量进 行语义增强, 得到所述对话集合中各对话内容的增强语义向量, 其中, 所
述对话集合包括所述目标对话内容和所述历史对话内容;
基于交叉注意力 机制和所述对话集合中各对话内容的增强语义向量, 对所述候选实体
的增强语义向量进行语义增强, 得到所述 候选实体的目标语义向量。
4.根据权利要求1所述的方法, 其特征在于, 所述基于所述目标对话内容及候选实体各
自的目标语义向量, 将所述目标对话内容中的实体提及片段链接至与所述目标对话内容对
应的候选实体, 包括:
基于所述目标对话内容及候选实体各自的目标语义向量, 确定所述目标对话内容与 所
述候选实体之间的匹配程度;
若所述目标对话内容与所述候选实体之间的匹配, 则将所述目标对话内容中的实体提
及片段链接 至所述候选实体。权 利 要 求 书 1/5 页
2
CN 114638231 A
25.根据权利要求4所述的方法, 其特征在于, 在基于所述目标对话内容及候选实体各自
的目标语义向量, 确定所述 目标对话内容与所述候选实体之间的匹配程度之前, 所述方法
还包括:
基于召回所述候选实体所使用的召回模式, 获取所述目标对话内容及所述候选实体各
自对应于所述召回模式的实体特 征;
所述基于所述目标对话内容及候选实体各自的目标语义向量, 确定所述目标对话内容
与所述候选实体之间的匹配程度, 包括:
基于所述目标对话内容及所述候选实体各自的目标语义向量, 确定所述目标对话内容
与所述候选实体之间的第一相似度;
基于所述目标对话内容及所述候选实体各自对应于所述召回模式的实体特征, 确定所
述目标对话内容与所述 候选实体之间的第二相似度;
基于所述第 一相似度和所述第 二相似度, 确定所述目标对话内容与 所述候选实体之间
的匹配程度。
6.根据权利要求4所述的方法, 其特征在于, 所述基于所述目标对话内容及候选实体各
自的目标语义向量, 确定所述目标对话内容与所述候选实体之 间的匹配程度之 间的匹配程
度, 包括:
将所述目标对话内容及候选实体各自的目标语义向量输入 匹配网络, 得到所述目标对
话内容与所述候选实体之间的匹配程度, 其中, 所述匹配网络是以不同的第一样本字符串
的语义向量作为输入、 以所述不同的第一样本字符串之 间的匹配程度作为输出进 行训练得
到的。
7.根据权利要求1所述的方法, 其特征在于, 所述在基于所述目标对话内容及候选实体
各自的目标语义向量, 确定所述 目标对话内容与所述候选实体之间的匹配程度之前, 所述
方法还包括:
基于召回所述候选实体所使用的召回模式, 获取所述目标对话内容及所述候选实体各
自对应于所述召回模式的实体特 征;
所述基于所述目标对话内容及候选实体各自的目标语义向量, 确定所述目标对话内容
与所述候选实体之间的匹配程度之间的匹配程度, 包括:
基于召回所述候选实体所使用的召回模式以及所述目标对话内容及所述候选实体各
自对应于召回模式的实体特 征, 确定候选实体的来源特 征向量;
将所述目标对话内容的目标语义向量、 所述候选实体的目标语义向量以及所述候选实
体的来源特征向量输入预先训练的匹配网络, 输出目标对话内容与候选实体之 间的匹配程
度, 其中, 所述匹配网络是以不同的第一样本字符串的语义向量及来源特征向量作为输入、
以所述不同的第一样本 字符串之间的匹配程度作为输出进行训练得到的。
8.根据权利要求1所述的方法, 其特征在于, 所述分别对所述目标对话内容、 与所述目
标对话内容相关的历史对话内容、 所述候选实体及所述候选实体对应的关联实体进行特征
提取, 包括:
将所述目标对话内容、 所述历史对话内容、 所述候选实体及所述候选实体对应的关联
实体输入 特征提取网络, 得到所述目标对话内容、 所述历史对话内容、 所述候选实体及所述
关联实体各自的语义向量, 其中, 所述特征提取网络是以不同的第二样本字符串作为输入、权 利 要 求 书 2/5 页
3
CN 114638231 A
3
专利 实体链接方法、装置及电子设备
文档预览
中文文档
33 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共33页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-18 17:50:17上传分享