(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202210388221.5
(22)申请日 2022.04.13
(71)申请人 西安邮电大 学
地址 710061 陕西省西安市雁塔区长安 南
路563号
(72)发明人 李川 田国强
(74)专利代理 机构 陕西电子 工业专利中心
61205
专利代理师 田文英 王品华
(51)Int.Cl.
G06F 40/289(2020.01)
G06F 40/295(2020.01)
G06F 40/30(2020.01)
G06K 9/62(2022.01)
G06N 3/04(2006.01)G06F 16/35(2019.01)
(54)发明名称
基于图结构的多跳邻居信息融合的事件检
测方法
(57)摘要
本发明提出了一种基于图结构的多跳邻居
信息融合的事件检测方法, 其实现步骤为: (1)生
成训练集; (2)构建基于图结构的多跳邻居信息
融合网络; (3)训练基于图结构的多跳邻居信息
融合网络; (4)检测自然语言文本中的事件。 本发
明构建了基于图结构的多跳邻居信息融合网络,
利用句法依存树中的多跳句法信息, 并使用多 标
签注意力机制融合多跳句法信息, 具有针对性地
提取对事件检测更有效的句法特征, 提高了事件
检测的准确率和效率。
权利要求书2页 说明书8页 附图1页
CN 114707508 A
2022.07.05
CN 114707508 A
1.一种基于 图结构的多跳邻居信息融合的事件检测方法, 其特征在于, 构建并训练多
跳邻居信息融合网络; 该 方法的具体步骤 包括如下:
步骤1, 生成训练集:
步骤1.1, 选取至少500篇自然语言文本组成样本集, 每篇文本至少包含1个完整的事
件, 每个事件中至少包 含1个触发词;
步骤1.2, 对样本集中每篇自然语言文本 中的每个事件句的事件触发词、 事件触发词位
置信息、 词性信息、 实体 类型信息以及事 件类型进行 标注;
步骤1.3, 利用词向量预训练工具, 得到标注后每篇文本中每个触发词对应的词向量,
将每篇文本中所有的句子映射成词向量矩阵;
步骤1.4, 将 样本集中所有的词向量矩阵组成训练集;
步骤2, 构建基于图结构的多跳邻居信息融合网络:
步骤2.1, 搭建一个序列信息提取子网络, 其结构依次为: 由前向GRU层, 反向GRU层、 隐
层和拼接层; 将前向GRU层和反向GRU层的时间步长均设置为30, 隐层的个数设置为125; 设
置拼接层的维度为25 0;
步骤2.2, 搭建一个由三个结构完全相同的第一图注意力层, 第二图注意力层, 第三图
注意力层串联组成的句法信息提取子网络; 每个图注意力层均包括: 第一映射层, 拼接层,
第二映射层, LeakyRelu激活层, Softmax激活层, 第三映射层, ELU激活层;
将第一至第三映射层的输入节点个数分别设置为250、 300、 50, 输出节点的个数分别设
置为150、 50、 150;
将拼接层的输入节点个数设置为15 0, 输出节点个数设置为3 00;
LeakyRelu激活层使用LeakyRelu激活函数实现, Softmax激活层使用Softmax函数实
现; ELU激活层使用ELU激活函数实现; 综上第一图注意力层的输入节点个数为250, 输出节
点个数为15 0;
步骤2.3, 搭建一个多标签注意力融合子网络, 其结构依次为: 映射层、 Softmax层, 融合
层; 将映射层的输入节点个数和输出节点个数分别均设置为150; Softmax激活层使用
Softmax函数实现, 融合层 对Softmax层的输出与每个图注 意力层的输出的乘积进行求和操
作; 将融合层的输入和输出节点个数均设置为15 0;
步骤2.4, 搭建一个触发词识别子网络, 其结构依次为: 第一全连接层、 ReLU激活层、 第
二全连接层和Softmax激活层; 将第一、 第二全连接层的输入节 点个数均设置为150, 输出节
点的个数分别设置为150、 2; ReLU激活层使用ReLU激活函数实现; Softmax激活层使用
Softmax函数实现;
步骤2.5, 将序列信息提取子 网络、 句法信息提取子 网络、 多标签注意力融合子网络、 触
发词识别子网络依次串联组成基于图结构的多跳邻居信息融合网络;
步骤3, 训练基于图结构的多跳邻居信息融合网络:
将训练集输入到基于 图结构的多跳邻居信息融合网络中, 利用反向传播梯度下降法,
迭代更新网络中各层的参数, 直到网络的带偏置的损失函数收敛为止, 得到训练好的基于
图结构的多跳邻居信息融合网络;
步骤4, 检测自然语言文本中的事 件:
步骤4.1, 使用自然语言处理工具, 对待检测自然语言文本中的每个句子进行预处理,权 利 要 求 书 1/2 页
2
CN 114707508 A
2得到待检测文本中每 个句子的句法依存树对应的邻接矩阵;
步骤4.2, 利用词向量预训练工具, 得到待检测自然语言文本中每个句子的每个触发词
对应的词向量; 将每 个句子中所有触发词的词向量组成该句子的词向量矩阵;
步骤4.3, 将每个句子的句法依存树对应的邻 接矩阵和词向量矩阵, 输入到训练好的基
于图结构的多跳邻居信息融合网络中, 通过Softmax层计算出每个句子中的词语被识别为
事件触发词的概 率值, 将其中最高概 率值对应的类别作为事 件检测的结果。
2.根据权利要求1所述的基于图结构的多跳邻居信息融合的事件检测方法, 其特征在
于, 步骤1.1中所述的事件是指: 表示在特定时间和特定地点发生的状态变化, 涉及一个或
多个参与者。
3.根据权利要求1所述的基于图结构的多跳邻居信息融合的事件检测方法, 其特征在
于, 步骤1.1中所述的事件触发词是指: 事件信息中能准确代表事件和表示事件类型的关键
词, 通常为动词或名词, 是事 件的核心单 元。
4.根据权利要求1所述的基于图结构的多跳邻居信息融合的事件检测方法, 其特征在
于, 步骤1.1中所述的事件触发词位置信息是指: 事件触发词在事件句中的绝对位置, 即事
件触发词是事 件句中第几个词语。
5.根据权利要求1所述的基于图结构的多跳邻居信息融合的事件检测方法, 其特征在
于, 步骤3中所述的带偏置的损失函数如下:
其中, J(·)表示带偏置的损失函数, θ表示函数中的参数的集合, max( ·)表示取最大
值操作, Nst表示输入到多跳邻居信息融合网络的训练集中句子的总数, ni表示输入到多跳
邻居信息融合网络的训练集中第i个句子si中单词的总数, j 表示句子si中的单词序号, I(O)
表示一个开关函数, 用于区分标签 “O”和事件类型标签的损失, 当标签类型为 “O”时, I(O)=
1, 否则, I(O)=0, log( ·)表示以10为底的取对数操作,
表示在参数为θ, 句子为
si时, 第j个单词wj的标签为t的概率, ω表示偏置权重, ω越大, 代表触发词标签对网络的影
响越大。
6.根据权利要求1所述的基于图结构的多跳邻居信 息融合事件检测方法, 其特征在于,
步骤4.2中所述词向量矩阵指的是: 将每个句子所有词语的词向量组成该句子的词向量矩
阵, 其中, 词向量矩阵的行数为该句子中词语的总 数, 列数为该句子对应的词向量的维度;
对每个词向量矩阵进行对齐, 如果该矩阵超过50行, 则截取前50行, 如果少于50行, 则在矩
阵下方补零至 50行。权 利 要 求 书 2/2 页
3
CN 114707508 A
3
专利 基于图结构的多跳邻居信息融合的事件检测方法
文档预览
中文文档
12 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共12页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-18 17:49:07上传分享