(19)国家知识产权局
(12)发明 专利
(10)授权公告 号
(45)授权公告日
(21)申请 号 202210375116.8
(22)申请日 2022.04.11
(65)同一申请的已公布的文献号
申请公布号 CN 114444473 A
(43)申请公布日 2022.05.06
(73)专利权人 江西财经 大学
地址 330013 江西省南昌市经济技 术开发
区双港东大街169号
(72)发明人 万齐智 万常选 胡蓉 刘德喜
刘喜平
(74)专利代理 机构 北京中济纬天专利代理有限
公司 11429
专利代理师 黄攀
(51)Int.Cl.
G06F 40/211(2020.01)
G06F 40/30(2020.01)
(56)对比文件
CN 113255320 A,2021.08.13US 2022092267 A1,202 2.03.24
US 8762131 B1,2014.0 6.24
CN 113157859 A,2021.07.23
CN 112507077 A,2021.0 3.16
CN 112560432 A,2021.0 3.26
US 2021209139 A1,2021.07.08
CN 113705196 A,2021.1 1.26
万齐智 等.基 于句法语义依存分析的中文
金融事件抽取. 《计算机学报》 .2021,第4 4卷(第3
期),
陈启 等.增强语义表示的中文金融评价要
素抽取. 《小型微型计算机系统》 .2021,
苗琳 等.基 于图神经网络的联合实体关系
抽取. 《计算机 应用研究》 .202 2,第39卷(第2期),
Guoqiong Liao et al. .Group event
recommendation based o n graph multi- head
attention network combi ning explicit and
implicit informati on. 《Informati on
Processing and Mana gement》 .2021,
审查员 姜晓盼
(54)发明名称
基于多通道层次图注意力网络的开放事件
抽取方法与系统
(57)摘要
本发明提出一种基于多通道层次图注意力
网络的开放事件抽取方法与系统, 该方法包括:
获取给定文档, 根据给定文档建立得到文档句法
依存树; 基于文档句法依存树, 依次按照调整依
存结构、 关联缺省成分、 添加序列顺序以及关联
祖先结点与后代结点的步骤, 以构建得到双向依
存图; 基于原始图注意力网络, 嵌入结点类型并
进行层级调整, 以改造原始图注 意力网络的特征
汇聚过程, 进而构建得到层次图注意力网络; 构
建得到三通道图注意力网络; 将给定文档中的词
语, 输入至三通道图注意力网络更新嵌入表示,
并通过全 连接网络进行四分类判断, 以实现开放
事件的抽取。 本发明可有效增强图结构的特征编码能力。
权利要求书5页 说明书12页 附图2页
CN 114444473 B
2022.06.21
CN 114444473 B
1.一种基于多通道层次图注意力网络的开放事件抽取方法, 其特征在于, 所述方法包
括如下步骤:
步骤一、 获取 给定文档, 根据所述给定文档建立得到文档句法依存树;
步骤二、 基于所述文档句法依存树, 依次按照调整依存结构、 关联缺省成分、 添加序列
顺序以及关联 祖先结点与后代结点的步骤, 以构建得到双向依存图;
步骤三、 基于原始图注意力网络, 嵌入结点类型并进行层级调整, 以改造所述原始图注
意力网络的特征汇 聚过程, 进而构建得到层次图注意力网络, 其中所述结点类型包括自身
结点、 父结点、 兄弟结点、 子结点以及孙结点, 嵌入结点类型并进行层级调整表示在所述原
始图注意力网络中添加结点类型的权 重以及添加结点层级的权 重;
步骤四、 基于所述层次图注意力网络, 编码得到词语语义特征、 句法依存关系类型特征
以及词性特征, 并根据所述词语语义特征、 所述句法依存关系类型特征以及所述词性特征
构建得到三通道图注意力网络, 其中所述三通道图注意力网络包括词语语义图注意力网
络、 句法依存关系图注意力网络以及词语词性图注意力网络;
步骤五、 将所述给定文档中的词语, 输入至所述三通道图注意力网络更新嵌入表示, 并
通过全连接网络进行四分类判断, 以实现开放事件的抽取, 其中四分类包括主语、 谓语、 宾
语及非主谓宾短语。
2.根据权利要求1所述的基于多通道层次图注意力网络的开放事件抽取方法, 其特征
在于, 在所述 步骤一中, 所述文档句法依存树的构建方法包括如下步骤:
采用句法依存分析工具对所述给定文档进行分句以得到多个 语句;
依次对所述给定文档中的每 个语句进行句法结构解析, 以得到语句的句法依存树;
将所有语句对应的句法依存树按照语句顺序进行排列, 以建立得到所述文档句法依存
树;
其中, 所述给定文档
表示为
, 在所述给定文档
中, 第
个语句
的词语
表示为:
其中,
表示给定文档
中的语句数量,
表示语句长度,
表示语句中的第
个
词语, 每个词语对应 语句中一个结点。
3.根据权利要求2所述的基于多通道层次图注意力网络的开放事件抽取方法, 其特征
在于, 在所述步骤三中, 在所述原始图注意力网络中, 结点 i与结点j之间的原始图注意力系
数
表示为:
其中,W为变换矩阵,
为结点i的嵌入表示,
为结点j的嵌入表示,
为共享注意力
机制;权 利 要 求 书 1/5 页
2
CN 114444473 B
2采用softmax 归一化公式对原 始图注意力系数
进行标准化可得:
其中,
表示原始图注意力系数
标准化后的结果,
表示结点 i与结点
之间的
原始图注意力系数,
表示与结点 i直接相连的结点 集合;
原始图中结点 i基于多头注意力机制的嵌入表示
的公式为:
其中,K为多头注意力的头数,
为非线性函数,
为结点i和结点j的第k头注意力系
数,
表示第k头注意力的变换矩阵。
4.根据权利要求3所述的基于多通道层次图注意力网络的开放事件抽取方法, 其特征
在于, 在所述步骤三中, 在所述层次图注意力网络中, 结点
与结点
之间的层次图注意力
系数
表示为:
其中,
表示结点 j汇聚至结点 i时的类型,
表示结点
汇聚至结点 i时的类
型,
的取值范围为(0, 1],
表示对共享注意力机制
进行参数化,
表示激活函数,
表示结点
的嵌入表示;
层次图中结点 i基于多头注意力机制的嵌入表示
的公式为:
其中 ,
,
表示结点 j的层级 ,
为标准化后的层级值 ,
。
5.根据权利要求4所述的基于多通道层次图注意力网络的开放事件抽取方法, 其特征权 利 要 求 书 2/5 页
3
CN 114444473 B
3
专利 基于多通道层次图注意力网络的开放事件抽取方法与系统
文档预览
中文文档
20 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共20页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-18 17:49:16上传分享