安全公司报告
文库搜索
切换导航
文件分类
频道
仅15元无限下载
联系我们
问题反馈
文件分类
仅15元无限下载
联系我们
问题反馈
批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210390696.8 (22)申请日 2022.04.14 (71)申请人 西安邮电大 学 地址 710121 陕西省西安市长安区西长安 街618号 (72)发明人 曹小鹏 尤聪聪 赵维维 (51)Int.Cl. G06F 16/34(2019.01) G06F 40/30(2020.01) G06N 3/04(2006.01) G06N 3/08(2006.01) G06F 17/10(2006.01) (54)发明名称 一种融合语义图的文本摘要生成方法 (57)摘要 本发明提出一种融合语义图的文本摘要生 成方法, 传统单一模型解决文本摘要生成时表现 较差的问题, 本发明的技术方案主要包括以下步 骤: (1)提取文本 上下文特征(2)提取语义图特征 (3)融合文本上下文特征和语义图特征(4)词向 量预测(5)模型训练, 生成文本摘要。 该方法主要 应用于文本摘要生成应用。 权利要求书1页 说明书5页 附图1页 CN 114691859 A 2022.07.01 CN 114691859 A 1.一种融合语义图的文本摘要生成方法, 其特 征在于包括以下步骤: (1)提取文本上下文特征: 利用文本编码器对原始文本进行编码, 提取文本的上下文特 征; (2)提取语义图特征: 利用开放信息提取技术提取原始文本三元组结构, 利用斯坦福自 然语言处理工具对三元组进行指代消 解, 构建原始文本的图结构, 最后利用图注意力网络 提取图结构特 征; (3)融合文本上下文特征和语义图特征: 利用解码器的隐藏状态并结合注意力机制计 算文本上 下文向量以及图结构向量, 然后将两者 拼接得到文本序列向量。 (4)词向量预测: 利用文本序列向量以及指针网络预测下一时刻的词向量; (5)模型训练, 生成文本摘要: 利用损失函数对该模型进行训练, 训练过后生成文本摘 要。权 利 要 求 书 1/1 页 2 CN 114691859 A 2一种融合 语义图的文本摘要生成方 法 技术领域 [0001]本发明属于计算机自然语言处理领域, 具体涉及 一种融合语义图的文本摘要生成 方法。 背景技术 [0002]自动文本摘要属于自然语言处理领域的研究热点, 随着深度神经网络技术的出现 和发展, 特别是基于序列到序列模型在自动文本摘要上 的成功运用, 促进了自动文本摘要 技术的快速发展。 在序列到序列模型中, 编码器和解码器一般是基于循环神经网络 (Recurrent Neural Network, RNN)以及长短期记忆网络(Long Short‑Term Memory, LSTM)。 LSTM是对RNN的优化, 通过输入门、 遗忘门、 输出门三个结构来实现对信息的保护和 控制, 改善了长期依赖问题。 虽然LSTM提取到文本上下文 特征, 但是对于原始文本的语句结 构特征并没有提取到, 导 致生成的摘要偏离 输入语句语义, 摘要质量并不理想 。 [0003]Rush等人受神经机器翻译的启发, 首次将Se q2Seq模型运用到生成式摘要任务, 提 出一种基于神经注 意的抽象摘要模 型, 取得了不错的效果。 随后, Chopra等人对其进行了优 化和扩展, 解码器选用RNN, 在Gigaword数据集上取得了很好的效果, 进一步提升了生成式 文本摘要的质量, 但是对于摘要生成过程中出现的未登录词以及重复生成问题, 模型并没 有解决。 基于此, Gu等人将复制机制应用于Seq2Seq中, 提出一种新模型CopyNet, 该模型把 单词生成与复制机制结合, 不仅可以保留文本重要的信息, 而且可以生成新的单词, 很好的 解决了未登录词问题。 同一时期, See等人把覆盖机制应用于摘要生成中, 很好的缓解了重 复生成问题, 取得了 当时最先进的结果。 虽然之前的研究已经取得了不错的效果, 但是并没 有解决Seq2Seq模型曝光偏 差问题。 Paulus等人提出在编码器 ‑解码器模型中加入强化学习 来解决这个问题, 他们采用自批评策略梯度算法训练模型, 有效解决上面的问题, 提高了生 成摘要的可读性。 [0004]Takase等人提出了一种基础注意力机制的摘要生成模型, 利用抽象意义表示引导 摘要生成, 取得了不错的效果, 但是模型并没有同原始文本内容进行结合。 Cao等人提出双 注意力模 型, 把原始文本和从中提取的事实作为条件, 提高了生成摘要的准确性, 但是在常 识性错误上还有待提高。 Li等人提出一种双重注意力指针模型, 利用自注意力机制产生原 始文本的关键特性, 让其与 原始文本信息融合生成摘要, 弥补了摘要关键特性不足的缺点, 但并没有对文本的深层语义进 行分析, 导致生成的摘要与 原始文本语义还有偏差。 Cui等人 提出一种针对多文档摘要生成的模型, 通过对多个文档构建异构图, 同时引入主题建模发 现潜在主题, 两者结合生成了高质量的摘要。 Thong等人针对现有模型中短程依赖问题, 引 入具有规范化流的神经主题模型以捕获文本的全局语义, 有效解决了该问题。 但是该模型 并没有考虑到把文本语句的结构信息和语句中实体之 间的联系同摘要生成过程结合起来, 导致生成的摘要质量 不佳。说 明 书 1/5 页 3 CN 114691859 A 3
专利 一种融合语义图的文本摘要生成方法
文档预览
中文文档
8 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
赞助2.5元下载(无需注册)
温馨提示:本文档共8页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
下载文档到电脑,方便使用
赞助2.5元下载
本文档由 人生无常 于
2024-03-18 17:47:24
上传分享
举报
下载
原文档
(497.2 KB)
分享
友情链接
GB-T 29490-2023 企业知识产权合规管理体系 要求.pdf
GB-T 4437.1-2015 铝及铝合金热挤压管 第1部分:无缝圆管.pdf
GB-T 479-2016 烟煤胶质层指数测定方法.pdf
H3C防火墙安全配置基线.doc
DB5301-T 100-2023 改性磷石膏综合利用 矿山生态修复 跟踪评估规范 昆明市.pdf
YD-T 4177.1-2022 移动互联网应用程序(APP)收集使用个人信息最小必要评估规范 第1部分:总则.pdf
GB-T 37027-2018 信息安全技术 网络攻击定义及描述规范.pdf
安全牛 现代企业零信任安全构建应用指南研究报告 2021.pdf
GB-T 37124-2018 进入天然气长输管道的气体质量要求.pdf
GB-T 8259-2008 卡箍式柔性管接头 技术条件.pdf
GB-T 20518-2018 信息安全技术 公钥基础设施 数字证书格式.pdf
DB42-T 1946-2022 工业锅炉燃油燃气燃烧器节能等级评价方法 湖北省.pdf
GB-T 34945-2017 信息技术 数据溯源描述模型.pdf
DB52-T 1239.2-2017 政府数据 核心元数据 第2部分:法人单位基础数据 贵州省.pdf
GB-T 25068.3-2022 信息技术 安全技术 网络安全 第3部分:面向网络接入场景的威胁、设计技术和控制.pdf
T-CADERM 5005—2019 国家级卫生应急培训演练基地建设规范.pdf
ISO 11515 2022 Gas cylinders — Refillable composite reinforced tubes of water capacity between 450 l and 3000 l — Design, construction and testing.pdf
GB-T 3610-2010 电池锌饼.pdf
DB37-T 3160-2018 渔港安全管理规范 山东省.pdf
SN-T 4579-2016 进口汽车部件检验规程 铝合金车轮.pdf
1
/
3
8
评价文档
赞助2.5元 点击下载(497.2 KB)
回到顶部
×
微信扫码支付
2.5
元 自动下载
官方客服微信:siduwenku
支付 完成后 如未跳转 点击这里 下载
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们
微信(点击查看客服)
,我们将及时删除相关资源。