安全公司报告
文库搜索
切换导航
文件分类
频道
仅15元无限下载
联系我们
问题反馈
文件分类
仅15元无限下载
联系我们
问题反馈
批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210433270.6 (22)申请日 2022.04.24 (71)申请人 中国科学院空天信息创新研究院 地址 100190 北京市海淀区北四环西路19 号 (72)发明人 金力 李晓宇 张泽群 刘庆 张林浩 李树超 (74)专利代理 机构 中科专利商标代理有限责任 公司 11021 专利代理师 樊晓 (51)Int.Cl. G06F 16/33(2019.01) G06F 16/35(2019.01) G06F 40/289(2020.01) G06F 40/30(2020.01)G06N 3/04(2006.01) G06N 3/08(2006.01) (54)发明名称 文本的情感倾向性分析方法、 装置、 设备及 介质 (57)摘要 本公开提供了一种文本的情感倾向性分析 方法, 包括: 从待分析文本中分别提取语义特征、 词性特征 以及共现词特征, 其中, 待分析文本包 括文本内容和与文本内容相关联的评论内容; 将 语义特征、 词性特征 以及共现词特征拼接, 得到 拼接特征; 对拼接特征进行预处理, 得到待分析 文本中的词序列特征; 对待分析文本中的词序列 特征进行聚合, 得到待分析文本的句子向量; 以 及将句子向量输入情感倾向性分析模 型, 输出待 分析文本的情感倾向性分析结果。 本公开还提供 了一种文本的情感倾向性分析装置、 设备、 存储 介质和程序 产品。 权利要求书2页 说明书13页 附图6页 CN 114691836 A 2022.07.01 CN 114691836 A 1.一种文本的情感倾向性分析 方法, 包括: 从待分析文本 中分别提取语义特征、 词性特征以及共现词特征, 其中, 所述待分析文本 包括文本内容和与所述文本内容相关联的评论内容; 将所述语义特 征、 所述词性特 征以及所述共现词特 征拼接, 得到拼接特 征; 对所述拼接特征进行预处理, 得到所述待分析文本中的词序列特 征; 对所述待分析文本中的词序列特 征进行聚合, 得到所述待分析文本的句子向量; 以及 将所述句子向量输入情感倾向性分析模型, 输出所述待分析文本的情感倾向性分析结 果。 2.根据权利要求1中所述的方法, 其中, 所述对所述拼接特征进行预处理, 得到所述待 分析文本中的词序列特 征包括: 对所述拼接特征进行线性激活转换, 生成线性激活的特 征; 对所述拼接特征进行非线性激活转换, 生成非线性激活的特 征; 基于所述 拼接特征, 利用注意力机制得到 权重向量; 根据所述权重向量, 对所述线性激活的特征和所述非线性激活的特征进行组合, 得到 所述待分析文本中的词序列特 征。 3.根据权利要求2中所述的方法, 其中, 所述基于所述拼接特征, 利用注意力机制得到 权重向量包括: 根据不同 映射矩阵, 将所述 拼接特征转换为 查询向量、 键向量以及值向量; 利用所述注意力机制, 获得 具有不同权 重值的拼接特 征; 将所述具有不同权重值的拼接特征通过前向传播层进行降维, 得到降维后的具有不同 权重值的拼接特 征; 将所述降维后的具有不同权 重值的拼接特 征通过非线性激活函数生成所述权 重向量。 4.根据权利要求1中所述的方法, 其中, 所述对所述待分析文本中的词序列 特征进行聚 合, 得到所述待分析文本的句子向量包括: 将所述待分析文本中的词序列特 征输入门控循环单 元; 输出所述待分析文本的句子向量。 5.根据权利要求1中所述的方法, 其中, 所述从待分析文本中分别提取语义特征、 词性 特征以及共现词特 征包括: 将所述待分析文本 输入预训练语言表征模型, 输出 所述语义特 征; 对所述文本内容和所述评论内容中共同出现的词进行嵌入表示, 得到所述共现词特 征; 将所述待分析文本中每 个词的词性进行嵌入表示, 得到所述词性特 征。 6.根据权利要求1中所述的方法, 其中, 所述情感倾向性分析模型通过预先训练得到; 所述预先训练的方法包括: 从训练样本 中分别提取样本语义特征、 样本词性特征以及样本共现词特征, 其中, 所述 训练样本包括: 文本内容样本、 与所述文本内容样本相关联的评论内容样本以及情感标签; 将所述样本语义特征、 所述样本词性特征以及所述样本共现词特征拼接, 得到样本拼 接特征; 对所述样本拼接特 征进行预处理, 得到所述训练样本中的样本词序列特 征;权 利 要 求 书 1/2 页 2 CN 114691836 A 2对所述训练样本中的样本词序列特 征进行聚合, 得到所述训练样本的样本句子向量; 将所述样本句子向量输入分类模型, 输出 所述训练样本的情感倾向性分类结果; 基于所述情感倾向性分类结果和所述情感标签, 调整所述分类模型的参数, 将训练后 的分类模型作为所述情感倾向性分析模型。 7.一种文本的情感倾向性分析装置, 包括: 特征提取模块, 用于从待分析文本 中分别提取语义特征、 词性特征以及共现词特征, 其 中, 所述待分析文本包括文本内容和与所述文本内容相关联的评论内容; 特征拼接模块, 用于将所述语义特征、 所述词性特征以及所述共现词特征拼接, 得到拼 接特征; 预处理模块, 用于对所述 拼接特征进行预处理, 得到所述待分析文本中的词序列特 征; 聚合模块, 用于对所述待分析文本中的词序列特征进行聚合, 得到所述待分析文本的 句子向量; 以及 分析模块, 用于将所述句子向量输入情感倾向性分析模型, 输出所述待分析文本的情 感倾向性分析 结果。 8.一种电子设备, 包括: 一个或多个处 理器; 存储装置, 用于存 储一个或多个程序, 其中, 当所述一个或多个程序被所述一个或多个处理器执行时, 使得所述一个或多个 处理器执行根据权利要求1~6中任一项所述的方法。 9.一种计算机可读存储介质, 其上存储有可执行指令, 该指令被处理器执行时使处理 器执行根据权利要求1~6中任一项所述的方法。 10.一种计算机程序产品, 包括计算机程序, 所述计算机程序被处理器执行时实现根据 权利要求1~6中任一项所述的方法。权 利 要 求 书 2/2 页 3 CN 114691836 A 3
专利 文本的情感倾向性分析方法、装置、设备及介质
文档预览
中文文档
22 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
赞助2.5元下载(无需注册)
温馨提示:本文档共22页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
下载文档到电脑,方便使用
赞助2.5元下载
本文档由 人生无常 于
2024-03-18 17:51:10
上传分享
举报
下载
原文档
(925.4 KB)
分享
友情链接
T-CESA 1101—2020 信息技术服务 治理 安全审计.pdf
NB-T 10179-2019 煤矿在用高压开关设备电气试验规范.pdf
GB-Z 28865-2012 抗电磁干扰软磁铁氧体材料规范.pdf
GB-T 12642-2013 工业机器人 性能规范及其试验方法.pdf
GB-T 39622-2020 挖泥船重力抓斗.pdf
GB-T 25329-2010 企业节能规划编制通则.pdf
T-CNITA 09107—2022 超透气口罩.pdf
GB-T 1683-2018 硫化橡胶 恒定形变压缩永久变形的测定方法.pdf
JR-T 0059-2010 证券期货经营机构信息系统备份能力标准.pdf
腾讯 银行业数据安全体系建设指南 2020.pdf
DB41-T 1435-2017 独山玉饰品质量等级评价 河南省.pdf
GB 19079.11-2005 体育场所开放条件与技术要求 第11部分漂流场所.pdf
GB-T 17729-2023 长途客车内空气质量要求及检测方法.pdf
DB52-T 1636.2-2021 机关事务云 第2部分:公务用车监督管理数据 贵州省.pdf
北京金融产业联盟 金融行业云原生安全体系研究报告 2024.pdf
TB-T 30001-2020 铁路接发列车作业.pdf
GB-T 30583-2014 承压设备焊后热处理规程.pdf
ISO 13119 2022 Health informatics — Clinical knowledge resources — Metadata.pdf
GB-T 39243-2020 船用生物可溶性矿物棉制品技术要求及试验方法.pdf
SN-T 5476-2022 进境马属动物指定隔离检疫场建设规范.pdf
1
/
3
22
评价文档
赞助2.5元 点击下载(925.4 KB)
回到顶部
×
微信扫码支付
2.5
元 自动下载
官方客服微信:siduwenku
支付 完成后 如未跳转 点击这里 下载
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们
微信(点击查看客服)
,我们将及时删除相关资源。