(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202210379844.6
(22)申请日 2022.04.12
(71)申请人 电子科技大 学
地址 610000 四川省成 都市高新区(西区)
西源大道 2006号
申请人 电子科技大 学 (深圳) 高等研究院
广州大学
(72)发明人 谢禹舜 顾钊铨 方滨兴 王乐
韩伟红 李树栋 张登辉 吴玉姣
(74)专利代理 机构 北京高航知识产权代理有限
公司 11530
专利代理师 刘艳玲
(51)Int.Cl.
G06Q 40/04(2012.01)
G06Q 30/02(2012.01)G06F 16/951(2019.01)
G06F 40/216(2020.01)
G06F 40/284(2020.01)
G06F 40/289(2020.01)
G06F 40/30(2020.01)
G06N 3/04(2006.01)
G06N 3/08(2006.01)
(54)发明名称
一种结合新闻大事件的多源信息股票价格
预测方法及系统
(57)摘要
本发明一方面提供了一种结合新闻大事件
的多源信息股票价格预测方法, 包括S1, 获取新
闻大事件的情感特征表示; S2, 获取股民的情感
特征表示; S3, 获取股票价格的历史数据特征表
示; S4, 基于新闻大事件的情感特征表示、 股民的
情感特征表示、 股票价格的历史数据特征表示,
训练深度神经网络模型, 预测未来的股票价格波
动。 另一方面还提供了用于实现上述方法的系
统。 与只采用财经新闻和股票历史数据的方法相
比, 本发明可显著提高股票价格的预测精度, 解
决股票价格预测准确度低的技 术问题。
权利要求书2页 说明书7页 附图2页
CN 114936932 A
2022.08.23
CN 114936932 A
1.一种结合 新闻大事 件的多源信息股票 价格预测方法, 其特 征在于, 包括:
S1, 基于新闻报道的突发大型公共事件的文本语料, 分析突发事件对股票市场的影响
倾向, 获取新闻大事 件的情感特 征表示;
S2, 基于公共平台的推文文本和股民评论, 分析市场环境中股民的情绪倾向, 获取股民
的情感特 征表示;
S3, 基于股票市场的历史指标 数据, 获取股票 价格的历史数据特 征表示;
S4, 基于新闻大事件的情 感特征表示、 股民的情 感特征表示、 股票价格的历史数据 特征
表示, 训练深度神经网络模型, 预测未来的股票 价格波动。
2.根据权利要求1所述的一种结合新闻大事件的多源信息股票价格预测方法, 其特征
在于, 所述S1包括:
S11, 对新闻权威网站的主页内容进行爬取, 对获取的文本语料进行预处理, 将预处理
后的文本语料转 化为词向量表示;
S12, 将词向量表示输入到朴素贝叶斯模型进行训练, 对词向量空间进行微调, 直到模
型准确率大于等于阈值 ε, 基于微调后的词向量空间更新每条文本语料对应的词向量表示;
S13, 在给定的时间范围t内, 利用算法平均法获取给定时间t内的情感向量, 将其作为
新闻大事 件的情感特 征表示。
3.根据权利要求1所述的一种结合新闻大事件的多源信息股票价格预测方法, 其特征
在于, 所述S2包括:
S21, 对股市权威网站的推文文本和股民评论进行爬取, 对获取的文本语料进行预处
理, 将处理后的文本语料转 化为词向量表示;
S22, 将推文文本的词向量表示输入到支持向量机模型进行训练, 对词向量空间进行微
调, 直到模型准确率大于等于阈值 ε, 基于微调后的词向量空间更新每条推文文本对应的词
向量表示;
S23, 将股民评论的词向量表示输入到支持向量机模型进行训练, 对词向量空间进行微
调, 直到模型准确率大于等于阈值 ε, 基于微调后的词向量空间更新每条股民评论对应的词
向量表示;
S24, 在给定的时间范围t内, 利用算法平均法分别获取给定时间t内的推文文本词向量
和股民评论词向量, 将两者 拼接, 作为股民的情感特 征表示。
4.根据权利要求1所述的一种结合新闻大事件的多源信息股票价格预测方法, 其特征
在于, 所述S3包括:
S31, 对预设的财经网站的股票历史数据进行爬取, 获取每个股票每日的开盘价、 收盘
价、 当日最高价、 当日最低价和交易 量;
S32, 对爬取的数据进行数据处理, 获得处理后的数据, 数据处理包括去量纲、 时间标签
排序和缺失值处 理;
S33, 根据每 个股票每日的处 理后的数据, 计算以下技 术指标:
涨跌幅、 简单移动平均线、 指数移动平均线、 平均真实范围、 平均方向运动指数、 商品通
道指数、 价格 变化率、 相对强度指数、 威廉震荡指标、 随机指标%K、 随机指标%D;
S34, 在给定的时间范围t内, 利用算法平均法分别获取给定时间t内的15个特征数值,
并进行标准化处理, 将特征数值的取值范围控制在(0,1)之间, 将标准化处理后获得的特征权 利 要 求 书 1/2 页
2
CN 114936932 A
2数值作为股票 价格的历史数据特 征表示。
5.据权利要求1所述的一种结合新闻大事件的多源信息股票价格预测方法, 其特征在
于, 所述S4包括:
S41, 对新闻大事件的情感特征表示、 股民的情感特征表示、 股票价格的历史数据特征
表示进行对齐、 合并处 理, 获得处 理数据;
S42, 对处 理数据进行 标准化处理, 生成融合多源信息的特 征表示;
S43, 将融合多源信息的特征表示输入到预设的深度神经网络模型中进行训练, 根据训
练后的深度神经网络模型 预测未来的股票 价格波动。
6.根据权利要求2 ‑4任一项所述的一种结合新闻大事件的多源信息股票价格预测方
法, 其特征在于, 所述预 处理包括文本 分词、 过滤停用词、 词性还原 合并、 文本长度截取和补
足。
7.一种结合新闻大事件的多源信息股票价格预测系统, 其特征在于, 包括新闻大事件
的情感特征表示模块、 股民的情感特征表示模块、 股票价格的历史数据特征表示模块和股
票价格预测模块;
新闻大事件的情感特征表示模块用于基于新闻报道的突发大型公共事件的文本语料,
分析突发事 件对股票市场的影响倾向, 获取新闻大事 件的情感特 征表示;
股民的情感特征表示模块用于基于公共平台的推文文本和股民评论, 分析市场环境中
股民的情绪 倾向, 获取股民的情感特 征表示;
股票价格的历史数据 特征表示模块用于基于股票市场的历史指标数据, 获取股票价格
的历史数据特 征表示;
股票价格预测模块用于基于新闻大事件的情感特征表示、 股民的情感特征表示、 股票
价格的历史数据特 征表示, 训练深度神经网络模型, 预测未来的股票 价格波动。权 利 要 求 书 2/2 页
3
CN 114936932 A
3
专利 一种结合新闻大事件的多源信息股票价格预测方法及系统
文档预览
中文文档
12 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共12页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-18 17:47:08上传分享