(19)中华 人民共和国 国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202111674079.2
(22)申请日 2021.12.31
(71)申请人 广东长天思 源环保科技股份有限公
司
地址 528200 广东省佛山市南海区桂城街
道深海路17号瀚天科技城A区8号楼 三
楼302单元
(72)发明人 叶效强 蒋鸿伟 谭成灶 胡晓辉
梁文智 李健森 吴君句 张广昕
骆大清
(74)专利代理 机构 佛山市禾才知识产权代理有
限公司 4 4379
代理人 刘羽波 陈嘉琦
(51)Int.Cl.
G06F 16/2458(2019.01)G06F 16/29(2019.01)
G06N 3/04(2006.01)
G06N 3/08(2006.01)
G06Q 10/04(2012.01)
G06Q 50/26(2012.01)
(54)发明名称
一种基于多源数据的河涌水质时空预测方
法及系统
(57)摘要
本发明的目的在于提出一种基于多源数据
的河涌水质时空预测方法及系统, 其中基于多源
数据的河涌水质时空预测方法包括步骤S1: 定位
的河涌类型为以生活污水为主导的河涌; 步骤
S2: 选取河涌现有的固定监测站为中心监测站;
步骤S3: 建立河涌的空间坐标系; 步骤S4: 选取巡
检设备巡航监测, 获取水质分布情况; 步骤S5: 以
温度, 风速, 日照、 气压、 湿度和降雨气象因素为
特征指标, 通过深度学习方法构建中心监测站的
水质时间序列预测模型; 步骤S6: 根据巡检设备
巡航监测数据, 使用LS TM模型构建不同监测时段
的中心监测站与任一空间坐标点的污染映射关
系模型; 步骤S7: 结合水质时间序列预测模型与
污染映射关系模 型, 对河涌任一监测点的水质进
行时空预测。
权利要求书3页 说明书10页 附图3页
CN 114398423 A
2022.04.26
CN 114398423 A
1.一种基于多源数据的河涌水质时空预测方法, 其特 征在于, 包括以下步骤:
步骤S1: 定位的河涌类型为以生活污水为主导的河涌;
步骤S2: 选取河涌现有的固定监测站为中心监测站;
步骤S3: 建立河涌的空间坐标系, 通过经度、 纬度、 深度建立空间坐标系, 以反映河涌任
一监测点;
步骤S4: 选取巡检设备巡航 监测, 获得 各空间坐标系中任一 监测点的水质分布情况;
步骤S5: 以温度, 风速, 日照、 气压、 湿度和降雨气象因素为特征指标, 通过深度学习方
法构建中心监测站的水质时间序列预测模型;
步骤S6: 根据巡检设备巡航监测数据, 使用LSTM模型构建不同监测时段的中心监测站
与任一空间坐标点的污染映射关系模型;
步骤S7: 结合水质时间序列预测模型与污染映射关系模型, 对河涌任一监测点的水质
进行时空预测。
2.根据权利要求1所述的一种基于多源数据的河涌水质时空预测方法, 其特征在于, 所
述步骤S5的具体如下:
步骤S51: 获取中心监测站数据和气象因素数据, 并对数据完整性进行检查, 补全报文
缺失的时段, 并将补全 时段的监测值标记为NULL值, 剔除缺失值/NULL值、 值不变、 负值、 超
量程、 低于0.3%分位数的极小值以及超出99.7%分位数的极大值不符合现场监测情况的
显著异常值;
步骤S52: 将监测仪器处于故障期间、 维修期间、 超期限未校准时段、 失控时段、 有计划
的维护保养、 校准校验非正常监测时段 的数据予以剔除, 所述监测仪器为获取中心监测站
数据的工具;
步骤S53: 对被剔除的数据以及缺失的数据采用均值插补法进行补充;
步骤S54: 构建水质时间序列预测模型, 将中心监测站前一监测时间的中心监测站数据
与气象因素作为当前监测时间的特征指标, 并输入到所述水质时间序列预测模型, 通过监
测时间的序列模型构建该时段的水质时间映射关系模型为: Ct=F(Ct‑1, 天气数据), 其中
Ct‑1为中心监测站前一监测时间的中心监测站数据, 所述水质时间映射关系模型输出当前
时刻的中心监测站的中心监测站数据。
3.根据权利要求1所述的一种基于多源数据的河涌水质时空预测方法, 其特征在于, 所
述步骤S6的具体如下:
步骤S61: 获取中心监测站数据和巡航监测数据, 并对数据完整性进行检查, 补全报文
缺失的时段, 并将补全 时段的监测值标记为NULL值, 剔除缺失值/NULL值、 值不变、 负值、 超
量程、 低于0.3%分位数的极小值以及超出99.7%分位数的极大值不符合现场监测情况的
显著异常值;
步骤S62: 将监测仪器处于故障期间、 维修期间、 超期限未校准时段、 失控时段、 有计划
的维护保养、 校准校验非正常监测时段 的数据予以剔除, 所述监测仪器为获取中心监测站
数据的工具;
步骤S63: 对被剔除的数据以及缺失的数据采用均值插补法进行补充;
步骤S64: 构建污染映射关系模型, 某一监测时间的中心监测站的中心监测站数据与待
预测的监测点的经度、 纬度、 深度作为该监测时间的特征指标输入污染映射关系模型, 通过权 利 要 求 书 1/3 页
2
CN 114398423 A
2LSTM模型构建该时段的水质空间映射关系模型为: Ht=F(Ct, x,y,z), 其中Ct为中心监测站
当前时刻的中心监测站数据, x、 y、 z 分别表示监测点的经度、 纬度、 深度, 所述污染映射关系
模型输出为 监测对象在某坐标中的水质分布情况 数据;
步骤S65: 将收集到的中心监测站数据以及对应的气象因素作为第 一训练数据、 将水质
分布情况 数据、 监测点的坐标、 中心监测站数据作为第二训练数据;
第一训练数据以及第二训练数据按3:1比例随机拆分训练集与测试集, 使用
tensorflow的keras构造LSTM模型训练框架, 采用贝叶斯优化进行模型调参, 并存储最优参
数空间预测模型; 最后, 采用MAE、 RMSE这2种度量方式来对预测结果进行评估, 其中
其中yi为真实数据,
为通过模型得到的
预测数据。
4.根据权利要求3所述的一种基于多源数据的河涌水质时空预测方法, 其特征在于, 进
行步骤S64和步骤S55前还需对水质分布情况数据、 中心监测站数据、 监测时间和气象因素
进标准化归一处 理。
5.根据权利要求1所述的一种基于多源数据的河涌水质时空预测方法, 其特征在于, 所
述步骤S4中巡检设备获取 水质分布情况的时间确认方式为:
获取所述中心监测站对河涌的污染物进行监测的时间点并以所述时间点作为监测时
间。
6.一种基于多源数据的河涌水质时空预测系统, 使用权利要求1~5任一项所述一种基
于多源数据的河涌水质时空预测方法, 其特 征在于, 包括:
对象选取模块、 空间坐标建立模块、 数据获取模块以及预测模型模块;
所述对象选取模块用于获取河涌排污类型, 并选择排污类型为生活污水的河涌作为监
测对象;
空间坐标建立模块用于立 监测对象的空间坐标系, 在空间坐标系中选取多个监测点;
所述数据获取模块用于在规定的监测时间内获取监测点的水质分布情况数据以及当
时的气象因素, 选取监测对 象中现有的固定监测站为中心监测站, 获取中心监测站的中心
监测站数据;
所述预测模型模块用于根据 所述数据获取模块获取到的数据进行训练, 得出水质时间
序列预测模型与污染映射关系模型。
7.根据权利要求6所述的一种基于多源数据的河涌水质时空预测系统, 其特征在于, 还
包监测时间确定模块, 所述监测时间确定模块用于获取中心 监测站的对河涌的污染物进 行
监测的时间点并以所述时间点作为巡检设备获取 水质分布情况的时间。
8.根据权利要求6所述的一种基于多源数据的河涌水质时空预测系统, 其特征在于, 所
述预测模型模块包括: 水质分布情况数据完整度检测模块、 中心监测站数据完整度检测模
块、 数据补 全模块、 水质时间序列预测模型建立模块、 污染映射关系模型建立模块以及测试
模块;
所述水质分布情况数据完整度检测模块用于对水质分布情况数据、 监测时间和气象因
素的完整性以及有效性进 行检查, 将监测时间点内的空值以及不符合阈值规定的数据进 行
剔除;权 利 要 求 书 2/3 页
3
CN 114398423 A
3
专利 一种基于多源数据的河涌水质时空预测方法及系统
文档预览
中文文档
17 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共17页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-18 20:26:40上传分享