安全公司报告
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211044229.6 (22)申请日 2022.08.30 (71)申请人 广东电网有限责任公司广州供电局 地址 510620 广东省广州市天河区天河南 二路2号 (72)发明人 龙云 梁雪青 卢有飞 刘璐豪  邹时容 赵宏伟 吴任博 张扬  陈明辉 张少凡 蔡燕春 刘璇  (74)专利代理 机构 广州市华学知识产权代理有 限公司 4 4245 专利代理师 杨望仙 (51)Int.Cl. G06K 9/62(2022.01) G06Q 50/06(2012.01) (54)发明名称 一种基于字符串匹配的电力数据融合方法 (57)摘要 本发明属于电力多源异构数据融合技术领 域, 为一种基于字符串匹配的电力数据融合方 法, 该方法包括获取电网多源异构数据, 将各数 据源数据整理为键值对形式的数据表单; 根据信 可度约束条件和可疑程度约束条件对原始电网 多源异构数据进行识别过滤, 去除原始电网多源 异构数据中的异常值和噪声; 分析每个数据关键 词对应的字符串, 通过计算字 符匹配度对数据进 行匹配, 根据匹配结果重构数据标签, 将过滤后 的多源异构数据按重构数据标签导入新建数据 库。 本发明可以消除采集的电力多源异构数据中 不可避免的偏差, 减少多源异构数据将在这些数 据的融合、 传输和分析中消耗的时间, 有助电力 系统整合系统内各量测体系的多 源异构数据。 权利要求书2页 说明书5页 附图2页 CN 115470843 A 2022.12.13 CN 115470843 A 1.一种基于 字符串匹配的电力数据融合方法, 其特 征在于, 所述方法包括以下步骤: S1、 获取电网多源异构数据, 将各 数据源数据整理为键值对形式的数据表单; S2、 根据信可度约束条件和噪声向量异常值程度对原始电网多源异构数据进行识别过 滤, 去除原 始电网多源异构数据中的异常值和噪声; S3、 根据文本标签进行字符串 匹配, 通过计算字符匹配度对电力数据 标签进行匹配, 根 据过滤标签集合重构数据标签, 将过滤后的多源异构数据按重构数据标签导入新建数据 库。 2.根据权利要求1所述的一种基于字符串匹配的电力数据融合方法, 其特征在于, 所述 步骤S1包括: 获得电网多源异构数据, 将多源异构数据根据各自原始保存格式形成独立存 储, 各数据源形成独立的表单, 拥有独立的数据标签, 各表单均为二维表形式, 逐条记载设 备参数、 运行状态。 3.根据权利要求1所述的一种基于字符串匹配的电力数据融合方法, 其特征在于, 所述 步骤S2包括: 对原始电网多源异构数据进行识别过滤, 对于有额定电量的测量值, 根据可信度约束 条件识别具有不同可信度的配电网节点的数据, 去除原 始电网多源异构数据中的异常值; 对于设备参数采用改进的DBSCAN聚类算法进行DBSCAN聚类, 获得数据的特征向量和噪 声向量; 通过极值分布函数判断噪声向量的异常值程度, 根据噪声向量的异常值程度剔除原始 电网多源异构数据中的噪声。 4.根据权利要求3所述的一种基于字符串匹配的电力数据融合方法, 其特征在于, 所述 有额定电量的测量 值包括电流, 电流的可信度约束条件为: |IR‑∑Ii|< εB·IR; 其中, IR是流入系统的关闭开关的电流, IN是电流互感器的额定电流, Ii是其余关闭开 关的电流, IS1和IS2是两个关闭开关直接连接时两端的测量电流, 两者允许的最大误差参数 εB被IN和IR约束。 5.根据权利要求3所述的一种基于字符串匹配的电力数据融合方法, 其特征在于, 所述 对于设备参数采用改进的DBSCAN聚类算法进行DBSCAN聚类, 具体步骤 包括: (1)根据数据集的参数向量形成相关系数矩阵R 式中, n是参数数量, r1n为设备参数向量t1和tn的相关系数, 设备向量参数根据具体设备 的测量参数来设置;权 利 要 求 书 1/2 页 2 CN 115470843 A 2(2)确定参数向量ti近邻值 ε和最小聚类 个数m的值; (3)从数据集中随机 选择参数向量t; (4)根据参数向量t、 最小聚类个数m和相 关系数矩阵R来检索所有与参数向量t密度可 达的向量, 若向量个数不小于m, 则t为核心向量; 若向量个数小于m, 参数向量t在某个核心 向量的z领域内, 则参数向量t 为边界向量; 若参数向量t既不是核心向量,也不是边界向量, 则为噪声向量; (5)如果参数向量t是核心向量,形成新的簇或者扩展已经存在的簇; (6)如果参数向量t是边界向量, 且没有向量与t是密度可达的, 则访问数据库中的下一 向量; (7)重复步骤(4) ‑(6), 处理数据集中所有的向量, 直到数据集中所有的向量都被处 理。 6.根据权利要求3所述的一种基于字符串匹配的电力数据融合方法, 其特征在于, 所述 极值分布函数的公式为: 其中, μ是位置参数, σ 是尺度参数, x是待检验的数据测量 值。 7.根据权利要求1所述的一种基于字符串匹配的电力数据融合方法, 其特征在于, 所述 步骤S3, 包括: 通过计算字符匹配度对数据进行匹配, 过滤掉相同含义的数据标签得到过滤标签集 合; 根据过滤标签集合重构数据标签, 对多过滤后的多源异构电力数据标签取并集, 再将 对应电力数据导入标签中实现电力数据融合。权 利 要 求 书 2/2 页 3 CN 115470843 A 3

.PDF文档 专利 一种基于字符串匹配的电力数据融合方法

文档预览
中文文档 10 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共10页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种基于字符串匹配的电力数据融合方法 第 1 页 专利 一种基于字符串匹配的电力数据融合方法 第 2 页 专利 一种基于字符串匹配的电力数据融合方法 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 06:35:09上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。