(19)中华 人民共和国 国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202111663965.5
(22)申请日 2021.12.3 0
(71)申请人 重庆邮电大 学
地址 400065 重庆市南岸区崇文路2号
(72)发明人 陈昌川 刘凯 刘仁光 代少升
张天骐
(51)Int.Cl.
G06K 9/62(2022.01)
G01R 31/12(2006.01)
(54)发明名称
一种基于GIS多源局部放电信号数据流聚类
分离方法
(57)摘要
本发明涉及一种基于基于GIS多源局部放电
信号数据流聚类 分离方法, 属于高压电气设备局
部放电检测技术领域, 局部放电检测中,由于多
种放电源与现场干扰源同时存在并不断变化的
现象, 导致多种局部放电源难以有效分离及识别
的难题, 论文提出一种高效的自适应在线数据流
聚类方法。 该方法采用自然邻域创建KD树来提高
查询近邻的效率, 即通过流数据的特征得到自适
应的邻域半径和区域密度, 从而能够局部搜索并
形成团簇, 实现多种局部放电源的实时在线分
离。 在人工数据集和真实数据集验证了该方法的
优越性, 将其应用于气体绝缘变电站故障的模式
识别。
权利要求书2页 说明书5页 附图3页
CN 114386499 A
2022.04.22
CN 114386499 A
1.一种基于GIS多源局部放电信号数据流聚类分离方法, 其特 征在于, 包括:
步骤1: 特征提取, 本文提取了信号特征中的偏斜度Sk、 陡峭度Ku、 相位Φ和放电量Q等
特征量。
步骤2: 自然邻域算法, 自适应半径邻域和区域密度, 初始化自然邻域, 将数据放入到KD
树上进行最邻近搜索, 对其每个数据点找到其K ‑近邻、 逆K ‑近邻, 以及每个数据点近邻的数
量, 判断是否 达到稳定终止平衡条件。
步骤3: 参数选择: 分为两个阶段, 第一阶段引入自然邻域算法, 通过自然邻域算法对前
n个数据点组成的数据集进行处理得到自然特征值λ和微簇最小阈值M, 然后计算每个数据
点与最小预置的距离之后, 然后求其平均值。 设算法 的邻域半径γ( ε ), 通过引入自然邻域
算法, 得到所需要的区域密度和邻域半径, 从而无需初始化参数值, 通过数据点不断进入,
自适应更新M和γ( ε )。
步骤4: 聚类分离: 分配核心微簇, 在新的数据点到达时, 判断数据样本是否属于当前微
簇, 如果不是, 则创建一个新的微簇。 如果数据在当前微簇中, 进一步检查数据在微簇团的
核心半径或 壳半径内。 如果判断数据点落在壳半径区域内, 则更新微簇的中心 位置。 删除衰
减到最小阈值的微簇: 所有的微簇寿命减少到衰减量时, 将微簇移除, 并删除与它相连的
边。 更新集群: 聚类图更新 发生在已存在的微簇中心 点位置已发生改变; 微簇发生移动或产
生新的微簇; 微簇的寿命衰减到设定的阈值。
2.根据权利要求1所述的基于GIS多源局部放电信号数据流聚类分离方法, 实现不同放
电故障信号的分离, 首先必须提取 的特征量能够反映局部放电信号的时域特征。 从而通过
特高频提取到的特征值来表示局部放电信号。 多种局部放电信号, 由于放电机理、 放电缺陷
位置、 放电信号传播路径的不同, 会在特征值中表现不同的差异, 因此根据不同局部放电信
号时域分布特征 的不同, 就可以将多种局放信号进行分离, 用于类型识别的PD特征量选择
方法主要集中在PD相位分析模式, 统计特征参数用来PRPD的特征描述。 本文提取了信号特
征中的偏斜度Sk、 陡峭度Ku、 工频相位Φ、 放电量 Q等特征量。
3.根据权利要求2所述的基于GIS多源局部放电信号数据流聚类分离方法, 其特征在
于: 初始化自然邻域, 将数据放入到KD树上进行最邻近搜索, 将数据放入到KD树上进 行最邻
近搜索, 判断是否 达到稳定终止平衡条件。
4.根据权利要求3所述的基于GIS多源局部放电信号数据流聚类分离方法, 其特征在
于: 算法通过自然邻域算法对前n个数据点组成的数据集进 行处理, 得到自然 特征值λ, 设算
法中的最小阈值D, 然后计算每个数据点与最小密度D的距离之后, 然后求其平均值。 设算法
的邻域半径γ( ε ), 通过引入自然邻域算法, 得到所需要的最小阈值和邻域半径, 从而无需
初始化参数值, 通过不断数据点进入, 自适应更新邻域半径和最小阈值。
该算法邻域半径的计算公式如下 所示:
其中dλ(i)表示数据点i的λ近邻的距离, n代表得到最小阈值所使用的数据点个 数。 为了
针对数据集分布的自然规律, 对数据点分布稀少或分布密集的区域, 搜索的半径可以采用
加权多宽度高斯核函数(Weighted Gaussian Kernel with Multiple Widths,WGKMW)进行权 利 要 求 书 1/2 页
2
CN 114386499 A
2加权, 动态设置微簇的邻域半径。 密度值D越大时, 邻域半径越大, 反之则邻域半径越小。 加
权公式如下 所示:
其中n表示在微簇中的数据点数, M是微簇的最小阈值, m个不同宽度的高斯核线性组合
成加权多宽度高斯核。 Rm‑s是m个不同宽度高斯核上的权重系数。 常量因子Rm使微簇中的数
据点之间距离的线性平移放大, 在其特征区间内扩大样本的差异, 可以更好实现对差别微
弱的微簇之间进行聚类。 从而微簇的半径和密度可通过自然邻域算法进行自适应变化。 然
后对微簇进 行调整, 该算法采用了一种简单的线性老化确定方法, 从而缩短了微簇的寿命,
该微簇作为未使用的微簇完全消失了, 不仅可以应用替代老化的技术, 而且还可以通过添
加更多的数据点来将该微簇激活, 从而 更新微簇的图谱。 当没有接收可用的数据时, 微簇会
逐渐消失。 这种现象广泛 存在时, 则微团簇的寿命将逐渐达 到零, 从而消除这些微簇 。
5.根据权利要求4所述的基于GIS多源局部放电信号数据流聚类分离方法, 是相交 的微
簇团, 将微簇团分为壳区域和核心区域, 通过考虑与微簇外壳相交的核心区域来对微簇进
行分组, 可以自动确定边缘的微簇群。 不具有最小阈值的微簇会存在异常值, 每个微簇都含
有一个图形, 该图演示了微簇的相交。 可以通过应用图结构能够最大程度减少微簇的破裂
或最终死亡时分离微簇所需要的计算。 采用实时更新图结构的方式得到聚类结果, 当数据
点到来后, 计算修改后的微簇周围的几个相连的微簇的可达性, 其余的点不需要修改, 能够
确保微簇划分的有效性。 在上述情况下可以更改算法的边缘列表, 需要 更新微簇群的数量,
首先可通过自然邻域算法计算出合适的邻域半径和区域密度。 将对已修改为最近达到阈值
或移动其中心位置的微簇。 此时微簇的图形边缘已经发生了修改, 则产生的微簇群的个数
也发生改变。权 利 要 求 书 2/2 页
3
CN 114386499 A
3
专利 一种基于GIS多源局部放电信号数据流聚类分离方法
文档预览
中文文档
11 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共11页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-19 04:42:04上传分享