Loading [MathJax]/jax/output/HTML-CSS/jax.js

上海交通大学学报, 2024, 58(12): 1857-1867 doi: 10.16183/j.cnki.jsjtu.2023.145

新型电力系统与综合能源

考虑罕见因素熵值差异的配电网故障风险评估方法

黄俊贤1, 陈春,1, 曹一家1, 全少理2, 王益3

1.长沙理工大学 电气与信息工程学院,长沙 410000

2.国网河南省电力公司经济技术研究院,郑州 450052

3.国网湖北电力有限公司,湖北 咸宁 437000

Distribution Network Fault Risk Assessment Method Considering Difference in Entropy Value of Rare Factors

HUANG Junxian1, CHEN Chun,1, CAO Yijia1, QUAN Shaoli2, WANG Yi3

1. School of Electrical and Information Engineering, Changsha University of Science andTechnology, Changsha 410000, China

2. Economics and Technology Research Institute, State Grid Henan Electric Power Company, Zhengzhou 450052, China

3. State Grid Hubei Electric Power Co., Ltd., Xianning 437000, Hubei, China

通讯作者: 陈 春,副教授;E-mail:chch3266@126.com.

责任编辑: 王历历

收稿日期: 2023-04-20   修回日期: 2023-06-16   接受日期: 2023-06-17  

基金资助: 湖南省自然科学基金优秀青年项目(2023JJ20039)
国家自然科学基金(52007009)

Received: 2023-04-20   Revised: 2023-06-16   Accepted: 2023-06-17  

作者简介 About authors

黄俊贤(1998—),硕士生,从事配电网数据的分析与挖掘研究.

摘要

恶劣天气、外力破环等外部环境因素严重影响配电网供电可靠性,为了能够全面、准确地评估配电网故障风险,提出考虑罕见因素熵值差异的配电网故障风险评估方法.首先,以故障造成的后果为依据,采用K-均值聚类算法,划分故障风险等级;提出改进关联规则算法深入挖掘罕见环境因子,评估高风险低概率要素,实现对罕见因子与风险等级的关联量化分析;基于此量化结果,结合Pearson相关系数分析各环境特征的关联性,剔除不同风险等级下的冗余特征.然后,利用部件关键度分析法调节罕见元素的风险权重,定量衡量单个元素的出现与系统整体风险的波动相关程度,根据不同因子的波动差异,结合信息熵理论进一步优化,得到计及罕见因子熵值差异的风险权重优化矩阵,建立配电网故障风险评估模型.最后,对某城市实际配电网进行案例分析,验证了评估模型的准确性和有效性.

关键词: 配电网风险评估; 罕见风险因子; 风险熵值差异; 关联分析; 权重调整优化

Abstract

External factors such as bad weather and external failure seriously affect the reliability of a distribution network. To comprehensively and accurately assess the risk of faults in a distribution network, this paper proposes a fault risk assessment method that considers the difference in entropy value of rare factors. This method uses K-means clustering algorithm to classify failures based on their consequences and an improved association rule mining algorithm to analyze rare environmental factors and evaluate high-risk and low-probability factors, so as to realize the quantitative analysis of the association between rare factors and risk levels. By combining the Pearson correlation coefficient, the correlation of each environmental feature is analyzed and redundant features at different risk levels are eliminated. Then, the component criticality analysis method is used to adjust the risk weight of rare elements, which can quantitatively measure the degree of correlation between the occurrence of individual elements and the fluctuation of the overall risk of the system. According to the fluctuation difference of different factors, the risk weight optimization matrix considering the difference of rare factors is obtained, and the fault risk assessment model of the distribution network is established, in combination with the information theory. Finally, a distribution network fault risk assessment model is established, of which the accuracy and effectiveness is verified by a case analysis of an actual distribution network in a city.

Keywords: distribution network risk assessment; rare risk factors; difference in risk entropy; correlation analysis; weight adjustment optimization

PDF (5015KB) 元数据 多维度评价 相关文章 导出 EndNote| Ris| Bibtex  收藏本文

本文引用格式

黄俊贤, 陈春, 曹一家, 全少理, 王益. 考虑罕见因素熵值差异的配电网故障风险评估方法[J]. 上海交通大学学报, 2024, 58(12): 1857-1867 doi:10.16183/j.cnki.jsjtu.2023.145

HUANG Junxian, CHEN Chun, CAO Yijia, QUAN Shaoli, WANG Yi. Distribution Network Fault Risk Assessment Method Considering Difference in Entropy Value of Rare Factors[J]. Journal of Shanghai Jiaotong University, 2024, 58(12): 1857-1867 doi:10.16183/j.cnki.jsjtu.2023.145

配电网作为电力系统的消费终端,旨在为用户供应可靠和优质的电力能源.但与此同时,配电系统设备类型复杂且地处环境相对较差,因此成为电力系统中安全薄弱的环节.据统计,每年用户停电事故中配电网故障所导致的原因占70%,而配电网的故障往往由诸如台风[1]、地震[2]、暴雨[3]等极端天气引起,可见外界环境是威胁配电网稳定运行的主要原因.因此,亟需准确有效地评估配电网在复杂环境下的潜在风险,找出安全薄弱区域,从而针对性地做出相关改进与维护,提高配电系统的供电可靠性.

目前,针对环境影响下的配电网故障风险分析主要从两方面开展.其一是基于特定极端天气引发的故障机理来研究物理或数学分析模型.例如,文献[4-5]中将台风风场模型、风速风向分布模型与元件故障率模型相结合,评估极端天气下的配电网故障风险情况;文献[6]中结合导线覆冰荷载模型、杆塔覆冰荷载与故障率模型,评估极端冰雪下配电网的运行状态;文献[7]中基于地震灾害下的配电网故障模型来研究配电网的韧性;文献[8]中依据传统的光伏和风力机功率输出模型来分析配电网的故障恢复.这些将特定场景下的天气模型与系统故障模型进行结合的方法物理概念清晰,在配电网故障风险研究中发挥了重要作用.但是,配电网的外部环境具有不规律性强、不确定性大等特点,仅基于一种天气模型的机理分析大多是在理想情况下或对某些特定场景进行简化后完成的,难免存在一定的局限性[9].

其二是基于数据分析的方法来研究复杂环境下配电网的故障风险,利用配电网历史故障数据,结合多源相关因素,采用数据挖掘算法探索海量数据之间的潜在关联,通过关联特性评估配电网的故障风险[10].文献[11]中为解决目前配电系统故障相关数据源单一的问题,提出融合配电系统中、低压数据与变电站出线电流数据的故障诊断技术;文献[12]中采用数据驱动的方法对风灾后的停电用户数进行预测;文献[13]中基于多源数据信息,利用径向基函数神经网络模型研究配电网在强台风下的受损情况;文献[14-15]中利用数据分析方法对故障特征进行剔除从而有效地预测配电网故障风险;文献[16]中基于关联规则挖掘算法对配电网典型故障与环境场景进行关联识别;文献[17]中考虑多源信息相关性以改善冰灾环境下预测配电网故障的局限性;文献[18]中基于贝叶斯神经网络提出配电系统与天气相关的故障风险预测模型.上述大数据分析方法虽能考虑更多外部环境因素,但对于数据与数据之间、数据与故障之间的关联性研究仍不够全面,并且一些数据驱动方法仅基于元素固有占比来展开对配电网故障风险的分析,权重衡量方式过于简单,且容易忽略罕见元素的潜在作用.因此,基于历史故障数据评估环境影响下配电网故障风险的关键在于对多源数据进行有机融合,分析多方面数据的潜在关联,客观地对相关因子权重进行合理分配和优化.

通过以上分析,提出考虑罕见因素熵值差异的配电网故障风险评估方法.以南方某城市配电网故障后果作为聚类依据,利用K-均值聚类算法对故障场景进行等级划分;基于改进关联规则算法(ARM)挖掘罕见风险因子与其中的高风险低概率元素,并量化特征因子与风险事件等级的关联关系;利用Pearson相关系数对关联量化结果进行分析以剔除不同风险等级下的冗余特征;最后,结合部件关键度分析法(CCA)与信息熵理论(IET),计及罕见因子的风险熵值差异,调节和优化特征因子的风险权重.算例分析证实了所提方法的评估结果在多个评价指标上表现出色,该方法具有实际应用价值.

1 考虑罕见因素熵值差异的配电网故障风险评估思路框架

针对不平衡分布的多源数据,建立考虑罕见因素熵值差异的配电网故障风险评估方法.该方法主要包括多源信息融合、数据分析处理和风险评估测试3个部分,整体思路框架如图1所示.

图1

图1   配电网故障风险评估思路框架

Fig.1   Framework of distribution network fault risk assessment


在第一步多源信息融合中,收集了多方面数据,包括气象数据、拓扑与地理信息数据、运行数据以及用户数据.第二步,应用数据分析方法分析清洗与集成后的多源数据,包括基于K-均值聚类方法对故障场景进行风险等级划分、基于改进关联规则挖掘方法挖掘罕见因子并量化其与不同风险等级关联性、基于Pearson相关系数量化故障特征之间的关联性、基于部件关键度分析法和信息熵理论调节优化风险因子权重.最后,构建风险因子权重优化矩阵,进行风险评估测试,从而对配电网的故障风险等级进行评估.

2 故障数据的处理与分析

2.1 数据的采集与汇总

调研多源信息平台并初步预处理原始数据库,筛选出如表1所示的输入特征数据库.表中的特征类型分为故障特征和环境特征,其中每个特征包含多个元素,本文所分析的配电网故障记录库由这些元素组成.利用这些特征元素可以分析配电网故障风险的时空特性.

表1   特征数据汇总

Tab.1  Summary of characteristic data

故障/环境特征所含元素
月份1~12
日期1~31
时刻0:00—23:00
变电站电压等级/kV10、35、110、220
影响后果影响低压用户数、影响公变数、影响专变数
气温/℃A1≤12,13≤A2≤21,22≤A3≤28,A4>28
气压/hPaC1≤993,994≤C2≤1 000,1 001≤C3≤1 009,C4>1 009
降水量/(mm·h-1)E1≤1.8,1.9≤E2≤3.8,3.9≤E3≤5.6,E4>5.6
湿度/%B1≤0.6,0.7≤B2≤0.8,0.8≤B3≤0.9,B4>0.9
地面风速/(m·s-1)D1≤1.8,1.9≤D2≤3,3.1≤D3≤4.5,D4>4.5
风向F1(东)、F2(南)、F3(西)、F4(北)、F5(东南)、F6(东北)、F7(西南)、F8(西北)

新窗口打开| 下载CSV


2.2 故障风险等级划分依据

基于故障特征数据库中的影响后果,即故障影响的低压用户数、公变数以及专变数,利用K-均值聚类算法对故障记录的风险等级进行划分.结合实际情况、专家知识以及遍历合理的聚类数,最终确定聚类的数目为3个,即将故障风险划分为3个等级,聚类场景如图2所示.聚类后的等级划分依据如表2所示.

图2

图2   K-均值聚类场景

Fig.2   K-means clustering scenario


表2   配电网故障风险等级划分

Tab.2  Classification of distribution network fault risk

风险等级比例/%影响用户数影响变压器数
144.40~15650~76
234.81641~365910~105
320.83800~841017~143

新窗口打开| 下载CSV


3 关联性量化与权重改进

3.1 特征-风险等级与特征-特征的关联量化

3.1.1 基于改进ARM的特征因子与故障风险等级的关联量化

配电网所处位置的特殊性使得配电网容易被外界环境干扰,导致其发生故障的关联因子也较多.基于关联规则挖掘算法量化不同特征因子与配电网故障风险等级之间的关联关系.

关联规则挖掘算法常被用于探索不同事务之间的相互依存性和关联性[19-21],假设一条关联规则的前项为G,后项为Y,则此条关联规则可以被写为 GY.目前关联规则算法通常基于支持度和置信度两个诊断标准来筛选高频变量集和频繁关联规则,其表达式分别如下:

K(GY)sup= N(GY)N(H)
(1)
K(GY)con= N(GY)N(G)
(2)

式中:N(GY)为同时含有GY的事务数;H为总输入数据集;N(H)为总输入数据集的事务数;N(G)为含有G的事务数.

然而,传统关联规则挖掘算法往往采用固定的诊断计算方式分析数据集,导致罕见因子被忽略而不做任何分析.例如,极端雷雨天气往往属于高风险但低概率的情况,若直接用传统关联规则分析,会使得伴随雷雨场景的关联规则由于支持度过低而被直接舍弃.因此,根据特征因子的分布情况对传统关联规则算法作相关改进,改进后的关联规则能同时计算出罕见因子的得分.相关改进说明为:采用改进后的支持度用于重新计算罕见因子的得分,采用改进后的置信度用于量化每个特征因子与故障风险等级的关联性,置信度越高说明该元素出现时发生此风险等级事件的可能性越大.

重新定义一条关联规则Gc+GrY,其中Gc为常见前项变量集,Gr为罕见前项变量集,Y为后项目标集;在本文中,Y表示故障风险等级.若一条关联规则Gc+GrY含有一个特征L中任何罕见因子vji,第j个特征因子与第i类风险等级的量化关联关系为gji,那么经改进后用于计算此特征中罕见因子的关联规则支持度和置信度能够分别表示为

R(vjiY)sup= N(vjiY)/N(Gr)N(Gr)/N(H)
(3)
R(vjiY)con=gji= R(vjiY)supR(vji)sup= R(vjiY)supN(vji)/N(Gr)
(4)

式中:N(vjiY)为在总记录数据库中既存在第j个因子又属于第i类风险等级的数量;N(Gr)为含有任意罕见因子的故障记录数量;N(vji)为第j个因子在属于第i类故障风险等级记录中所占的数量;R(vji)sup为罕见因子vji在数据库中的支持度.按传统的关联规则得分计算式区分罕见因子和常见因子后,再利用式(3)对包含罕见因子的数据集Gr进行支持度的计算,以重新计算罕见因子的支持度;利用式(4)重新计算罕见因子与每种故障风险等级类型的置信度,置信度的值越大代表两者的关联性越大,即这个因子出现时此故障风险等级发生的概率越大.

3.1.2 基于Pearson相关系数的故障特征关联量化

尽管利用所提关联规则算法可以同时计及罕见因子与故障风险等级的关联度,但仍不能有效剔除冗余特征.针对这一问题,以3.1.1小节所求解的元素与故障风险等级的关联度为测算基础,利用Pearson相关系数的绝对值权衡表1中各特征之间的相关性,这样既考虑了特征因子的重要性,又考虑了特征因子之间的冗余性.单个特征LA与其他任意特征LB之间的相关性指标如下式所示:

ρ(i)AB= |ρAB|= |Cov(LA,LB)σLAσLB|
(5)

式中:ρ(i)AB为第i类故障风险等级下特征LALB的相关性;Cov(LA, LB)为特征LALB的协方差;σLAσLB分别为两个特征的方差.

3.2 基于CCA-IET的风险因子权重改进

3.2.1 基于CCA的权重调整

由于不同外部环境要素对配电系统整体可靠性的影响程度不同,所以应设计更合理、更全面的计算方法,从而明确各要素风险权重.考虑到数据库中单个环境因子会受到来自常见元素和罕见元素两方面的影响,于是将单个因子的风险权重定义为βj,并且由两部分组成,如下式所示:

βj=βc,j+βr,j
(6)

式中:βc, j为来自常见元素的影响;βr, j为来自罕见元素的影响.而来自常见元素的影响βc, j的表达式为

βc,j= {0,vjkGrj=1tN(vjk)m,vjkGc
(7)

式中:t为数据库中所有事件记录数;N(vjk)为故障记录数据库中存在元素vjk的故障记录基数;其中k为第k条故障记录;m为总的故障记录基数.

为了更具体地描述来自罕见元素的影响,引入部件关键度度量(CCA)[22]来求解罕见元素风险权重.CCA通常作为一种测量系统中单个组件的灵敏度和影响度的工具,本文使用CCA中的改善潜力度(IP)来测量元素的权重影响,该度量表示通过改进元素vjk的可靠性可以获得的系统可靠性最大潜在改进.同时,该度量可以方便地调整为风险指标,其表达式如下:

Ij,IP=S(vjk, P)-S(P)
(8)

式中:S(vjk, P)为当元素vjk确定出现或存在时,系统P中相关故障事件的风险;S(P)为相关故障事件出现时系统的综合风险.由式(8)可知,Ij,IP值越大表示元素vjk的出现使系统整体风险的波动程度越显著,即此元素在系统中更重要.

考虑到一个环境特征包含多个环境元素,若属于环境特征的某个元素发生变化,故障状态也将发生变化,此次故障事件便有可能不再发生,因此认为系统是一个串联结构.假定各要素相对独立时,可以利用各要素风险权重的乘积来计算串联系统的总体风险S(P).于是S(P)可以表示为某环境场景下各特征中对应环境元素出现时与故障相关的综合似然度乘积,表达式如下:

S(P)=nm=1S(vjk,P)=nm=1(trj=1N(Lr,m)N(vjkLr,m)N(Lm)N(vjkLm))
(9)

式中:n为特征数;tr为数据库中包含任意罕见元素的故障记录数;N(Lr, m)为总记录数据中含有任意罕见因子的特征Lm其所有罕见因子出现的次数,其中Lr, m为总记录数据中含有特征Lm的任意罕见因子的故障记录;N(vjkLr, m)为在N(Lr, m)中元素vjk出现的次数;N(Lm)为包含特征Lm的故障记录数;N(vjkLm)为包含特征Lm的故障记录数中元素vjk出现的次数.结合式(8)和式(9),βr, j表达式如下:

βr,j= {0,   vjkGcj=1tN(Lr,m)N(vjkLr,m)N(Lm)N(vjkLm)-m=1n(j=1trN(Lr, m)N(vjkLr, m)N(Lm)N(vjkLm)),   vjkGr
(10)

3.2.2 基于IET的权重优化

利用3.2.1小节中的CCA工具可对环境元素的风险权重进行更合理的调整,从而能依据单个元素的出现衡量系统整体风险的波动变化程度.但由于每个风险因子影响系统风险的程度不同,所以须根据每个因子对系统整体风险的波动程度进一步优化权重.IET是一种综合各指标变异程度并考虑指标所含有的信息量情况,从而较为客观地得到指标权重的方法.若所评价的目标在某个指标下的值差异越大,表明其信息熵值越小,该指标对综合评价的熵权越大.设经过CCA调整且归一化后的单个因子风险权重为ujk,那么可得经归一化后的具有n个特征数,t条总故障记录数的配电网故障风险因子权重矩阵为U=(ujk)t×n.基于信息熵原理,依据风险因子的变异性程度来得到客观熵权,从而确定风险权重优化矩阵Q=(qjk)t×n, 相关计算步骤如下:

风险因子的信息熵值矩阵为

E=(ek)n= [-1/lntj=1t(ujkln ujk)]1×n
(11)

风险因子的熵权矩阵为

W=(wk)n= [(1-ek)/(n-k=1nek)]1×n
(12)

综上可得风险权重优化矩阵

Q=(qjk)t×n=(ujkwk)t×n
(13)

4 考虑罕见因素熵值差异的配电网故障风险评估流程

综合以上讨论,配电网故障风险等级评估流程如图3所示,主要分为以下7个步骤.

图3

图3   配电网故障风险评估流程图

Fig.3   Flow chart of distribution network fault risk assessment


(1) 从各类平台收集多方面数据,将数据进行初步清洗与集成,得到初始的配电网故障特征输入数据库.

(2) 利用K-均值聚类方法,以数据库中每次故障影响的低压用户数和影响的公变和专变数作为聚类依据,对每条故障记录进行风险等级划分.

(3) 基于改进ARM方法,利用式(3)调整罕见特征因子的支持度计算得分,利用式(4)量化罕见因子与各个风险等级的关联性,确定特征因子在不同风险等级情况下的重要性.

(4) 利用Pearson相关系数,以元素与风险等级关联度为测算基础,利用式(5)和(6)量化各故障特征之间关联性,剔除各风险等级下的冗余特征.

(5) 采用CCA方法,利用式(7)、(8)、(11)调节特征因子风险权重.

(6) 利用IET方法,以步骤(5)得到的风险权重作为指标信息量,利用式(12~(14)构建风险权重优化矩阵.

(7) 将评估故障风险度与测试库中相应记录的故障风险等级结果相比较,从而评价所提出模型的性能.

5 案例分析

本案例分析所需的故障事件记录来自中国南方某配电系统,采用该配电区域2020—2021年共两年的故障数据进行评估与验证,该时段内的气象特征数据由气象信息平台提供.经过对数据的初步预处理和筛选,本案例采用故障记录中的5个特征数据和气象记录中的6个特征数据进行分析,即表1中所包含的数据.

5.1 特征因子-风险等级的关联分析

基于改进的关联规则对输入特征数据库进行充分挖掘后,可得到每个风险因子与不同故障等级之间的关联关系,如图4所示.由图可见,元素与不同故障风险等级的关联性不相一致,并且有规律可循:从图4(a)图4(c),整体关联性呈现下降的趋势,即各元素与故障风险等级1的关联程度最高,与故障风险等级3的关联程度最低.原因在于,在原始数据库和现实情况中,风险等级1属于最为普遍的故障情况,与其有关的环境数据和故障记录数据相对更多,因此各元素与其整体关联性更大.而风险等级3属于极端情况下的故障,由于极端天气发生较少,相关数据难以采集完善,所以往往只有少数环境元素与其强关联.

图4

图4   元素与不同风险等级之间的关联性

Fig.4   Associations between elements and different risk levels


5.2 故障特征之间的关联分析

基于各特征因子与不同故障风险等级的关联性,利用Pearson相关系数对不同故障特征之间的相关性进行研究,从而筛除冗余特征.不同故障等级情况下特征与特征之间的关联度矩阵如图5所示.

图5

图5   故障特征关联矩阵

Fig.5   Correlation matrix of fault feature


图5(a)可知,对于属于故障等级1的数据记录,气温和时间两个特征的相关系数超过0.5,表明具有较强相关性;而时间和气温与其他特征的相关性之和分别为0.321和0.502.因此,经过分析,当对故障风险等级1进行评估研究,即故障风险等级1为阳性样本时,筛除气温特征,其余特征集合为最优特征集.同理分析图5(b)5(c),当对故障风险等级2进行评估研究时,筛除的故障特征为时间特征;而由于在故障风险等级3的情况下各故障特征之间的相关系数均未超过0.5,所以对故障风险等级3进行评估研究时,所有特征均为最优特征.

5.3 配电网故障风险等级评估结果分析

5.3.1 评估模型验证工具

为了验证本文评估模型的性能效果,将评估结果与相应的真实故障记录进行比较.

在一个评估中,评价阈值T用于确定该评估的结果是阳性还是阴性.如果评估对象的评分比T高,则将此评估结果视为阳性,相反则视为阴性.真阳率、假阳率、精确率以及召回率常作为模型评价指标.接受者操场特性曲线(ROC)可以准确概述真阳率和假阳率的变化关系[23],精确率-召回率(PR)[24]曲线可以描绘精确率和召回率之间的变化趋势.利用ROC曲线和PR曲线评价所构建模型的性能,并同时采用ROC曲线下面积(AUROC)作为评价指标以进行更直观的评价,AUROC的值越大代表模型性能越好.此外,在考虑AUROC的同时,加入标准误差(SE)、置信区间(CI)和准确率3个评价指标,以降低ROC在计算过程中的不确定性影响.在本文案例研究中,综合考虑ROC曲线、PR曲线、AUROC、SE以及CI来对比CCA-IET、CCA以及传统ARM模型的评估性能.

5.3.2 评估模型验证结果

对所划分的3种风险等级进行分组测试.对于每一组测试,设置所研究的风险等级结果作为阳性样本而其余两种风险等级作为阴性样本.例如,当研究故障风险等级为1的测试组时,将风险等级1的故障场景记录设置为阳性样本,风险等级2和风险等级3的故障场景记录则设置为阴性样本.基于ARM模型、CCA模型以及CCA-IET模型的评估结果ROC曲线对比如图6所示,PR曲线对比如图7所示, 3种模型具体评估效果的数据对比如表3所示.

图6

图6   ROC曲线对比

Fig.6   Comparison of ROC curves


图7

图7   PR曲线对比

Fig.7   Comparison of PR curves


表3   评估效果数据对比

Tab.3  Comparison of assessment performance data

风险等级ARMCCACCA-IET
AUROCSECIAUROCSECIAUROCSECI
等级10.8020.3810.598~0.7820.8530.2880.655~0.8240.8990.2410.742~0.896
等级20.7540.2870.587~0.7580.8230.2450.643~0.7890.8660.1820.751~0.878
等级30.6900.2420.576~0.7870.7870.2200.582~0.7840.8280.1790.720~0.907

新窗口打开| 下载CSV


根据图6图7中的ROC和PR曲线效果对比可知,相比传统的ARM模型,CCA评估模型和CCA-IET评估模型都有更好的评估效果,并且CCA-IET模型比CCA模型的评估性能更优越.原因在于,传统ARM模型的诊断计算方法较为固定,容易忽略罕见环境因子;而改进后的ARM模型在经过CCA调整权重后,可以在计及罕见因子的同时,根据元素的影响程度直接来计算元素风险权重,更加灵活准确;CCA-IET模型则是在CCA基础上进一步考虑不同元素的影响差异性,故性能更优.具体根据表3可得,相比ARM模型和CCA模型,所提CCA-IET模型在AUROC得分上平均提升15.45%和4.62%,在SE得分方面平均改善33.1%和20.2%,在CI得分方面平均改善17.8%和9.8%.

值得注意的是,3种评估模型对于风险等级1的评估更为准确,而对于风险等级3的评估精确度相对较低.主要原因在于,当故障风险等级为1时,此故障情况所造成的的后果程度比较缓和,能保留的故障记录数据相对较多,记录信息更详细;而故障风险等级3的情况往往在极端条件下才发生,所造成的的事故后果也极为恶劣,此时配电网的大部分信息采集设备会受到严重损害,导致记录缺失遗漏,故影响最终的评估准确性.

6 结论

针对配电网在复杂环境下难以全面和准确分析故障风险的问题,基于电力大数据技术与多种关联方法,深入探索考虑罕见因素熵值差异的配电网故障风险,具体结论如下.

(1) 针对传统数据分析方法不能计及罕见因子作用的问题,采用改进的关联规则深入挖掘稀有元素;其中,高风险-低概率要素也能被纳入评估,并且罕见因子与不同故障风险等级的关联性得以量化.此量化指标可用于Pearson相关系数对各故障特征之间的关联性分析,从而筛除评估不同等级时的冗余特征,提高评估精度.

(2) 构建基于部件关键度的罕见风险因子相对权重分析模型,该模型能直接评估不同风险因子的出现造成系统整体风险的波动程度,避免传统权重衡量方法计算不合理的问题.此外,依据不同因子的风险熵值差异,采用熵权法再次优化风险权重,能进一步衡量风险的大小和不确定性,提升评估可靠性.

(3) 以南方某城市配电网作为案例分析对象,验证结果表明所提方法与实际故障情况有着较高的一致性,并且优于其他方法的评估性能.在应用中,利用本文方法可以更合理地进行维护规划和检修调度,从而最大程度降低风险事件到来前的负面影响.

参考文献

郑凌铭, 舒胜文, 陈彬, .

强台风环境下基于格点化和支持向量机的10 kV杆塔受损量预测方法

[J]. 高电压技术, 2020, 46(1): 42-51.

[本文引用: 1]

ZHENG Lingming, SHU Shengwen, CHEN Bin, et al.

Prediction method for amount of 10 kV damaged poles under severe typhoon environment based on meshing and support vector machine

[J]. High Voltage Engineering, 2020, 46(1): 42-51.

[本文引用: 1]

郑国鑫, 雷霞, 王湘, .

地震灾害模拟及配电网的风险评估

[J]. 电工技术学报, 2020, 35(24): 5218-5226.

[本文引用: 1]

ZHENG Guoxin, LEI Xia, WANG Xiang, et al.

Earthquake simulation and risk assessment of distribution network

[J]. Transactions of China Electrotechnical Society, 2020, 35(24): 5218-5226.

[本文引用: 1]

李吉侗, 王洲, 达紫祺, .

计及恶劣天气时空相关性的弹性配电网储能电站多层规划方法

[J]. 电力系统保护与控制, 2023, 51(9): 128-137.

[本文引用: 1]

LI Jitong, WANG Zhou, DA Ziqi, et al.

Multi-level planning method of energy storage stations for resilient distribution networks considering spatio-temporal correlation of severe weather

[J]. Power System Protection & Control, 2023, 51(9): 128-137.

[本文引用: 1]

李振坤, 王法顺, 郭维一, .

极端天气下智能配电网的弹性评估

[J]. 电力系统自动化, 2020, 44(9): 60-68.

[本文引用: 1]

LI Zhenkun, WANG Fashun, GUO Weiyi, et al.

Resilience evaluation of smart distribution network in extreme weather

[J]. Automation of Electric Power Systems, 2020, 44(9): 60-68.

[本文引用: 1]

周晓敏, 葛少云, 李腾, .

极端天气条件下的配电网韧性分析方法及提升措施研究

[J]. 中国电机工程学报, 2018, 38(2): 505-513.

[本文引用: 1]

ZHOU Xiaomin, GE Shaoyun, LI Teng, et al.

Assessing and boosting resilience of distribution system under extreme weather

[J]. Proceedings of the CSEE, 2018, 38(2): 505-513.

[本文引用: 1]

王守相, 黄仁山, 潘志新, .

极端冰雪天气下配电网弹性恢复力指标的构建及评估方法

[J]. 高电压技术, 2020, 46(1): 123-132.

[本文引用: 1]

WANG Shouxiang, HUANG Renshan, PAN Zhixin, et al.

Construction and evaluation of resilience restoration capability indices for distribution network under extreme ice and snow weather

[J]. High Voltage Engineering, 2020, 46(1): 123-132.

[本文引用: 1]

颜文婷, 杨隆, 李长城, .

考虑地震攻击交通网影响的配电网韧性评估及提升策略

[J]. 上海交通大学学报, 2023, 57(9): 1165-1175.

DOI:10.16183/j.cnki.jsjtu.2022.152      [本文引用: 1]

严重的地震灾害不仅会造成配电网大面积停电,还会损坏交通网,阻碍配电网恢复资源的运输,进而减缓配电网恢复.考虑地震攻击交通网的影响,提出地震灾害下配电网的韧性评估方法及韧性提升策略.首先,基于地震动峰值加速度建立反映地震灾害与交通-配电网故障概率关系的地震攻击模型,量化地震灾害对交通-配电网的影响,并生成交通-配电网故障场景.其次,引入配电网抢修队等待道路修复疏通时间,提出配电网韧性评估指标.再次,构建考虑故障线路抢修、道路修复疏通以及应急资源调度的配电网恢复双层优化模型并求解,上层优化模型以最小失电负荷量为目标,下层优化模型以最短配电网抢修队等待道路修复疏通时间为目标.最后,采用12节点交通网与IEEE33节点配电网耦合算例,验证所提韧性指标的可行性以及恢复方法的有效性.结果表明:考虑地震攻击交通网影响的配电网韧性评估指标更准确,所提的恢复策略能有效提升地震灾害下配电网韧性.

YAN Wenting, YANG Long, LI Changcheng, et al.

Resilience evaluation and enhancement strategy of distribution network considering impact of seismic attack on transportation networks

[J]. Journal of Shanghai Jiao Tong University, 2023, 57(9): 1165-1175.

[本文引用: 1]

杨丽君, 高鹏, 王伟浩, .

考虑时间尺度的配电网故障恢复方法研究

[J]. 太阳能学报, 2021, 42(1): 453-459.

[本文引用: 1]

YANG Lijun, GAO Peng, WANG Weihao, et al.

Research on fault recovery method considering time scale for distribution network

[J]. Acta Energiae Solaris Sinica, 2021, 42(1): 453-459.

[本文引用: 1]

费思源.

大数据技术在配电网中的应用综述

[J]. 中国电机工程学报, 2018, 38(1): 85-96.

[本文引用: 1]

FEI Siyuan.

Overview of application of big data technology in power distribution system

[J]. Proceedings of the CSEE, 2018, 38(1): 85-96.

[本文引用: 1]

周毅, 秦康平, 孙近文, .

台风气象环境电网设备风险量化预警及其N-m故障处置预案在线生成方法

[J]. 上海交通大学学报, 2021, 55(Sup.2): 22-30.

[本文引用: 1]

ZHOU Yi, QIN Kangping, SUN Jinwen, et al.

Real-time risk evaluation method of power system equipment and N-m fault contingency plan generation under typhoon meteorological environment

[J]. Journal of Shanghai Jiao Tong University, 2021, 55(Sup.2): 22-30.

[本文引用: 1]

张春梅, 许兴雀, 刘思麟.

基于多源数据融合的配电网故障诊断技术

[J]. 上海交通大学学报, 2024, 58(5): 739-746.

DOI:10.16183/j.cnki.jsjtu.2022.317      [本文引用: 1]

如何充分利用已有信息提高配电网故障诊断准确性,为配电网抢修提供精准研判是亟待解决的问题.针对已有配电网故障诊断信息来源单一的问题,提出融合配电网中、低压信息与变电站出线电流信息的配电网故障研判模型.该模型首先针对已有过电流诊断方法难以适用于大规模配电网的问题,分层缩减配电网求解规模,提高故障区段定位速率;然后针对过电流告警信息准确性问题,提出基于开关继电保护事件顺序记录(SOE)数据和变电站出线负荷骤降数据的配电网故障辅助研判手段;最后,总结实际工程中多方位信息数据融合配电网故障研判步骤,为调度人员故障诊断提供借鉴.工程实践证明:所提方法能有效进行故障诊断,对于大规模配电网适应性极强;结合开关动作SOE和遥测电压信息的辅助诊断模型,能满足过电流诊断模型对遥信信息准确性要求高的特点,两者互补性较高,工程实践中具有较好的故障诊断效果.

ZHANG Chunmei, XU Xingque, LIU Silin.

Distribution network fault diagnosis technology based on multi-source data fusion

[J]. Journal of Shanghai Jiao Tong University, 2024, 58(5): 739-746.

[本文引用: 1]

侯慧, 朱韶华, 俞菊芳, .

基于高效数据降维的配电网风灾停电用户数量预测模型

[J]. 电力系统自动化, 2022, 46(7): 69-76.

[本文引用: 1]

HOU Hui, ZHU Shaohua, YU Jufang, et al.

Prediction model for user number in power outage caused by wind disaster for distribution networks based on high-efficient data dimensionality reduction

[J]. Automation of Electric Power Systems, 2022, 46(7): 69-76.

[本文引用: 1]

马丽叶, 王海锋, 卢志刚, .

计及相关性影响的增强台风灾害下配电网韧性灵活性资源规划

[J]. 电力系统自动化, 2022, 46(7): 60-68.

[本文引用: 1]

MA Liye, WANG Haifeng, LU Zhigang, et al.

Flexible resource planning for improving distribution network resilience under typhoon disasters considering relevance impact

[J]. Automation of Electric Power Systems, 2022, 46(7): 60-68.

[本文引用: 1]

张稳, 盛万兴, 刘科研, .

计及天气因素相关性的配电网故障风险等级预测方法

[J]. 电网技术, 2018, 42(8): 2391-2398.

[本文引用: 1]

ZHANG Wen, SHENG Wanxing, LIU Keyan, et al.

A prediction method of fault risk level for distribution network considering correlation of weather factors

[J]. Power System Technology, 2018, 42(8): 2391-2398.

[本文引用: 1]

刘科研, 吴心忠, 石琛, .

基于数据挖掘的配电网故障风险预警

[J]. 电力自动化设备, 2018, 38(5): 148-153.

[本文引用: 1]

LIU Keyan, WU Xinzhong, SHI Chen, et al.

Fault risk early warning of distribution network based on data mining

[J]. Electric Power Automation Equipment, 2018, 38(5): 148-153.

[本文引用: 1]

徐特威, 鲁宗相, 乔颖, .

基于典型故障与环境场景关联识别的城市配电网运行风险预警方法

[J]. 电网技术, 2017, 41(8): 2577-2584.

[本文引用: 1]

XU Tewei, LU Zongxiang, QIAO Ying, et al.

A risk warning method for urban distribution network based on associated recognition of typical fault and environment scenario

[J]. Power System Technology, 2017, 41(8): 2577-2584.

[本文引用: 1]

刘鑫蕊, 李欣, 孙秋野, .

考虑冰灾环境的配电网态势感知和薄弱环节辨识方法

[J]. 电网技术, 2019, 43(7): 2243-2252.

[本文引用: 1]

LIU Xinrui, LI Xin, SUN Qiuye, et al.

A new method for situation awareness and weakness identification of distribution network considering ice disaster

[J]. Power System Technology, 2019, 43(7): 2243-2252.

[本文引用: 1]

DU Y, LIU Y D, WANG X H, et al.

Predicting weather-related failure risk in distribution systems using Bayesian neural network

[J]. IEEE Transactions on Smart Grid, 2021, 12(1): 350-360.

[本文引用: 1]

王朝盛, 邵峰, 谭锐, .

全厂AGC调度模式负荷经济分配方法研究

[J]. 湖南电力, 2023, 43(1): 90-94.

DOI:10.3969/j.issn.1008-0198.2023.01.015      [本文引用: 1]

将厂级AGC系统应用到现代调度系统中,提高能量管理系统运算速度,但由于缺少科学的厂级负荷优化分配手段,现阶段只是对AGC负荷在多台机组间平均分配。为解决该项技术难题,开展运行数据挖掘方法研究,建立负荷在线优化分配模型,结合试验方法实现机组能耗的在线准确计算。试验结果表明节能效果明显,为火电机组负荷实时优化分配奠定理论及应用基础。

WANG Chaosheng, SHAO Feng, TAN Rui, et al.

Study on load economic distribution method of AGC scheduling mode in plant

[J]. Hunan Electric Power, 2023, 43(1): 90-94.

DOI:10.3969/j.issn.1008-0198.2023.01.015      [本文引用: 1]

The application of plant AGC system in modern dispatching system can improve the operation speed of energy management system. However,due to the lack of scientific means of optimal distribution method of plant load. At this stage only AGC load is only evenly distributed among mutiple units. In order to solve this technical problem, this paper firstly studies the method of operation data mining, establishes the on-line optimal load distribution model, and finally realizes the on-line accurate calculation of unit energy consumption combined with the test method. The test results show that the energy-saving effect is obvious, which lays a theoretical and application foundation for the real-time optimal load distribution of thermal power units.

梁永亮, 郭汉琮, 薛永端.

基于特征气体关联特征的变压器故障诊断方法

[J]. 高电压技术, 2019, 45(2): 386-392.

[本文引用: 1]

LIANG Yongliang, GUO Hancong, XUE Yong-duan.

Transformer fault diagnosis method based on association characteristics of characteristic gases

[J]. High Voltage Engineering, 2019, 45(2): 386-392.

[本文引用: 1]

汪颖, 王曼, 陈韵竹, .

基于多维关联信息的电压暂降治理需求识别

[J]. 电网技术, 2022, 46(11): 4391-4402.

[本文引用: 1]

WANG Ying, WANG Man, CHEN Yunzhu, et al.

Identify the mitigation demand against voltage sag based on multidimensional related information

[J]. Power System Technology, 2022, 46(11): 4391-4402.

[本文引用: 1]

AVEN T, NØKLAND T E.

On the use of uncertainty importance measures in reliability and risk analysis

[J]. Reliability Engineering & System Safety, 2010, 95(2): 127-133.

[本文引用: 1]

FAWCETT T.

An introduction to ROC analysis

[J]. Pattern Recognition Letters, 2006, 27(8): 861-874.

[本文引用: 1]

SWETS J A. Signal detection theory and ROC analysis in psychology and diagnostics: Collected papers[M]. New York, USA: Psychology Press, 1996.

[本文引用: 1]

/