摘要: 当下电力设备状态大数据呈现爆炸式增长,设备故障、数据传输以及人为操作失误等原因都会导致问题数据的出现,影响数据质量以及后续的分析结果,因此数据清洗具有重要意义。目前大多数研究着力于识别出异常数据并直接剔除,破坏了数据的完整性。针对此问题,提出一种基于改进堆叠降噪自编码器的数据清洗方法,首先采用粒子群算法对堆叠降噪自编码器中的超参数进行优化,再利用堆叠降噪自编码器提取、还原数据特征的特点来进行数据清洗,实现对孤立点的修复和对空缺数据的填补,以有效提升电力设备状态数据的质量。所提方法简单高效,可以同时提高数据集的准确性和完整性。以电力设备的历史运行数据为例进行测试,算例结果表明本文所提方法相比于其他现有经典方法,数据清洗效果更好,且针对不同异常程度、不同运行状态的数据集都有良好的清洗效果,能够用于提高电力设备状态数据的质量。
中图分类号:
计蓉, 侯慧娟, 盛戈皞, 张立静, 舒博, 江秀臣. 基于粒子群优化堆叠降噪自编码器的电力设备状态数据质量提升(网络首发)[J]. 上海交通大学学报, doi: 10.16183/j.cnki.jsjtu.2023.388.
JI Rong, HOU Huijuan, SHENG Gehao, ZHANG Lijing, SHU Bo, JIANG Xiuchen.
Data Quality Improvement Method for Power Equipment Condition Based on Stacked Denoising Autoencoders Improved by Particle Swarm Optimization
[J]. Journal of Shanghai Jiao Tong University,
doi: 10.16183/j.cnki.jsjtu.2023.388.