您的位置 首页 > 数码极客

『如何对数据异常值处理』异常值处理需要数据降维吗

#头号周刊#

华北电力大学控制与计算机工程学院的研究人员马良玉、程善珍,在2022年第13期《电工技术学报》上撰文,提出一种基于支持向量数据描述(SVDD)和XGBoost模型的风电机组异常工况预警方法。

作为可再生的清洁能源,我国风力发电装机容量不断增加,成为继火电、水电后的第三大能源。由于长期承受恶劣多变的运行环境,风电机组故障率较高,对电力系统的安全稳定运行造成很大影响,带来巨大的经济损失和安全隐患。

充分利用机组监控与数据采集系统(Supervisory Control And Data Acquisition, SCADA)提供的大量运行数据,在故障早期监测到风机状态异常,则可为现场运维人员争取更多的应急处理时间,有助于提高机组安全经济性、降低运维成本。

目前,许多学者开展了基于SCADA数据的风电机组故障预警与诊断研究,基本思路有两种:一种是从SCADA历史数据中挖掘出已经发生的故障信息,据此建立故障辨识模型;另一种是从SCADA历史数据中提取正常工况运行数据,建立风机是否异常的判定模型。前者侧重于故障类型识别,需要大量故障信息,条件较难满足;后者则侧重于故障早期的异常状态预警,与前者相比对运维人员更有指导意义。

有学者采用支持向量回归(Support Vector Regression, SVR)和浅层神经网络进行正常工况性能预测,并根据预测值与实际值之间的残差与故障预警阈值的关系,提前进行异常预警。但受限于模型信息容量较小、泛化能力不足等原因,异常工况识别精度需要进一步提高。

由于深度神经网络对于SCADA系统大数据具有更强的学习能力,因此在性能预测与故障预警领域日益受到重视。其中机器学习领域的XGBoost(eXtreme gredient boosting)算法因具有损失函数精确、模型准确度高、泛化能力强等优势,常应用于风机故障诊断。有学者通过与朴素贝叶斯、随机森林和支持向量机等算法比较,表明XGBoost算法运行速度较快,准确度更高,能精准识别风机故障类别。有学者使用XGBoost算法可以有效地诊断风机齿轮箱故障。

SCADA系统记录的运行数据中既包含风机的正常运行数据也包含异常和故障发生时的数据及部分停机数据,建立正常工况风机性能预测模型时,需要将故障和停机数据加以剔除。此外,由于风速、风向、偏航角等测量信号具有时变性、随机性和不确定性,数据中不可避免地包含噪声和异常值、以及由于通信问题导致的空值和坏数据,为确保预测模型的精度,这些异常值需要加以清洗。

因此SCADA数据预处理是风机性能预测与状态预警中重要的基础性工作,已有很多文献对此进行研究,提出了诸多数据清洗方法]。这些方法有的比较繁琐,有的对数据集特征有一定要求,各有优缺点。

华北电力大学控制与计算机工程学院的研究人员针对风电机组异常工况早期预警开展研究,以某1.5MW风电机组为例,提出利用支持向量数据描述(Support Vector Data Description, SVDD)算法对SCADA数据进行预处理,再采用XGBoost建立正常性能预测模型,进而采用时间滑动窗口模型计算性能评价指标,合理确定预警阈值,最终实现风电机组运行状态预警。

研究人员从机组监控与数据采集系统(SCADA)数据中选择与转速和发电功率密切相关的特征变量,利用SVDD算法对建模数据进行预处理,采用XGBoost建立风机正常性能预测模型。以所建预测模型为基础,构建时间滑动窗计算性能评价指标,并根据统计学的区间估计理论合理确定风机性能异常预警指标阈值。采用某风电场1.5MW风电机组SCADA系统记录的若干真实故障案例,开展异常工况预警仿真试验。

他们的研究结果表明,基于SVDD和XGBoost的风机异常工况预警方法,可以有效地清洗数据,及时识别风电机组异常状态,对于提高风电机组运行的安全性具有较好的工程实用意义。

本文编自2022年第13期《电工技术学报》,论文标题为“基于支持向量数据描述和XGBoost的风电机组异常工况预警研究”。

(此处已添加书籍卡片,请到今日头条客户端查看)

责任编辑: 鲁达

1.内容基于多重复合算法人工智能语言模型创作,旨在以深度学习研究为目的传播信息知识,内容观点与本网站无关,反馈举报请
2.仅供读者参考,本网站未对该内容进行证实,对其原创性、真实性、完整性、及时性不作任何保证;
3.本站属于非营利性站点无毒无广告,请读者放心使用!

“如何对数据异常值处理,异常值处理需要数据降维吗,python数据异常值的处理,spss数据异常值处理,数据清洗异常值处理,excel数据异常值处理”边界阅读