基于机器学习的台区负荷预测算法研究与开发文献综述

 2022-10-27 10:44:29

文献综述(或调研报告):

作为电力系统经济调度中的重要内容之一,短期负荷预测的准确性对改善电网运行性能起着重要作用。目前的负荷预测方法主要可以分为时间序列预测法[7]、回归分析预测法[8]和人工智能预测法[2]。时间序列预测法将历史电力负荷数据当作是按一定时间间隔变化的一个时间序列,建立一个能够描述此时间序列基本特征和变化规律的数学模型,由该模型再得出能够预测未来负荷的数学表达式。回归分析预测法是参考历史电力负荷数据,构造具有分析功能的数学模型,实现预测未来负荷的目的。其关键特征为把影响负荷的各个因素当作自变量,把负荷当作因变量,表现出较明显的内插优势。[9]将贝叶斯网络应用于电力系统负荷预测,符合大数据的分析趋势,是负荷预测中优良的思路。神经网络方法[3]以传统显示函数的自变量和因变量作为网络的输入和输出.将传统的函数映射关系转化为高维的非线性映射。神经网络是一个高度非线性的超大规模连续时间动力系统, 可以映射任意复杂的非线性关系.且能够识别有噪声或变形的样本.通过学习能把样本隐含的特征和规律分布于神经网络的连接权上[1]

为了使机器像人脑一样学习,即实现机器学习,需要构建相应的神经网络,虽然人类至今未能完全了解人脑的工作机理,但人脑的计算模型已经被模拟出:一件事情在人脑的多个神经元传递(并非像计算机那样输入指令并输出结果),在每个神经元都完成加工信息后得到结果。以学习形式分类,机器学习可以分为监督学习及非监督学习。监督学习需要给定训练数据集,从中学习出一个函数。当产生新的数据时,可以根据这个函数得到预测的结果。。而非监督又称为归纳性学习(聚类),利用相关算法建立中心,通过循环和递减运算减小误差,实现分类。

Heng Shi, Minghao Xu[15],通过构建新型的基于池化方法的深度循环神经网络(PDRNN)。网络对一组用户负荷曲线进行分批处理,作为池化层的输入,从而通过增加数据的多样性以及数量来解决了过拟合问题。方法已经在Tensorflow平台上实现,并且在爱尔兰对920个安装了智能电表的用户进行了测试。

聚类分析是一个将数据集划分成若干个子集的过程,并使同一集合内的数据对象具有较高的相似度,而不同集合中的数据对象不相似。国内外对聚类分析的研究已经有很多年,学者们研究的主要内容是基于距离的聚类分析,K-Medoids算法、K-Means算法以及其他的聚类算法的挖掘工具在众多的统计软件或者系统中得到广泛的应。1967年,MacQueen首次提出K均值聚类算法(K-means算法)。 迄今为止,很多聚类任务都选择该经典算法。该算法的核心思想是 找出K个聚类中心c1、c2 ,..., ck ,使得每一个数据点 xi 和与其最近的 聚类中心 cv 的平方距离和被最小化。。

在负荷预测中,可以通过聚类的方式,从众多变压器的负荷数据中,按照使用模式,分为若干类,并可以选取出典型的变压器,通过使用几个典型的变压器(最靠近聚类中心的变压器)数据来代替其余变压器的数据,即参数复用,达到减少数据储存量的效果,虽然这会使预测精度有一定的降低。传统的负荷特性数据聚类算法计算复杂,运行时间长。对于聚类算法的改进,前人已有了一些相关研究:赵莉,候兴哲等[4]通过综合考虑初始聚类中心的选择及聚类个数的选取2个因素,以数据对象密度的大小作为初始聚类中心的选取标准, 将簇间距离及簇内对象的分散程度作为聚类数目选择的重要参考,以此解决传统平均聚类算法容易陷入局部最优解的缺陷。

曾楠,许元斌等[5]通过将Canopy算法与K-Means算法有效地结合建立了分布式聚类模型,先使用Canopy算法确定K-Means类数,再利用K-Means算法,以福建省用户用电负荷信息为例进行实验对聚类 结果中的各类用户的负荷曲线和相应的聚类中心分布进行分析确定了影响算法运行时间的关键因素并通过聚类结果预测了用户负荷特征,下图为模型构建的总体流程

图1模型构建的总体流程

李卫平[7]提出了对K-Means算法进行改进。他针对K-Means算法对初值的依赖性,基于最小生成树原理选择聚类中心进行聚类。根据寻找最优初值的思想提出了一种改进K-Means算法, 并将卡斯克鲁尔算法以及贪心算法的思想引入到K-Means算法中。

剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付

以上是毕业论文文献综述,课题毕业论文、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。