一种基于Canopy-Kmedoids算法的台区线损数据处理方法、装置、介质与流程

文档序号:25484571发布日期:2021-06-15 21:45阅读:137来源:国知局
一种基于Canopy-Kmedoids算法的台区线损数据处理方法、装置、介质与流程

本发明涉及智能电网数据处理技术领域,特别是一种基于canopy-kmedoids算法的台区线损数据处理方法、装置、介质。



背景技术:

现有技术中,目前电网企业台区线损管理普遍采用一刀切的方式,通过人工设置台区合理线损率开展日常管理工作,没有考虑各台区在导线选型、供电半径、负荷分布、用户类别、负载水平、用电季节、运行年限等方面的差异,缺乏科学依据,在指导具体节能降耗工作实施方面缺乏实际参考意义。鉴于电网企业对台区线损管理的要求逐年提高,更加合理、精确的理论线损率计算方法迫在眉睫。对台区进行精确划分,是实现台区精细化管理的重要途径。

但是,现有技术中对台区的聚类划分不够准确,有的时候是依据人的主观因素进行划分,划分结果不够客观,如何进行电网台区的精确地、客观的划分聚类是进行线损控制的一个难题,且聚类后存在多个聚类方案时,难以选择出最佳的聚类方案。



技术实现要素:

本发明针对上述现有技术中的缺陷,提出了如下技术方案。

一种基于canpoy-kmedoids算法的台区线损数据处理方法,该方法包括以下步骤:

步骤s1,采集配电网台区的基础数据信息,所述基础数据信息包括所述台区的静态参数,基于所述静态参数筛选出线损率稳定的台区样本集合;

步骤s2,基于所述基础数据信息分析台区线损率影响因素,选择影响程度大的台区静态参数,通过canpoy算法对所述台区样本集合进行“粗”聚类,得到canpoy子集;

步骤s3,以canopy子集的中心点作为k-medoids算法的初始中心点进行“细聚类”,采用k-medoids算法对所述台区样本集合再进行台区类别聚类;

步骤s4,通过计算每种聚类方案的误差平方和sse,以每种聚类方案的误差平方和做出手肘图,选择手肘图拐点处的k值作为最优k值作为最优结果;

步骤s5,基于台区聚类划分的所述最优结果,根据选取的台区静态参数,分析判断台区类型划分是否合理,如果是,则使用所述最优结果进行该台区的线损计算,并根据线损计算结果对电网进行控制。

更进一步地,所述步骤s1的操作为:采集配电网台区基础数据信息,所述基础数据信息包括:接入及校对设备台账数据、表计档案、计量点档案、用户信息和台区信息等;对所述基础数据信息进行处理,选取对影响线损率的台区运行年限、城农网标识、居民容量占比、居民户均容量和台区用户数量作为台区静态参数,基于所述台区静态参数筛选线损率稳定的台区样本集合。

更进一步地,基于所述台区静态参数筛选线损率稳定的台区样本集合时,删除以下几种不合格台区:采集的基础数据信息未全覆盖、台区下有特殊用电用户以及线损率为负值或超过10%,所述特殊用电用户为光伏发电用户或发生业务变更的用户。

更进一步地,步骤s2的操作过程为:通过canpoy算法对所述台区样本集合进行“粗”聚类,得到canpoy子集,包括:

①将所述台区样本集合构成list集合,然后指定两个距离阈值t1和t2(t1>t2);

②随机选取list中的一个台区对象p,构成一个新的canpoy,并将台区对象p从集合list中移除;

③对于list中剩余的台区对象,计算与台区对象p之间的距离,如果间距小于t1,就把它分配到台区对象p所在的canpoy中;如果与台区对象p的间距小于t2,则将它从list中删除,④重复步骤②和③,直到list为空。

所述步骤s3的操作为:将形成的canpoy子集数目作为k值,canpoy子集的中心点作为k-medoids算法的初始的聚类中心点进行聚类,其中k-medoids算法采用聚类质量评价函数对所述台区样本集合中的台区对象进行迭代划分,所述聚类质量评价函数定义如下:

其中,e是参加聚类的所有台区对象p与其所属簇的中心对象oi的绝对误差之和,k为簇数,所述k-medoids算法通过最小化e把所有台区对象分配至k个簇,ci为第i个簇;

①在所述台区样本集合d中随机选择k个台区对象作为每个簇初始中心台区对象;

②将剩余台区对象分配至与其最近的中心台区对象所代表的簇中;

③选取一个未选取过的中心台区对象;

④选取一个未选取过的非中心台区对象;如果用oj替换oi聚类质量评价函数变小,则用oj替换oi并形成新k个中心台区对象的聚类集合;

⑤重复步骤④直至所有非中心台区对象都被选取过;

⑥重复步骤③直至所有中心台区对象都被选取过,最后将所述台区样本集合d中的台区对象分为k个簇。

更进一步地,所述步骤s4的操作为:通过计算每种聚类方案的误差平方和sse,以每种聚类方案的误差平方和做出手肘图,选择手肘图拐点处的k值作为最优k值,其中手肘法的核心判断是随着聚类数k的增加,样本划分会更加精细,每个簇的聚合程度会逐渐提高,那么误差平方和sse会逐渐变小。并且,当k小于真实聚类数时,由于k的增大会大幅增加每个簇的聚合程度,故sse的下降幅度会很大,而当k到达真实聚类数时,再增加k所得到的聚合程度回报会迅速变小,所以sse的下降幅度会骤减,然后随着k值的继续增大而趋于平缓,也就是说sse和k的关系图是一个手肘的形状,而这个肘部对应的k值就是数据的真实聚类数。

本发明还提出了一种基于canopy-kmedoids算法的台区线损数据处理装置,所述装置包括处理器、存储器及显示设备,所述处理器执行所述存储器上的程序以实现上述任一方法。

本发明还提出了一种计算机可读存储介质,所述存储介质上存储有计算机程序,所述处理器执行所述存储介质上的程序以实现上述任一方法。

本发明的一种基于canopy-kmedoids算法的台区线损数据处理方法、装置、介质,该方法包括以下步骤:步骤s1,采集配电网台区的基础数据信息,所述基础数据信息包括所述台区的静态参数,基于所述静态参数筛选出线损率稳定的台区样本集合;步骤s2,基于所述基础数据信息分析台区线损率影响因素,选择影响程度大的台区静态参数,采用canopy-kmedoids算法对所述台区样本集合进行台区类别聚类;步骤s3,通过计算每种聚类方案的误差平方和,统计每种聚类方案的误差平方和做出手肘图,选择手肘图拐点处的k值作为最优k值;;步骤s4,基于台区聚类划分的所述最优结果,根据选取的台区静态参数,分析判断台区类型划分是否合理,如果是,则使用所述最优结果进行该台区的线损计算,并根据线损计算结果对电网进行控制。本发明中,由于在数据整理时去掉了不合格台区,从而提高了台区聚类划分的准确性及客观性,本发明使用canopy-kmedoids算法对台区对象进行分类,提高了台区对象聚类划分的准确性及客观性,降低了噪声数据的影响,提高了聚类效果,本发明中,对聚类结果采用轮廓系数方法进行分析,选择出最优的台区聚类划分,作为台区类别划分的最终结果,同时确定各簇的中心台区对象,从而进行线损的计算,使得线损计算准确、客观,提高了线损评估的准确性。

附图说明

通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本申请的其它特征、目的和优点将会变得更明显。

图1是根据本发明的实施例的一种基于canopy-kmedoids算法的台区线损数据处理方法的流程图。

具体实施方式

下面结合附图和实施例对本申请作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释相关发明,而非对该发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与有关发明相关的部分。

需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。

图1示出了本发明的一种基于canopy-kmedoids算法的台区线损数据处理方法,该方法包括以下步骤:

步骤s1,采集配电网台区的基础数据信息,所述基础数据信息包括所述台区的静态参数,基于所述静态参数筛选出线损率稳定的台区样本集合;

步骤s2,基于所述基础数据信息分析台区线损率影响因素,选择影响程度大的台区静态参数,通过canpoy算法对所述台区样本集合进行“粗”聚类,得到canpoy子集;

步骤s3,以canopy子集的中心点作为k-medoids算法的初始中心点进行“细聚类”,采用k-medoids算法对所述台区样本集合再进行台区类别聚类;

步骤s4,通过计算每种聚类方案的误差平方和sse,以每种聚类方案的误差平方和做出手肘图,选择手肘图拐点处的k值作为最优k值作为最优结果;

步骤s5,基于台区聚类划分的所述最优结果,根据选取的台区静态参数,分析判断台区类型划分是否合理,如果是,则使用所述最优结果进行该台区的线损计算,并根据线损计算结果对电网进行控制。

在一个实施例中,所述步骤s1的操作为:采集配电网台区基础数据信息,所述基础数据信息包括:接入及校对设备台账数据、表计档案、计量点档案、用户信息和台区信息等;对所述基础数据信息进行处理,选取对影响线损率的台区运行年限、城农网标识、居民容量占比、居民户均容量和台区用户数量作为台区静态参数,基于所述台区静态参数筛选线损率稳定的台区样本集合。在实际数据采集中,有的台区数据明显异常需要将其去掉,即基于所述台区静态参数筛选线损率稳定的台区样本集合时,删除以下几种不合格台区:采集的基础数据信息未全覆盖、台区下有特殊用电用户以及线损率为负值或超过10%,所述特殊用电用户为光伏发电用户或发生业务变更的用户。由于在数据整理时去掉了不合格台区,从而提高了台区聚类划分的准确性及客观性,对于这些不合格的台区,可以人工排查导致数据异常的原因。最后形成的台区样本集合为d,p为d中的一个台区对象,p为一个向量,其由该台区的基础数据信息构成,这是本发明的一个重要发明点。

在一个实施例中,通过canpoy算法对所述台区样本集合进行“粗”聚类,得到canpoy子集,包括:

①将所述台区样本集合构成list集合,然后指定两个距离阈值t1和t2(t1>t2);

②随机选取list中的一个台区对象p,构成一个新的canpoy,并将台区对象p从集合list中移除;

③对于list中剩余的台区对象,计算与台区对象p之间的距离,如果间距小于t1,就把它分配到台区对象p所在的canpoy中;如果与台区对象p的间距小于t2,则将它从list中删除,④重复步骤②和③,直到list为空。

更进一步地,步骤s3的操作过程为:

将形成的canpoy子集数目作为k值,canpoy子集的中心点作为k-medoids算法的初始的聚类中心点进行聚类,其中k-medoids算法采用聚类质量评价函数对所述台区样本集合中的台区对象进行迭代划分,所述聚类质量评价函数定义如下:

其中,e是参加聚类的所有台区对象p与其所属簇的中心对象oi的绝对误差之和,k为簇数,所述k-medoids算法通过最小化e把所有台区对象分配至k个簇,ci为第i个簇;

①在所述台区样本集合d中随机选择k个台区对象作为每个簇初始中心台区对象;

②将剩余台区对象分配至与其最近的中心台区对象所代表的簇中;

③选取一个未选取过的中心台区对象;

④选取一个未选取过的非中心台区对象;如果用oj替换oi聚类质量评价函数变小,则用oj替换oi并形成新k个中心台区对象的聚类集合;

⑤重复步骤④直至所有非中心台区对象都被选取过;

⑥重复步骤③直至所有中心台区对象都被选取过,最后将所述台区样本集合d中的台区对象分为k个簇。

本发明使用k-medoids算法进行台区聚类,k-means算法和k-medoids算法是两种最常用基于划分的聚类方法。其中,k-means算法由于采用簇中对象的均值作为簇中心,当遇到离群点对象时会严重扭曲簇中心,影响了其它对象到簇的分配,因而k-means算法对噪声数据比较敏感。与k-means算法相比,k-medoids算法选取实际对象作为簇中心对象,剩余对象分配到与其最相似的中心对象所在的簇,从而降低了噪声数据影响。相比k-means,本发明使用k-medoids对台区对象进行聚类,提高了台区对象聚类划分的准确性及客观性,降低了噪声数据的影响,提高了聚类效果,这是本发明的另一个重要发明点。

在一个实施例中,所述步骤s4的操作为:

通过计算每种聚类方案的误差平方和sse,以每种聚类方案的误差平方和做出手肘图,选择手肘图拐点处的k值作为最优k值,其中手肘法的核心判断是随着聚类数k的增加,样本划分会更加精细,每个簇的聚合程度会逐渐提高,那么误差平方和sse会逐渐变小。并且,当k小于真实聚类数时,由于k的增大会大幅增加每个簇的聚合程度,故sse的下降幅度会很大,而当k到达真实聚类数时,再增加k所得到的聚合程度回报会迅速变小,所以sse的下降幅度会骤减,然后随着k值的继续增大而趋于平缓,也就是说sse和k的关系图是一个手肘的形状,而这个肘部对应的k值就是数据的真实聚类数,从而求出最优的聚类结果,解决了现有技术中难以确定最优聚类结果的缺陷,这是本发明的重要发明点之一。

本发明中,通过canpoy算法对数据集进行“粗”聚类,得到canpoy子集,以canopy子集的中心点作为kmedoids算法的初始中心点进行“细聚类”,再通过手肘法计算出最佳k值作为台区类别划分的最终结果,同时确定各簇的中心台区对象,从而进行线损的计算,使得线损计算准确、客观,canopy算法弥补了kmedoids聚类中指定k值和初始中心点随机选取的不足的确定,使得算法结果更加精准,即本发明中使用canpoy算法先进行初始聚类,以canopy子集的中心点作为kmedoids算法的初始中心点再进行“细聚类”,解决现有kmedoids聚类算法中心点随机选择的聚类存在偶然性,提高了聚类效果,这是本发明的重要发明点之另一。

在一个实施例中,根据线损计算结果确定影响电网线损的主要指标,基于所述主要指标对电网运行系统进行控制,以降低所述地区的电网线损。

本发明还提出了一种基于canopy-k-medoids算法的台区线损数据处理装置,所述装置包括处理器、存储器及显示设备,所述处理器执行所述存储器上的程序以实现上述任一方法。

本发明还提出了一种计算机可读存储介质,所述存储介质上存储有计算机程序,所述处理器执行所述存储介质上的程序以实现上述任一方法。

通过以上的实施方式的描述可知,本领域的技术人员可以清楚地了解到本申请可借助软件加必需的通用硬件平台的方式来实现。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在存储介质中,如rom/ram、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例或者实施例的某些部分所述的方法。

最后所应说明的是:以上实施例仅以说明而非限制本发明的技术方案,尽管参照上述实施例对本发明进行了详细说明,本领域的普通技术人员应当理解:依然可以对本发明进行修改或者等同替换,而不脱离本发明的精神和范围的任何修改或局部替换,其均应涵盖在本发明的权利要求范围当中。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1