本发明涉及新能源汽车充电站,尤其涉及一种基于数据驱动的充电站多特征画像建模方法及系统。
背景技术:
1、随着电动汽车产业的迅猛发展,充电站作为支撑电动汽车运行的重要基础设施,其建设和运营情况直接关系到电动汽车的普及程度和用户的充电体验。然而,传统的充电站管理方法往往局限于单一的运营指标,难以全面反映充电站的运营状态、设备性能、用户需求等多维度特征,也无法有效支撑充电站参与电网的互动调控。随着大数据和人工智能技术的发展,数据驱动的方法在各个领域得到了广泛应用。在充电站运营领域,通过收集和分析充电站的运行数据、用户充电行为数据、设备状态数据等多源信息,可以实现对充电站运营情况的全面感知和精准画像。这种基于数据驱动的充电站画像建模方法,能够深入挖掘充电站的潜在特征,为充电站的管理和优化提供科学依据。然而,目前尚未有成熟的基于数据驱动的充电站多特征画像建模方法。现有的充电画像构建方法往往聚焦于电动汽车用户行为特征分析,缺乏对充电站精准画像的深入挖掘和综合分析。同时,现有的充电站运营情况分析方法也往往缺乏对电网互动调控的考虑,难以为充电站参与电网互动调控提供有效支撑。
2、因此,本发明旨在提出一种基于数据驱动的充电站多特征画像建模方法,通过构建充电站的多特征画像标签体系,运用聚类算法将充电站分成具有特定共性特征的群体。本发明不仅能够深入挖掘充电站的多维度特征,还能够基于画像分析结果,支撑后续充电站参与电网互动调控决策制定。一方面能够提升充电站的管理水平和运营效率,另一方面能够促进充电站与电网的互动协调发展,推动新能源汽车产业的可持续发展。
技术实现思路
1、鉴于上述现有存在的问题,提出了提供一种基于数据驱动的充电站多特征画像建模方法,收集充电站的周边兴趣点、订单数量、充电量、充电频次、充电负荷等多维度数据,构建出一个全面反映充电站运营情况的画像标签体系,通过提取标签数据特征并进行聚类实现充电站群体分类。该画像不仅包括充电站的基本属性,如位置、规模等,还包括充电站的运营状态、用户充电行为模式以及用户充电对电网的影响等动态特征。通过构建多特征画像,充电运营商可以全面精准分析充电站的运营情况,制定更加合理的运用策略来提高站点运营效益;同时也能根据充电站画像群体特征更好地引导充电站参与电网互动调控,实现电网削峰填谷。
2、为解决上述技术问题,提出了一种基于数据驱动的充电站多特征画像建模方法,包括,
3、进行充电站数据采集并进行预处理,基于画像理论构建充电站多特征画像标签体系;通过穷举搜索法处理标签体系并进行特征选择,筛选充电站画像标签确定画像标签最优子集;对充电站分类后采用k-means算法构建用户充电行为特征画像对充电场站开展聚类分析。
4、作为本发明所述的一种基于数据驱动的充电站多特征画像建模方法的一种优选方案,其中:所述充电站数据采集包括,采集多维度数据包括充电站属性数据、充电站运营数据以及充电站外部数据。
5、所述站点所处位置,站点应用场景包括公共充电站、公交充电站、商业综合体充电站以及大型园区充电站,站点营业时间,站点运营商信息。
6、所述充电站运营数据包括站点充电桩数量、日充电量、日桩均充电量、单均充电量、单枪充电时长、单均充电时长、充电订单量、单桩充电频次、日订单时段、大周期订单。
7、所述充电站外部数据包括地图api获取的poi数据包括数据获取半径、poi名称、poi类别以及poi坐标,充电站所属区域电网负荷数据。
8、所述预处理包括收集充电站属性数据、运营数据以及外部数据检查数据质量,剔除重复项数据,对收集到的数据进行清洗,对于缺失的数据进行插值填补,对于异常值进行拟合修正,保留数据处理中的所有数据源,对清洗处理后的数据采用z-score法对数据进行归一化处理,当数据不平衡时,进行样本权重计算,平衡偏差:
9、
10、其中,wi是第i个充电站的样本权重,α、β以及γ是调整系数平衡不同特征对权重的影响,ri是第i个充电站的使用频率,是所有充电站使用频率的平均值,sati是第i个充电站的用户满意度评分,min(sat)和max(sat)分别是所有充电站满意度评分的最小值和最大值,z是总充电站类型数量,zk是第k类充电站的样本数。
11、作为本发明所述的一种基于数据驱动的充电站多特征画像建模方法的一种优选方案,其中:所述构建充电站多特征画像标签体系包括基于预处理后的充电站的数据,设计充电站数据驱动型画像指标体系,构建包含事实标签、模型标签及特征标签的充电站多层级多特征画像标签体系。
12、所述事实标签包括根据自身属性、充电需求以及调控潜力对处理后的原始数据进行事实标签划分,并以事实标签为基础构建模型标签包括计算画像特征指标包括充电站poi个数、充电站利用率、单桩平均充电量、峰时耗电率以及峰值时差率。
13、所述充电站poi个数包括收集充电站点半径范围为(100m,500m)的poi,统计充电站附近poi数量n。
14、所述充电站利用率包括1个充电站有n个正常使用的充电桩,用tj表示第j个充电桩一日内充电时长,则第j个充电桩的利用率rj表示为rj=tj/24,充电站平均利用率rs可表示为:
15、
16、所述单桩平均充电量为:
17、
18、其中,etot,i为第i个充电站总交易电量,ni为第i个充电站具有的桩数量。eave,i为第i个充电站桩均充电量。
19、所述峰时耗电率表达为:
20、
21、其中,epeak,a表示充电站i的峰时耗电率,tpeak表示高峰时段的时间集合,p(t)表示在时间t的充电电流,φ(t)表示在时间t的电价,i(t)表示在时间t的充电电流,e表示充电效率。
22、
23、其中,t表示充电过程中的时间点。
24、所述峰值时差率表达为:
25、
26、其中,tp,i表示充电站a的峰值时差率,x表示监测时间段内电网负荷高峰时段的个数,y表示监测时间段内充电站充电负荷高峰时段的个数,p(t)表示充电站在时间t的负荷功率数据,t1和t2为监测时间段的起止时间,jpeak高峰时段的时间点数,j表示高峰时段的个数。
27、作为本发明所述的一种基于数据驱动的充电站多特征画像建模方法的一种优选方案,其中:所述特征标签的充电站多层级多特征画像标签体系包括通过模型标签的画像特征指标确定每个充电站的特征标签包括充电站位置重要度、充电站充电需求度以及充电负荷可转移度,并通过重要度、需求度以及可转移度构建充电站多特征画像标签体系表示充电站多方位的运营特征。
28、通过充电站poi个数确定充电站位置重要度importance:
29、
30、poi个数n越多,充电站的位置越重要,需要优先保障当前充电站的充电需求,其中,z是总充电站不同类型的数量,rk是第k种服务类型的使用频率,ak是第k种服务类型的信息指数包含用户评价、服务速度,erf(n)是误差函数,用于归一化充电站poi个数的影响。
31、通过充电站利用率和单桩充电量进行评估确定充电站充电需求度:
32、
33、当充电需求度属于0至1时,表示充电站不被使用,充电需求低。
34、当充电需求度远大于1时,表示充电站利用率高,单桩充电量大,充电需求高,其中,g(x)表示根据充电站的不同特征对数据进行筛选和权重分配的非线性函数,h(r)表示充电站服务质量函数,r代表充电站的服务质量指标,λ(eave,i)表示单桩充电量的概率密度函数将充电量标准化处理,和分别表示单桩充电量的最小值和最大值,sat‘为用户满意度评分。
35、通过峰时耗电率和峰时覆盖率,评估从充电负荷及时间综合反映充电站充电负荷转移的潜力水平,确定充电负荷可转移度:
36、
37、当可转移度属于0至0.5时,表示充电负荷的可转移度低,当可转移度属于0.5至1时,表示充电负荷的可转移度高。
38、作为本发明所述的一种基于数据驱动的充电站多特征画像建模方法的一种优选方案,其中:所述画像标签最优子集包括将得到的充电站特征标签通过matlab穷举搜索进行特征组合,组合一为位置重要度+充电需求度、组合二为位置重要度+充电负荷可转移度、组合三为充电需求度+充电负荷可转移度、组合四为位置重要度+充电需求度+充电负荷可转移度,评估每个特征组合的性能,选择性能最优的特征组合:
39、
40、其中,f(c)为性能评估函数,c为特征组合,ω是数据空间,y(c,δ)是特征组合c对应的模型预测函数,g(δ)真实数据分布函数,δ代表充电站数据中的特征值,ω(δ)是归一化常数使积分结果在[0,1]范围内,u是数据点的数量,ru是第u个数据点的真实值,是特征组合c对应的模型预测值,θu是预测误差的标准差,ε是成本影响因子,v是特征的数量,wv是第v个特征的重要性权重,tv(c)是特征组合c中第v个特征的计算时间。
41、将四个组合依次输入公式中计算评估值,对四个组合的评估值排序,数值越大,性能越优,按照评估值由高到低进行组合排序,对组合进行评分评估值由高到低分别赋予4、3、2、1分。
42、在评估每个特征组合的性能的同时,对特征组合进行冗余性检验,去除重复与相似的用户特征:
43、
44、其中,ρ(x1,x2)斯皮尔曼相关系数,用于评估组合中特征之间的冗余性,w将冗余检验的两个的特征缩放到相同的范围内,去除特征1中的重复和相似信息,去除特征2中的重复和相似信息,φ对特征1和特征2之间的差异进行加权,x1和x2是对比冗余特征1和2的数据集,和分别代表特征1和特征2数据集中的样本点,u1和u2是特征1和特征2数据集中数据点的数量,b和d表示在区间[b,d]上的积分运算。
45、
46、其中,q是傅里叶变换的频率点数,l是小波函数的个数,e-j2πft是傅里叶变换的核函数,ψk(t)是小波函数。
47、当ρ(x1,x2)相关系数大于0.8,ρ(x1,x2)相关系数小于-0.8时,认为是特征间存在高度相关性,当ρ(x1,x2)相关系数在(-0.8,0.8)间时,认为特征间的相关性允许忽略。
48、当特征间存在高度相关性时,计算特征组合间的相关性占比,进行组合中高度相关性占比排序,按照占比值由高到低进行组合排序,对组合进行评分,占比值由高到低分别赋予1、2、3、4分,结合评估值评分计算总分,选择分值最高的组合去除相关性高的特征作为画像标签最优子集,当总分相同时,选择评估值评分高的为画像标签最优子集。
49、作为本发明所述的一种基于数据驱动的充电站多特征画像建模方法的一种优选方案,其中:所述对充电场站开展聚类分析包括根据标签体系计算得出的样本数据集规模为u,在其中随机选取k个初始聚类中心ci(1≤i≤k),选取手肘法确定最佳聚类数目,逐个计算样本数据与初始聚类中心的距离,根据聚类中心对应的类进行分组,当分组内的数据与上次分组一致时,进行算法收敛,输出结果,当分组内的数据与上次分组不一致时,找出距离最近的聚类中心,并归类到当前簇,更新聚类中心,计算各个簇中数据项均值作为新的聚类中心,重新进行迭代,降低簇内误差平方和sse,直到聚类中心不再变化或目标函数收敛,迭代停止。
50、聚类结束后,评价指标聚类有效性公式:
51、
52、其中,xi为第i个样本数据,μk为第k个聚类中心的均值,σk为第k个聚类中心的方差,当b(u,k,sse)>0时,值越大表示聚类效果好,聚类有效性高,当b(u,k,sse)≤0时,表示聚类效果与随机分配无异,聚类无效。
53、将聚类有效的画像标签最优子集进行分层分级调控。
54、作为本发明所述的一种基于数据驱动的充电站多特征画像建模方法的一种优选方案,其中:所述分层分级调控包括分为三级调控:
55、一级调控为系统根据画像标签最优子集,对充电站进行分类,将充电站分为高、中、低三类充电需求等级,系统根据电网负荷情况,实时向充电站发送调控指令包括限电、增容,充电站根据接收到的调控指令,调整充电桩的输出功率,满足电网调控需求,充电站将调控结果反馈给系统。
56、二级调控为系统根据一级调控的反馈结果,分析充电站的充电需求变化趋势,预测短期的充电需求,系统根据预测结果,通过自动调度定价和需求响应向充电站发送实时调控指令,制定调控策略包括调整充电桩的输出功率、优化充电站布局和预调度,系统将调控策略发送给充电站,充电站根据调控策略进行相应的调整,充电站将调整结果反馈给系统。
57、三级调控为系统根据二级调控的反馈结果,分析充电站的长期运营情况,评估充电站的整体性能,系统根据评估结果,制定优化策略包括提高充电桩的利用率、降低充电站的运营成本,系统将优化措施发送给充电站,充电站根据优化措施进行调整,充电站将调整结果反馈给系统,系统根据反馈结果评估优化效果,调整优化措施。
58、本发明的另外一个目的是提供了一种基于数据驱动的充电站多特征画像建模系统,本发明通过采集和预处理充电站的属性、运营及外部数据,构建一个全面的多层级多特征画像标签体系,进而利用特征选择和聚类分析方法,对充电站进行精细化的分类和调控。本系统旨在优化充电站的运营管理,提高充电桩的利用效率,降低运营成本,同时实现电网负荷的优化分配,满足用户的充电需求,提升用户满意度,并支持充电站的长期可持续发展。通过这样的闭环系统和动态调控策略,充电站能更好地适应市场变化和电网需求,提升整体充电网络的性能和可靠性。
59、作为本发明所述的一种基于数据驱动的充电站多特征画像建模系统的一种优选方案,其特征在于,包括数据处理模块、特征选择与画像构建模块以及聚类分析与调控模块。
60、所述数据处理模块,收集充电站的属性数据、运营数据以及外部数据,对收集到的数据进行清洗、插值填补、异常值修正的预处理操作,使用z-score法对数据进行归一化处理,并进行样本权重计算以平衡数据偏差,构建包含事实标签、模型标签及特征标签的多层级多特征画像标签体系。
61、所述特征选择与画像构建模块,通过充电站的位置重要度、充电需求度以及充电负荷可转移度的特征标签,构建充电站的多特征画像,使用穷举搜索法处理画像标签体系,筛选出画像标签的最优子集,对特征组合进行性能评估和冗余性检验,以确定最优的特征组合。
62、所述聚类分析与调控模块,使用k-means算法对充电站进行聚类分析,以识别不同的用户充电行为特征,根据聚类结果,对充电站进行分类调控。
63、一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现一种基于数据驱动的充电站多特征画像建模所述的方法的步骤。
64、一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现一种基于数据驱动的充电站多特征画像建模所述的方法的步骤。
65、本发明的有益效果:当前,针对传统的充电站管理局限于单一的运营指标,难以全面反映充电站的运营状态、设备性能、用户需求等多维度特征,也无法有效支撑充电站参与电网的互动调控等问题,本发明充分挖掘充电站大数据价值,提供了一种通过分析充电站历史运营数据来构建充电站画像特征标签体系,并采用聚类算法实现充电站特征分类的方法,此外,本发明还利用多个输入特征,包括属性特征、充电需求特征、参与电网调控特征等,除考虑充电站运营情况外,还考虑充电站参与电网互动调控的画像构建,以支持后续的充电站参与电网互动调控的分层分级策略制定和调控过程的精细化管理。具体来看,本发明的有益效果主要体现在:
66、多维运营特征分析:基于画像理论,从充电场站的基础属性、用能需求、调控特征等多个维度构建了充电站运营画像标签体系,全面表征了充电站的运营特征。
67、特征选择与聚类分析:利用标签相关性分析确定最优的画像标签子集,然后采用k-means算法进行聚类分析,将充电站分为具有特定共性特征的群体,有助于更精准地识别和理解不同充电站的运营特点。
68、促进充电站分层分级管理:本发明通过构建充电站画像模型,将n个充电场站分成具有k个特征的群体。一方面,运营商可以根据画像数据制定群体针对性运营策略,提升场站运营效率。另一方面,可以根据画像数据引导充电场站以群体形式有序参与电网调度,减少高峰时段给电网带来的冲击。
69、促进电动汽车充电网络发展:通过优化充电站的运营效率和参与电网调度的能力,本发明有助于推动电动汽车充电网络的健康发展,促进电动汽车的普及和应用。