本发明涉及充电站,特别涉及一种充电站的数据处理方法及装置、存储介质及电子设备。
背景技术:
1、随着电动汽车保有量的增加,作为配套基础设施的充电站数量也在不断增加,而充电负荷的预测则是充电站规划、调度的基础。目前对充电站的负荷预测时,通常使用依靠大量历史数据的负荷预测方法。
2、传统的负荷预测方法以大量的历史数据作为支撑,而历史数据的规模和质量会直接影响预测结果的精度。目前对充电站负荷进行预测时,所使用的历史数据的规模很大,存在许多与充电站的特征差异大、不具有参考意义的数据,导致对充电站负荷预测所需的时间长、且预测结果的精度低。
技术实现思路
1、有鉴于此,本发明实施例提供一种充电站的数据处理方法及装置、存储介质及电子设备,应用本发明,可以对充电站的历史样本数据进行筛选,从而得到精度高、体量小的数据,使用该数据对充电站的负荷进行预测,可以缩短预测所需的时间,以及提高预测结果的精度。
2、为实现上述目的,本发明实施例提供如下技术方案:
3、一种充电站的数据处理方法,包括:
4、构建充电站的知识图谱;
5、基于所述知识图谱获取所述充电站的特征数据;
6、获取所述充电站的各个历史样本数据;
7、应用所述特征数据,对各个所述历史样本数据进行筛选,得到目标样本数据;其中,所述对各个所述历史样本数据进行筛选,是指基于各个所述历史样本数据与所述特征数据之间的相关度信息,选择或剔除至少一个历史样本数据。
8、上述的方法,可选的,所述构建充电站的知识图谱,包括:
9、获取所述充电站的半结构化数据以及应用层数据;
10、从所述半结构化数据中抽取负荷影响因素数据;
11、应用所述负荷影响因素数据和所述应用层数据构建知识图谱。
12、上述的方法,可选的,所述应用所述特征数据,对各个所述历史样本数据进行筛选,得到目标样本数据,包括:
13、基于所述特征数据,获取每个所述历史样本数据的第一筛选标志位;
14、将满足预设的第一筛选条件的第一筛选标志位所属的历史样本数据确定为初筛样本数据;
15、基于各个所述初筛样本数据确定所述目标样本数据。
16、上述的方法,可选的,所述基于各个所述初筛样本数据确定所述目标样本数据,包括:
17、获取与所述特征数据相关的影响因子;
18、基于所述特征数据和所述影响因子,获取每个所述初筛样本数据的第二筛选标志位;
19、将满足预设的第二筛选条件的第二筛选标志位所属的初筛样本数据确定为目标样本数据。
20、上述的方法,可选的,所述基于所述特征数据,获取每个所述历史样本数据的第一筛选标志位,包括:
21、获取每个所述历史样本数据与所述特征数据之间的筛选系数;
22、基于预设的筛选阀值和每个所述历史样本数据的筛选系数,确定每个所述历史样本数据的第一筛选标志位。
23、上述的方法,可选的,所述基于所述特征数据和所述影响因子,获取每个所述初筛样本数据的第二筛选标志位,包括:
24、基于所述特征数据和所述影响因子,获取每个所述初筛样本数据的特征相似度系数;
25、基于预设的特征相似度系数阀值和每个所述初筛样本数据的特征相似度系数,确定每个所述初筛样本数据的第二筛选标志位。
26、上述的方法,可选的,所述基于所述特征数据和所述影响因子,获取每个所述初筛样本数据的特征相似度系数,包括:
27、基于所述特征数据和所述影响因子,确定每个所述初筛样本数据在每个特征维度的相似度系数;
28、对于每个所述初筛样本数据,将所述初筛样本数据的各个相似度系数进行求和处理,得到所述初筛样本数据的特征相似度系数。
29、上述的方法,可选的,所述基于所述特征数据和所述影响因子,确定每个所述初筛样本数据在每个特征维度的相似度系数,包括:
30、确定每个所述初筛样本数据在每个特征维度的参数集合,所述参数集合包括所述初筛样本数据中与所述特征维度对应的第一特征值、所述特征数据中与所述特征维度对应的第二特征值以及所述影响因子中与所述特征维度对应的因子值;
31、对于每个所述初筛样本数据,将所述初筛样本数据的每个所述参数集合中的第一特征值、第二特征值以及因子值进行运算,得到每个所述参数集合所对应的特征维度的相似度系数。
32、上述的方法,可选的,还包括:
33、应用所述目标样本数据对预设的预测模型进行训练,并将训练完成的预测模型作为充电站负荷预测模型;
34、将所述充电站的运行数据输入所述充电站负荷预测模型中,得到所述充电站的负荷预测结果。
35、一种充电站的样本数据筛选装置,包括:
36、构建单元,用于构建充电站的知识图谱;
37、第一获取单元,用于基于所述知识图谱获取所述充电站的特征数据;
38、第二获取单元,用于获取所述充电站的各个历史样本数据;
39、筛选单元,用于应用所述特征数据,对各个所述历史样本数据进行筛选,得到目标样本数据;其中,所述对各个所述历史样本数据进行筛选,是指基于各个所述历史样本数据与所述特征数据之间的相关度信息,选择或剔除至少一个历史样本数据。
40、上述的装置,可选的,所述构建单元执行构建充电站的知识图谱的过程,包括:
41、获取所述充电站的半结构化数据以及应用层数据;
42、从所述半结构化数据中抽取负荷影响因素数据;
43、应用所述负荷影响因素数据和所述应用层数据构建知识图谱。
44、上述的装置,可选的,所述筛选单元执行应用所述特征数据,对各个所述历史样本数据进行筛选,得到目标样本数据的过程,包括:
45、基于所述特征数据,获取每个所述历史样本数据的第一筛选标志位;
46、将满足预设的第一筛选条件的第一筛选标志位所属的历史样本数据确定为初筛样本数据;
47、基于各个所述初筛样本数据确定所述目标样本数据。
48、上述的装置,可选的,所述筛选单元执行基于各个所述初筛样本数据确定所述目标样本数据的过程,包括:
49、获取与所述特征数据相关的影响因子;
50、基于所述特征数据和所述影响因子,获取每个所述初筛样本数据的第二筛选标志位;
51、将满足预设的第二筛选条件的第二筛选标志位所属的初筛样本数据确定为目标样本数据。
52、上述的装置,可选的,所述筛选单元执行基于所述特征数据,获取每个所述历史样本数据的第一筛选标志位的过程,包括:
53、获取每个所述历史样本数据与所述特征数据之间的筛选系数;
54、基于预设的筛选阀值和每个所述历史样本数据的筛选系数,确定每个所述历史样本数据的第一筛选标志位。
55、上述的装置,可选的,所述筛选单元执行基于所述特征数据和所述影响因子,获取每个所述初筛样本数据的第二筛选标志位的过程,包括:
56、基于所述特征数据和所述影响因子,获取每个所述初筛样本数据的特征相似度系数;
57、基于预设的特征相似度系数阀值和每个所述初筛样本数据的特征相似度系数,确定每个所述初筛样本数据的第二筛选标志位。
58、上述的装置,可选的,所述筛选单元执行基于所述特征数据和所述影响因子,获取每个所述初筛样本数据的特征相似度系数的过程,包括:
59、基于所述特征数据和所述影响因子,确定每个所述初筛样本数据在每个特征维度的相似度系数;
60、对于每个所述初筛样本数据,将所述初筛样本数据的各个相似度系数进行求和处理,得到所述初筛样本数据的特征相似度系数。
61、上述的装置,可选的,所述筛选单元执行基于所述特征数据和所述影响因子,确定每个所述初筛样本数据在每个特征维度的相似度系数的过程,包括:
62、确定每个所述初筛样本数据在每个特征维度的参数集合,所述参数集合包括所述初筛样本数据中与所述特征维度对应的第一特征值、所述特征数据中与所述特征维度对应的第二特征值以及所述影响因子中与所述特征维度对应的因子值;
63、对于每个所述初筛样本数据,将所述初筛样本数据的每个所述参数集合中的第一特征值、第二特征值以及因子值进行运算,得到每个所述参数集合所对应的特征维度的相似度系数。
64、上述的装置,可选的,还包括:
65、训练单元,用于应用所述目标样本数据对预设的预测模型进行训练,并将训练完成的预测模型作为充电站负荷预测模型;
66、输入单元,用于将所述充电站的运行数据输入所述充电站负荷预测模型中,得到所述充电站的负荷预测结果。
67、与现有技术相比,本发明具有以下优点:
68、本发明提供一种充电站的数据处理方法及装置、存储介质及电子设备,该方法包括:构建充电站的知识图谱;基于知识图谱获取充电站的特征数据;获取充电站的各个历史样本数据;应用特征数据,对各个历史样本数据进行筛选,得到目标样本数据。通过构建的知识图谱提取出充电站的特征数据,然后基于特征数据对历史样本数据进行筛选,将与充电站的特征差异大且无效的历史样本数据筛出,保留与充电站的特征相似度高的历史样本数据,由此,可以有效缩小预测充电站时所使用的数据的体量,并且提高所应用的数据的精度,缩短预测所需时间和提高预测的精度。