本发明涉及能源复合利用技术领域,特别涉及一种数据处理方法及系统。
背景技术:
由于以互联网+智慧能源为代表的新型能源技术新颖、复杂,目标用户群体和对用户的商业模式都与传统的能源行业有着巨大的差别。目前各大企业在挖掘潜在能源用户时,基本都是通过市场人员去现场调研,记录用户数据信息,进而通过市场人员的经验判断用户的开发价值。但是,当市场人员经验不足时,会出现潜在用户寻找困难、用户需求难以定位等问题,而这些问题很可能导致在开发潜在能源用户时,对潜在用户特征的标签化和对商机的捕获准确度不高,无法为潜在能源用户的开发提供有利的辅助决策信息。
技术实现要素:
本发明旨在至少解决上述技术问题之一。
为此,本发明的一个目的在于提出一种数据处理方法,该方法能够精准有效地生成潜在能源用户的用户画像,强化对潜在用户特征的标签化和对商机的捕获准确度,为能源用户开发提供高价值的辅助决策信息。
本发明的另一个目的在于提出一种数据处理系统。
为了实现上述目的,本发明第一方面的实施例提出了一种数据处理方法,包括以下步骤:获取目标用户数据,其中,所述目标用户数据包含用户基础数据和用户行为数据;将所述行为数据与预设行为数据进行比较,根据比较结果确定具有潜在价值的目标用户数据;根据所述具有潜在价值的目标用户数据,制作数据标签;利用所述数据标签,对所述具有潜在价值的目标用户数据进行用户画像;根据所述用户画像,确定所述目标用户数据的开发价值。
根据本发明实施例的数据处理方法,能够精准有效地生成潜在能源用户的用户画像,强化对潜在用户特征的标签化和对商机的捕获准确度,为能源用户开发提供高价值的辅助决策信息。
另外,根据本发明上述实施例的数据处理方法还可以具有如下附加的技术特征:
在一些示例中,将所述行为数据与预设行为数据进行比较,根据比较结果确定具有潜在价值的目标用户数据,包括:将所述行为数据进行属性分类;根据所述分类的结果,获取不同属性分类对应的预设行为数据;在不同分类中的行为数据与所述预设行为数据进行比较,根据比较结果确定具有潜在价值的目标用户数据。
在一些示例中,根据所述具有潜在价值的目标用户数据,制作数据标签,包括:利用所述目标用户数据训练神经网络模型参数;根据所述神经网络模型参数构建用户数据分析模型;将所述具有潜在价值的目标用户数据导入所述用户数据分析模型,以得到所述用户数据分析模型对所述具有潜在价值的目标用户数据的分析结果;根据所述分析结果,制作数据标签。
在一些示例中,利用所述数据标签,对所述具有潜在价值的目标用户数据进行用户画像,包括:将所述具有潜在价值的目标用户数据设置为所述神经网络模型输入数据;通过所述神经网络模型,对输入数据进行预测分析;将所述预测分析的结果映射为所述神经网络模型的输出数据;将所述输出数据生成用户画像。
在一些示例中,根据所述用户画像,确定所述目标用户数据的开发价值,包括:获取所述目标用户数据的基础数据;利用聚类算法和所述基础数据,构建至少一个聚类堆的价值;确定所述用户画像对应的所述聚类堆的价值。
在一些示例中,还包括:分别对所述目标用户数据和具有潜在价值的目标用户数据设置权重值;根据所述权重值分别映射得到辅助决策信息;利用所述辅助决策信息对所述用户画像进行修正。
在一些示例中,所述目标用户数据为能源用户数据。
为了实现上述目的,本发明第二方面的实施例提出了一种数据处理系统,包括:获取模块,用于获取目标用户数据,其中,所述目标用户数据包含用户基础数据和用户行为数据;分析模块,用于将所述行为数据与预设行为数据进行比较,根据比较结果确定具有潜在价值的目标用户数据;标识模块,用于根据所述具有潜在价值的目标用户数据,制作数据标签;训练模块,利用所述数据标签,对所述具有潜在价值的目标用户数据进行用户画像;输出模块,用于根据所述用户画像,确定所述目标用户数据的开发价值。
根据本发明实施例的数据处理系统,能够精准有效地生成潜在能源用户的用户画像,强化对潜在用户特征的标签化和对商机的捕获准确度,为能源用户开发提供高价值的辅助决策信息。
另外,根据本发明上述实施例的数据处理系统还可以具有如下附加的技术特征:
在一些示例中,所述分析模块包括:分类子模块,用于将所述行为数据进行属性分类;获取子模块,用于根据所述分类的结果,获取不同属性分类对应的预设行为数据;运算子模块,用于在不同分类中的行为数据与所述预设行为数据进行比较,根据比较结果确定具有潜在价值的目标用户数据。
在一些示例中,所述标识模块包括:训练子模块,用于利用所述目标用户数据训练神经网络模型参数;构建子模块,用于根据所述神经网络模型参数构建用户数据分析模型;分析子模块,用于将所述具有潜在价值的目标用户数据导入所述用户数据分析模型,以得到所述用户数据分析模型对所述具有潜在价值的目标用户数据的分析结果;制作标签子模块,用于根据所述分析结果,制作数据标签。
在一些示例中,所述训练模块包括:设置子模块,用于将所述具有潜在价值的目标用户数据设置为所述神经网络模型输入数据;预测子模块,用于通过所述神经网络模型,对输入数据进行预测分析;映射子模块,用于将所述预测分析的结果映射为所述神经网络模型的输出数据;画像子模块,用于将所述输出数据生成用户画像。
本发明的附加方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本发明的实践了解到。
附图说明
本发明的上述和/或附加的方面和优点从结合下面附图对实施例的描述中将变得明显和容易理解,其中:
图1是根据本发明一个实施例的数据处理方法的流程图;
图2是根据本发明一个具体实施例的数据处理方法的详细流程示意图;
图3是根据本发明一个实施例的数据处理系统的结构框图;
图4是根据本发明一个实施例的分析模块的结构框图;
图5是根据本发明一个实施例的标识模块的结构框图;
图6是根据本发明一个实施例的训练模块的结构框图。
具体实施方式
下面详细描述本发明的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,仅用于解释本发明,而不能理解为对本发明的限制。
在本发明的描述中,需要理解的是,术语“中心”、“纵向”、“横向”、“上”、“下”、“前”、“后”、“左”、“右”、“竖直”、“水平”、“顶”、“底”、“内”、“外”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性。
在本发明的描述中,需要说明的是,除非另有明确的规定和限定,术语“安装”、“相连”、“连接”应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或一体地连接;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通。对于本领域的普通技术人员而言,可以具体情况理解上述术语在本发明中的具体含义。
以下结合附图描述根据本发明实施例的数据处理方法及系统。
图1是根据本发明一个实施例的数据处理方法的流程图。如图1所示,该方法包括以下步骤:
步骤S1:获取目标用户数据,其中,目标用户数据包含用户基础数据和用户行为数据。
其中,获取目标用户数据的方式可通过人工收集或数据库提取。例如,工作人员通过去现场走访来收集目标用户数据,或者通过在相关数据库中提取目标用户数据。
在本发明的实施例中,目标用户数据例如为能源用户数据,也即是说,目标用户为能源用户。进一步地,目标用户数据包含了用户基础数据和用户行为数据。用户基础数据例如包括基础数据用户所在地址、主要联系方式、所属行业等;用户行为数据例如包括用户的用电量、发电量、购电量、用电习惯等。
步骤S2:将行为数据与预设行为数据进行比较,根据比较结果确定具有潜在价值的目标用户数据。具体地说,例如判断行为数据与预设行为数据的比较结果是否满足预设范围,如果是,则判断该行为数据对应的目标用户数据为具有潜在价值的目标用户数据。
具体地,在步骤S2中,将行为数据与预设行为数据进行比较,根据比较结果确定具有潜在价值的目标用户数据包括:将行为数据进行属性分类;根据分类的结果,获取不同属性分类对应的预设行为数据;在不同分类中的行为数据与预设行为数据进行比较,根据比较结果确定具有潜在价值的目标用户数据。
也即是说,不同属性分类对应的预设行为数据可能不同,因此,在根据行为数据确定具有潜在价值的目标用户数据时,首先需要对当前的行为数据进行属性分类,进而根据该行为数据的属性分类获取对应的预设行为数据,然后两者进行比较,即判断该行为数据是否落在其对应的预设行为数据范围内,如果是,则判断该行为数据对应的目标用户数据为具有潜在价值的目标用户数据,否则,即判断为不具有潜在价值的目标用户数据。这样,根据行为数据的不同属性分类结果,在不同分类中的行为数据与其对应的预设行为数据进行比较,进而判断对应的目标用户数据是否为具有潜在价值的目标用户数据,从而可以提高判断结果的准确性和可靠性。例如,当行为数据为用户用电量时,则将用户在某一段时间内的用电量与设定的用电量阈值进行比较,如果用户在某一段时间内的用电量大于用电量阈值,则判断对应的目标用户数据为具有潜在价值的目标用户数据。
步骤S3:根据具有潜在价值的目标用户数据,制作数据标签。
具体地,根据具有潜在价值的目标用户数据,制作数据标签,包括:利用目标用户数据训练神经网络模型参数;根据神经网络模型参数构建用户数据分析模型;将具有潜在价值的目标用户数据导入用户数据分析模型,以得到用户数据分析模型对具有潜在价值的目标用户数据的分析结果;根据分析结果,制作数据标签。
结合图2所示,该用户数据分析模型例如为BP神经网络模型。具体地说,即根据上述获取到的目标用户数据(包括用户基础数据和用户行为数据)训练神经网络模型参数,进而可构建出一个如BP神经网络模型之类的用于用户数据分析的用户数据分析模型,然后将上述得到的具有潜在价值的目标用户数据导入该BP神经网络模型,以便BP神经网络模型对该具有潜在价值的目标用户数据进行分析和处理,进而生成数据标签。其中,数据标签例如包括对具有潜在价值的目标用户数据(如能源用户数据)的属性等的详细分类结果,便于查看。例如,包括对用户所在地址、联系方式、所属行业、用户用电量、用电习惯、购电量等数据信息的详细分类结果。
步骤S4:利用数据标签,对具有潜在价值的目标用户数据进行用户画像。
具体地,利用数据标签,对具有潜在价值的目标用户数据进行用户画像包括:将具有潜在价值的目标用户数据设置为神经网络模型输入数据;通过神经网络模型,对输入数据进行预测分析;将预测分析的结果映射为神经网络模型的输出数据;将输出数据生成用户画像。换言之,即将上述得到的数据标签输入BP神经网络模型,以便通过BP神经网络模型进行预测分析,并根据BP神经网络模型的输出结果生产相应的用户画像,以便根据用户画像实现对该能源用户开发价值的评价。例如,将包含用户历史用电量、用电习惯及购电量信息等数据的数据标签输入BP神经网络模型,BP神经网络模型据此对该能源用户在未来某段时间的用电量、购电量等数据进行预测分析,进而生成相应的用户画像。
步骤S5:根据用户画像,确定目标用户数据的开发价值。
具体地,根据用户画像,确定目标用户数据的开发价值包括:获取目标用户数据的基础数据;利用聚类算法和基础数据,构建至少一个聚类堆的价值;确定用户画像对应的聚类堆的价值。换言之,即获取上述目标用户数据(如能源用户数据)的基础数据,诸如用户的住址、联系方式、所属行业等,对这些数据进行聚类分析,得到一个或多个聚类堆的价值;然后将上述得到的用户画像与得到的一个或多个聚类堆进行匹配,进而根据匹配到的对应聚类堆的价值确定用户画像的价值,即实现对对应能源用户数据的开发价值的评价,进而根据评价结果判断该能源用户的开发价值,如是否有合作意向,是否值得合作等,进而确定是否拓展能源用户。
进一步地,在本发明的一个实施例中,该方法还包括:分别对目标用户数据和具有潜在价值的目标用户数据设置权重值;根据权重值分别映射得到辅助决策信息;利用辅助决策信息对用户画像进行修正。具体地说,结合图2所示,即在得到用户画像后,在实际应用过程中,还需要不断对用户画像进行修正和更新,从而提高用户画像的精准度,进而提高对能源用户开发价值评价的精确性和可靠性。具体方法包括:分别对获取到的目标用户数据和经过比较确定的具有潜在价值的目标用户数据设置权重值;然后根据这些权重值,通过相应的权重函数分别映射得到辅助决策信息,诸如该能源用户是否具有合作意向、是否值得合作等评价信息,并利用这些辅助决策信息对得到的用户画像进行修正和更新,进一步提高用户画像的精确性。
综上,根据本发明实施例的数据处理方法,能够精准有效地生成潜在能源用户的用户画像,强化对潜在用户特征的标签化和对商机的捕获准确度,为能源用户开发提供高价值的辅助决策信息。
本发明的进一步实施例还提出了一种数据处理系统。
图3是根据本发明一个实施例的数据处理系统的结构框图。如图3所示,该数据处理系统100包括:获取模块110、分析模块120、标识模块130、训练模块140和输出模块150。
其中,获取模块110用于获取目标用户数据,其中,目标用户数据包含用户基础数据和用户行为数据。其中,获取目标用户数据的方式可通过人工收集或数据库提取;所述目标用户数据为能源用户数据。
在本发明的实施例中,目标用户数据例如为能源用户数据,也即是说,目标用户为能源用户。进一步地,目标用户数据包含了用户基础数据和用户行为数据。用户基础数据例如包括基础数据用户所在地址、主要联系方式、所属行业等;用户行为数据例如包括用户的用电量、发电量、购电量、用电习惯等。
分析模块120用于将行为数据与预设行为数据进行比较,根据比较结果确定具有潜在价值的目标用户数据。具体地说,例如判断行为数据与预设行为数据的比较结果是否满足预设范围,如果是,则判断该行为数据对应的目标用户数据为具有潜在价值的目标用户数据。
具体地,结合图4所示,分析模块120包括:分类子模块121、获取子模块122和运算子模块123。
其中,分类子模块121用于将行为数据进行属性分类;获取子模块122用于根据分类的结果,获取不同属性分类对应的预设行为数据;运算子模块123用于在不同分类中的行为数据与预设行为数据进行比较,根据比较结果确定具有潜在价值的目标用户数据。
也即是说,不同属性分类对应的预设行为数据可能不同,因此,在根据行为数据确定具有潜在价值的目标用户数据时,首先需要对当前的行为数据进行属性分类,进而根据该行为数据的属性分类获取对应的预设行为数据,然后两者进行比较,即判断该行为数据是否落在其对应的预设行为数据范围内,如果是,则判断该行为数据对应的目标用户数据为具有潜在价值的目标用户数据,否则,即判断为不具有潜在价值的目标用户数据。这样,根据行为数据的不同属性分类结果,在不同分类中的行为数据与其对应的预设行为数据进行比较,进而判断对应的目标用户数据是否为具有潜在价值的目标用户数据,从而可以提高判断结果的准确性和可靠性。例如,当行为数据为用户用电量时,则将用户在某一段时间内的用电量与设定的用电量阈值进行比较,如果用户在某一段时间内的用电量大于用电量阈值,则判断对应的目标用户数据为具有潜在价值的目标用户数据。
标识模块130用于根据具有潜在价值的目标用户数据,制作数据标签。
具体地,结合图5所示,标识模块130包括:训练子模块131、构建子模块132、分析子模块133和制作标签子模块134。
其中,训练子模块131用于利用目标用户数据训练神经网络模型参数;构建子模块132用于根据神经网络模型参数构建用户数据分析模型;分析子模块133用于将具有潜在价值的目标用户数据导入用户数据分析模型,以得到用户数据分析模型对具有潜在价值的目标用户数据的分析结果;制作标签子模块134用于根据分析结果,制作数据标签。
具体示例中,该用户数据分析模型例如为BP神经网络模型。具体地说,即根据上述获取到的目标用户数据(包括用户基础数据和用户行为数据)训练神经网络模型参数,进而可构建出一个如BP神经网络模型之类的用于用户数据分析的用户数据分析模型,然后将上述得到的具有潜在价值的目标用户数据导入该BP神经网络模型,以便BP神经网络模型对该具有潜在价值的目标用户数据进行分析和处理,进而生成数据标签。其中,数据标签例如包括对具有潜在价值的目标用户数据(如能源用户数据)的属性等的详细分类结果,便于查看。例如,包括对用户所在地址、联系方式、所属行业、用户用电量、用电习惯、购电量等数据信息的详细分类结果。
训练模块140利用数据标签,对具有潜在价值的目标用户数据进行用户画像。
具体地,结合图6所示,训练模块140包括设置子模块141、预测子模块142、映射子模块143和画像子模块。
其中,设置子模块141用于将具有潜在价值的目标用户数据设置为神经网络模型输入数据;预测子模块142用于通过神经网络模型,对输入数据进行预测分析;映射子模块143用于将预测分析的结果映射为神经网络模型的输出数据;画像子模块144用于将输出数据生成用户画像。换言之,即将上述得到的数据标签输入BP神经网络模型,以便通过BP神经网络模型进行预测分析,并根据BP神经网络模型的输出结果生产相应的用户画像,以便根据用户画像实现对该能源用户开发价值的评价。例如,将包含用户历史用电量、用电习惯及购电量信息等数据的数据标签输入BP神经网络模型,BP神经网络模型据此对该能源用户在未来某段时间的用电量、购电量等数据进行预测分析,进而生成相应的用户画像。
输出模块150用于根据用户画像,确定目标用户数据的开发价值。
具体地,输出模块150根据用户画像,确定目标用户数据的开发价值包括:获取目标用户数据的基础数据;利用聚类算法和基础数据,构建至少一个聚类堆的价值;确定用户画像对应的聚类堆的价值。换言之,即获取上述目标用户数据(如能源用户数据)的基础数据,诸如用户的住址、联系方式、所属行业等,对这些数据进行聚类分析,得到一个或多个聚类堆的价值;然后将上述得到的用户画像与得到的一个或多个聚类堆进行匹配,进而根据匹配到的对应聚类堆的价值确定用户画像的价值,即实现对对应能源用户数据的开发价值的评价,进而根据评价结果判断该能源用户的开发价值,如是否有合作意向,是否值得合作等,进而确定是否拓展能源用户。
进一步地,在本发明的一个实施例中,该系统100例如还包括修正模块。修正模块用于:分别对目标用户数据和具有潜在价值的目标用户数据设置权重值;根据权重值分别映射得到辅助决策信息;利用辅助决策信息对用户画像进行修正。具体地说,即在得到用户画像后,在实际应用过程中,还需要不断对用户画像进行修正和更新,从而提高用户画像的精准度,进而提高对能源用户开发价值评价的精确性和可靠性。具体方法包括:分别对获取到的目标用户数据和经过比较确定的具有潜在价值的目标用户数据设置权重值;然后根据这些权重值,通过相应的权重函数分别映射得到辅助决策信息,诸如该能源用户是否具有合作意向、是否值得合作等评价信息,并利用这些辅助决策信息对得到的用户画像进行修正和更新,进一步提高用户画像的精确性。
需要说明的是,本发明实施例的数据处理系统的具体实现方式与本发明实施例的数据处理方法的具体实现方式类似,具体请参见方法部分的描述,为了减少冗余,此处不再赘述。
根据本发明实施例的数据处理系统,能够精准有效地生成潜在能源用户的用户画像,强化对潜在用户特征的标签化和对商机的捕获准确度,为能源用户开发提供高价值的辅助决策信息。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。
尽管已经示出和描述了本发明的实施例,本领域的普通技术人员可以理解:在不脱离本发明的原理和宗旨的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由权利要求及其等同限定。