一种电费回收风险预测方法、装置、电子设备及存储介质与流程

文档序号:21274547发布日期:2020-06-26 23:10阅读:190来源:国知局
一种电费回收风险预测方法、装置、电子设备及存储介质与流程

本申请属于人工智能技术领域,具体涉及一种电费回收风险预测方法、装置、电子设备及存储介质。



背景技术:

电费回收一直是供电企业的老大难问题,因为目前采取的运营手段是先输电送电,再缴费,所以往往存在收费周期耗时耗力以及回收不了等各种隐患。电费回收的结果与供电企业经营成果息息相关,一直以来,电费回收都是电力营销的重点内容。供电企业拥有十分庞大的客户数量,但是每个用户的资信程度存在着很大的差别,用户的资信程度严重影响着其电费的缴纳状况。

目前供电企业针对以上问题也提出了各种行政管理方法和技术手段,也有相应的回收策略。目前的催收手段主要是人工催收,采取电话提醒、上门贴单、当面收费等人工策略。同时,随着信息技术的快速发展,国内供电企业也开始尝试使用通过对用电用户的海量数据进行挖掘分析,剥离出其中的相关特征,对用户建立起用户画像以及分级系统,试图做到风险预警,以此来判断该用户是否存在拖欠电费的可能性。如,运用逻辑回归模型,基于高压用户用电关键因素对电费回收的影响程度进行建模;利用决策树算法建立客户欠费的风险识别模型;基于理论分析改进lr-bagging算法来预测用户用电欠费风险。

采用人工上前催收的手段不仅浪费了大量的时间和金钱,还因为人为等不可控因素,存在安全隐患,管理者也难以做到监控管理,催收回报率较低,不能做到提前预防、风险预警。现存的预测模型也存在弊端,因为决策树、逻辑回归等模型属于有监督模型,需要对训练数据进行打标签,标签的质量影响着预测准确率,一旦数据打标签过程存在误差,整个模型效果也会大大降低,损害模型性能;同时因为电力数据形成较为复杂,电力用户有不同的种类、电价执行标准以及缴费方式,因此导致数据维度较大且非线性,常用的机器学习算法较难拟合这种非线性关系。



技术实现要素:

鉴于此,本申请实施例在于提供一种电费回收风险预测方法、装置、电子设备及存储介质,以改善现有预测模型受标签影响大,导致抗噪声能力弱的问题。

本申请的实施例是这样实现的:

第一方面,本申请实施例提供了一种电费回收风险预测方法,包括:获取待预测用户在预设时间段内的连续缴费记录数据;基于所述连续缴费记录数据,得到在时间上连续的多条原始数据,每条原始数据包括多种不同维度下的与缴费相关的数据;基于所述多条原始数据,获得不同维度下的多种特征参数数据;基于事先训练好的抗噪神经网络模型和所述多种特征参数数据,确定所述待预测用户的电费回收风险,其中,所述抗噪神经网络模型的损失函数为基于两个离散型随机变量的联合分布矩阵的行列式的互信息熵dmi。本申请实施例中,采用基于两个离散型随机变量的联合分布矩阵的行列式的互信息熵dmi作为抗噪神经网络模型的损失函数,并以此来预测待预测用户的电费回收风险,由于dmi是两个取值范围相同的随机离散变量的联合分布矩阵行列式(det)的绝对值。因此dmi具有以下性质:dmi是非负的,对称并且满足信息单调性,同时满足相对不变性,使其对噪声数据具备更好的抗干扰性,可以不再受电力数据标注过程中的误差干扰,从而提高了预测的准确率。

结合第一方面实施例的一种可能的实施方式,所述损失函数为:ldmi(qh(x),y′)=-log(dmi(h(x),y′))=-log(|det(qh(x),y′)|),其中,qh(x),y′是离散型随机变量h(x)和离散型随机变量y′的联合分布,qh(x),y′是c×c的矩阵形式,h(x)的随机性来自于h和随机变量x。

结合第一方面实施例的一种可能的实施方式,在获得不同维度下的多种特征参数数据之后,所述方法还包括:对所述多种特征参数数据中的每种特征参数数据各自做特征归一化处理;相应地,基于事先训练好的抗噪神经网络模型和所述多种特征参数数据,确定所述待预测用户的电费回收风险,包括:基于事先训练好的抗噪神经网络模型和归一化处理后的多种特征参数数据,确定所述待预测用户的电费回收风险。本申请实施例中,通过对多种特征参数数据中的每种特征参数数据各自做特征归一化处理,然后再基于归一化处理后的多种特征参数数据来预测待预测用户的电费回收风险,以减少该多种特征参数数据中不同维度下的特征参数数据因为数值大小不一而带来的预测误差。

结合第一方面实施例的一种可能的实施方式,获取待预测用户在预设时间段内的连续缴费记录数据,包括:获取所述待预测用户在两年内的连续缴费记录数据;相应地,基于所述连续缴费记录数据,得到在时间上连续的多条原始数据,包括:基于所述连续缴费记录数据,以两个月为间隔,得到在时间上连续的十二条原始数据,每条原始数据包括:用户编号,开户日期,应收违约金,应收电费,用电电量,缴费日期,缴费方式;相应地,基于所述多条原始数据,获得不同维度下的多种特征参数数据,包括:基于所述多条原始数据,获得用户编号,开户年限,缴费行为综合评分,预计缴费时间段,用电电量波动情况,最近一次电量环比,缴费方式更改次数,欠费次数,5日之前付款次数,20日之前付款次数,25日之前付款次数,周期内缴纳总电费,周期内总电量,周期内总违约金,周期内平均电费,周期内平均电量,缴费总记录次数。本申请实施例中,通过获取待预测用户在两年内的连续缴费记录数据,并以两个月为间隔,得到在时间上连续的包括用户编号,开户日期,应收违约金,应收电费,用电电量,缴费日期,缴费方式在内的十二条原始数据,并以此获得不同维度下的多种特征参数数据,使其涵盖多种不同维度的特征参数数据,以保证预测结果的准确性和可靠性。

结合第一方面实施例的一种可能的实施方式,在基于事先训练好的抗噪神经网络模型和所述多种特征参数数据,确定所述待预测用户的电费回收风险之前,所述方法还包括:获取带有标注的训练样本数据,所述训练样本数据包括多个用电用户各自的特征参数数据;利用所述样本数据对初始抗噪神经网络模型进行训练,得到训练好的抗噪神经网络模型,其中,所述初始抗噪神经网络模型的损失函数为基于两个离散型随机变量的联合分布矩阵的行列式的互信息熵dmi。本申请实施例中,通过事先对用于预测用户电费回收风险的模型进行训练,使其后续可以很方便用于预测用户电费回收风险,同时,在训练时,采用基于两个离散型随机变量的联合分布矩阵的行列式的互信息熵dmi作为抗噪神经网络模型的损失函数,并以此来预测待预测用户的电费回收风险,由于dmi是两个取值范围相同的随机离散变量的联合分布矩阵行列式(det)的绝对值。因此dmi具有以下性质:dmi是非负的,对称并且满足信息单调性,同时满足相对不变性,使其对噪声数据具备更好的抗干扰性,可以不再受电力数据标注过程中的误差干扰,从而提高了预测的准确率。

结合第一方面实施例的一种可能的实施方式,通过以下步骤获取用电用户的特征参数数据:获取该用电用户在预设时间段内的连续缴费记录数据;基于所述连续缴费记录数据,得到在时间上连续的多条原始数据,每条原始数据包括多种不同维度下的与缴费相关的数据;基于所述多条原始数据,获得该用电用户在不同维度下的多种特征参数数据和用于表征该用电用户是否为欠费用户的标签。本申请实施例中,在获取用电用户的特征参数数据时,通过获取该用户在两年内的连续缴费记录数据,并以两个月为间隔,得到在时间上连续的包括用户编号,开户日期,应收违约金,应收电费,用电电量,缴费日期,缴费方式在内的十二条原始数据,并以此获得不同维度下的多种特征参数数据以及用于表征该用电用户是否为欠费用户的标签,使其涵盖多种不同维度的特征参数数据,以保证训练所获得的模型在预测时的准确性和可靠性。

第二方面,本申请实施例还提供了一种电费回收风险预测装置,包括:获取模块、第一获得模块、第二获得模块以及确定模块;获取模块,用于获取待预测用户在预设时间段内的连续缴费记录数据;第一获得模块,用于基于所述连续缴费记录数据,得到在时间上连续多条的原始数据,每条原始数据包括多种不同维度下的与缴费相关的数据;第二获得模块,用于基于所述多条原始数据,获得不同维度下的多种特征参数数据;确定模块,用于基于事先训练好的抗噪神经网络模型和所述多种特征参数数据,确定所述待预测用户的电费回收风险,其中,所述抗噪神经网络模型的损失函数为基于两个离散型随机变量的联合分布矩阵的行列式的互信息熵dmi。

结合第二方面实施例的一种可能的实施方式,所述损失函数为:ldmi(qh(x),y′)=-log(dmi(h(x),y′))=-log(|det(qh(x),y′)|),其中,qh(x),y′是离散型随机变量h(x)和离散型随机变量y′的联合分布,qh(x),y′是c×c的矩阵形式,h(x)的随机性来自于h和随机变量x。

第三方面,本申请实施例还提供了一种电子设备,包括:存储器和处理器,所述处理器与所述存储器连接;所述存储器,用于存储程序;所述处理器,用于调用存储于所述存储器中的程序,以执行上述第一方面实施例和/或结合第一方面实施例的任一种可能的实施方式提供的方法。

第四方面,本申请实施例还提供了一种存储介质,其上存储有计算机程序,所述计算机程序被处理器运行时,执行上述第一方面实施例和/或结合第一方面实施例的任一种可能的实施方式提供的方法。

本申请的其他特征和优点将在随后的说明书阐述,并且,部分地从说明书中变得显而易见,或者通过实施本申请实施例而了解。本申请的目的和其他优点可通过在所写的说明书以及附图中所特别指出的结构来实现和获得。

附图说明

为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。通过附图所示,本申请的上述及其它目的、特征和优势将更加清晰。在全部附图中相同的附图标记指示相同的部分。并未刻意按实际尺寸等比例缩放绘制附图,重点在于示出本申请的主旨。

图1示出了本申请实施例提供的一种电费回收风险预测方法的流程示意图。

图2示出了本申请实施例提供的一种电费回收风险预测装置的模块框图。

图3示出了本申请实施例提供的一种电子设备的结构示意图。

具体实施方式

下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行描述。

应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。同时,在本申请的描述中诸如“第一”、“第二”等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

再者,本申请中术语“和/或”,仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,a和/或b,可以表示:单独存在a,同时存在a和b,单独存在b这三种情况。

鉴于现有的风险预测模型受标签影响大,标签的质量影响着预测准确率,一旦数据打标过程存在误差,整个模型效果也会大大降低,使得抗噪声能力弱的问题。本申请实施例提供了一种抗噪神经网络模型,使其对噪声数据具备更好的抗干扰性,可以不再受电力数据标注过程中的误差干扰,从而提高了预测的准确率。

接下来,对本申请提供的抗噪神经网络模型的训练过程进行说明,训练时,首先获取带有标注的训练样本数据,其中,训练样本数据包括多个用电用户各自的特征参数数据;然后利用获取到的样本数据对初始抗噪神经网络模型进行训练,即可得到训练好的抗噪神经网络模型,其中,该初始抗噪神经网络模型的损失函数为基于两个离散型随机变量的联合分布矩阵的行列式的互信息熵(differencemutualinformation,dmi)。可选地,该损失函数为:

ldmi(qh(x),y′)=-log(dmi(h(x),y′))=-log(|det(qh(x),y′)|),其中,qh(x),y′是离散型随机变量h(x)和离散型随机变量y′的联合分布,qh(x),y′是c×c的矩阵形式,h(x)的随机性来自于h和随机变量x。

其中,获取一个用电用户的特征参数数据的过程可以是:获取该用电用户在预设时间段内的连续缴费记录数据,例如,获取该用电用户在两年内的连续缴费记录数据(可以理解的是,该预设时间段也可以是除两年外的其他数值,例如,一年、半年、一年半等数值);然后基于所述连续缴费记录数据,得到多条在时间上连续的原始数据,每条原始数据包括多种不同维度下的与缴费相关的数据,例如,在获取到用电用户在两年内的连续缴费记录数据后,基于该连续缴费记录数据,以两个月为间隔,得到在时间上连续的十二条原始数据,每条原始数据包括:用户编号,开户日期,应收违约金,应收电费,用电电量,缴费日期,缴费方式等多种不同维度下的与缴费相关的数据;最后,基于所述多条原始数据,获得该用电用户在不同维度下的多种特征参数数据和用于表征该用电用户是否为欠费用户的标签,例如,在得到上述的十二条原始数据后,获得该用电用户在不同维度下的多种特征参数数据,例如,获得用户编号,开户年限,缴费行为综合评分,预计缴费时间段,用电电量波动情况,最近一次电量环比,缴费方式更改次数,欠费次数,5日之前付款次数,20日之前付款次数,25日之前付款次数,周期内缴纳总电费,周期内总电量,周期内总违约金,周期内平均电费,周期内平均电量,缴费总记录次数;以及以最后一条原始数据的缴费情况作为该用电用户是否为欠费用户的标签的打标依据,若违约金额大于0则为欠费用户,label(标签)为1,违约金额小于0则为正常用户,label(标签)为0。

当然可以理解的是,该标签也可以反过来,如违约金额大于0则为欠费用户,label(标签)为0,违约金额小于0则为正常用户,label(标签)为1。此外,作为打标依据的数据也可以不以最后一条原始数据的缴费情况作为依据,也可以是以其他条原始数据的缴费情况作为依据。另外,作为一种实施方式,还可以是以多条原始数据的缴费情况作为依据,如以其中的连续三条原始数据的缴费情况作为依据,当然也可以是十二条原始数据的缴费情况作为依据,如其中超过六条的原始数据的违约金额大于0则为欠费用户,label(标签)为1,违约金额小于0则为正常用户,label(标签)为0。

其中,在获取到每个用电用户在不同维度下的多种特征参数数据之后,考虑到该多种特征参数数据(例如,用户编号,开户年限,缴费行为综合评分,预计缴费时间段,用电电量波动情况,最近一次电量环比,缴费方式更改次数,欠费次数,5日之前付款次数,20日之前付款次数,25日之前付款次数,周期内缴纳总电费,周期内总电量,周期内总违约金,周期内平均电费,周期内平均电量,缴费总记录次数)代表着不同意义,数值大小不一,因此,本申请还可以对该多种特征参数数据中的每种特征参数数据各自做特征归一化处理,例如,利用scikit-learn提供的standardscaler、minmaxscaler、quantiletransformer等方法做特征归一化处理;相应地,在训练时,基于归一化处理后的多种特征参数数据对初始抗噪神经网络模型进行训练。

其中,在训练时,将获得的包括多个用电用户各自的特征参数数据的带有标注的训练样本数据按一定比例,例如利用scikit-learn提供的train_test_split方法按照5:1的比例分为训练集和测试集,然后再将训练集按一定比例,例如按照5:1的比例分为训练集和验证集。利用pytorch框架初始化神经网络的结构,输入输出以及隐含层的节点数,网络优化器定位adam,迭代次数定为1000次,其中,网络优化算法除了采用adam方式外,还可以采用sgd、momentum、nesterov、adadelta等方式替代。将训练集作为初始抗噪神经网络模型的输入,每完成一次迭代,利用验证集得到网络准确率以及正召回率和负召回率,作为模型调参的参考标准。继续迭代,直到迭代次数达到预先设置值,如1000次。最后利用pytorch将模型保存,加载测试集,进行算法预测,得到预测结果、准确率以及正召回率和负召回率。其中,需要说明的是,具体的训练过程已经为本领域技术人员所熟知,此处不再赘述。

其中,本申请实施例所采用的初始化神经网络结构可以是bp神经网络结构,该算法可以直接把纠错的运算量,逐步降低到只和神经元的数量成正比。同时bp神经网络是模拟人脑神经组织发展起来的计算系统,具有大量处理单元,通过广泛互联而构成的网络体系,它具有生物上类脑的基本特征,能够大规模并行、分布式处理、自学习等优点。加之本申请中所涉及的电力数据具有维度较多、复杂程度较高且非线性的特点,而bp神经网络具备较强的非线性映射能力,同时泛化能力和容错能力也强于以往的机器学习算法。

对于所采用的损失函数,定义:

其中w1,w2为两个离散的随机变量,是w1,w2联合分布的矩阵表示,所以dmi就是两个取值范围相同的随机离散变量的联合分布矩阵行列式(det)的绝对值。因此dmi具有以下性质:dmi是非负的,对称并且满足信息单调性,同时满足相对不变性,当w3与w2关于w1条件独立时有:

结合公式(1)、(2)以及性质定理可得:

dmi的这种代数结构使得能够在噪声信道(t)固定的情况下,分别衡量分类器输出w2与信道输入w1、信道输出w3的dmi。

鉴于此,本申请基于dmi,提出了全新的易于优化的损失函数ldmi:

ldmi(qh(x),y′)=-log(dmi(h(x),y′))=-log(|det(qh(x),y′)|)(4)

其中,qh(x),y′是离散型随机变量h(x)和离散型随机变量y′的联合分布,qh(x),y′是c×c的矩阵形式,h(x)的随机性来自于h和随机变量x。推理和实验结果证明了ldmi的合理性,以及对噪声的对抗性、鲁棒性,可以充分表明将ldmi作为损失函数时,对带噪声标签的数据集和不带噪声标签的数据集上训练出的分类预测器的效果相同,对噪声数据具备更好的抗干扰性,对于应用到电费回收预测上有着显著的优势,可以不再受电力数据标注过程中的误差干扰。

利用上述的方法训练出抗噪神经网络模型后,便可以以此来预测待预测用户的电费回收风险,以解决电费回收难的问题。下面将结合图1,对本申请实施例提供的电费回收风险预测方法进行说明。

步骤s101:获取待预测用户在预设时间段内的连续缴费记录数据。

当需要预测某个用电用户的电费回收风险时,获取该待预测用户在预设时间段内的连续缴费记录数据,例如,获取该待预测用户在两年内的连续缴费记录数据。当然可以理解的是,该预设时间段也可以是除两年外的其他数值,例如,一年、半年、一年半等数值。

步骤s102:基于所述连续缴费记录数据,得到在时间上连续的多条原始数据,每条原始数据包括多种不同维度下的与缴费相关的数据。

在获取到待预测用户在预设时间段内的连续缴费记录数据后,基于该连续缴费记录数据,得到在时间上连续的多条原始数据,其中,每条原始数据包括多种不同维度下的与缴费相关的数据,例如,以两个月为间隔,基于在两年内的连续缴费记录数据,可以得到在时间上连续的十二条原始数据,每条原始数据包括:用户编号,开户日期,应收违约金,应收电费,用电电量,缴费日期,缴费方式。

步骤s103:基于所述多条原始数据,获得不同维度下的多种特征参数数据。

在得到在时间上连续的多条原始数据后,基于这些原始数据,根据统计学范畴,在此基础上,可以得到新的特征,从而获得不同维度下的多种特征参数数据。例如,基于在时间上连续的十二条原始数据,获得用户编号,开户年限,缴费行为综合评分,预计缴费时间段,用电电量波动情况,最近一次电量环比,缴费方式更改次数,欠费次数,5日之前付款次数,20日之前付款次数,25日之前付款次数,周期内缴纳总电费,周期内总电量,周期内总违约金,周期内平均电费,周期内平均电量,缴费总记录次数。

步骤s104:基于事先训练好的抗噪神经网络模型和所述多种特征参数数据,确定所述待预测用户的电费回收风险。

基于该待预测用户在预设时间段内的连续缴费记录数据,获得不同维度下的多种特征参数数据后,基于事先训练好的抗噪神经网络模型和所述多种特征参数数据,确定所述待预测用户的电费回收风险。其中,所述抗噪神经网络模型的损失函数为基于两个离散型随机变量的联合分布矩阵的行列式的互信息熵dmi。其中,损失函数为:

ldmi(qh(x),y′)=-log(dmi(h(x),y′))=-log(|det(qh(x),y′)|),其中,qh(x),y′是离散型随机变量h(x)和离散型随机变量y′的联合分布,qh(x),y′是c×c的矩阵形式,h(x)的随机性来自于h和随机变量x。

其中,考虑到该多种特征参数数据代表着不同意义,数值大小不一,因此,作为一种实施方式,本申请还可以对该多种特征参数数据中的每种特征参数数据各自做特征归一化处理,例如,利用scikit-learn提供的standardscaler、minmaxscaler、quantiletransformer等方法做特征归一化处理;相应地,在进行电费回收风险预测时,基于事先训练好的抗噪神经网络模型和归一化处理后的多种特征参数数据,确定所述待预测用户的电费回收风险。

其中,在进行电费回收风险预测时,所采用的预测模型为采用上述的训练方法事先训练好的抗噪神经网络模型,也即,在训练时,获取带有标注的训练样本数据,所述训练样本数据包括多个用电用户各自的特征参数数据;利用所述样本数据对初始抗噪神经网络模型进行训练,得到训练好的抗噪神经网络模型,其中,所述初始抗噪神经网络模型的损失函数为基于两个离散型随机变量的联合分布矩阵的行列式的互信息熵dmi。

由于本申请实施例在预测待预测用户的电费回收风险时,采用了抗噪神经网络模型,由于采用基于两个离散型随机变量的联合分布矩阵的行列式的互信息熵dmi作为损失函数,由于dmi是两个取值范围相同的随机离散变量的联合分布矩阵行列式(det)的绝对值。因此dmi具有以下性质:dmi是非负的,对称并且满足信息单调性,同时满足相对不变性,使其对噪声数据具备更好的抗干扰性,可以不再受电力数据标注过程中的误差干扰,从而提高了预测的准确率。

本申请实施例还提供了一种电费回收风险预测装置100,如图2所示。该电费回收风险预测装置100包括:获取模块110、第一获得模块120、第二获得模块130以及确定模块140。

获取模块110,用于获取待预测用户在预设时间段内的连续缴费记录数据。可选地,获取模块110,用于获取所述待预测用户在两年内的连续缴费记录数据。

第一获得模块120,用于基于所述连续缴费记录数据,得到在时间上连续多条的原始数据,每条原始数据包括多种不同维度下的与缴费相关的数据。可选地,第一获得模块120,用于基于所述连续缴费记录数据,以两个月为间隔,得到在时间上连续的十二条原始数据,每条原始数据包括:用户编号,开户日期,应收违约金,应收电费,用电电量,缴费日期,缴费方式。

第二获得模块130,用于基于所述多条原始数据,获得不同维度下的多种特征参数数据。可选地,第二获得模块130,用于基于所述多条原始数据,获得用户编号,开户年限,缴费行为综合评分,预计缴费时间段,用电电量波动情况,最近一次电量环比,缴费方式更改次数,欠费次数,5日之前付款次数,20日之前付款次数,25日之前付款次数,周期内缴纳总电费,周期内总电量,周期内总违约金,周期内平均电费,周期内平均电量,缴费总记录次数。

确定模块140,用于基于事先训练好的抗噪神经网络模型和所述多种特征参数数据,确定所述待预测用户的电费回收风险,其中,所述抗噪神经网络模型的损失函数为基于两个离散型随机变量的联合分布矩阵的行列式的互信息熵dmi。其中,所述损失函数为:

ldmi(qh(x),y′)=-log(dmi(h(x),y′))=-log(|det(qh(x),y′)|),其中,qh(x),y′是离散型随机变量h(x)和离散型随机变量y′的联合分布,qh(x),y′是c×c的矩阵形式,h(x)的随机性来自于h和随机变量x。

可选地,该电费回收风险预测装置100还包括:归一化模块。该归一化模块,用于在第二获得模块130基于所述多条原始数据,获得不同维度下的多种特征参数数据之后,对所述多种特征参数数据中的每种特征参数数据各自做特征归一化处理。相应地,确定模块140,用于基于事先训练好的抗噪神经网络模型和归一化处理后的多种特征参数数据,确定所述待预测用户的电费回收风险。

可选地,该电费回收风险预测装置100还包括:训练模块。相应地,该获取模块110,还用于获取带有标注的训练样本数据,所述训练样本数据包括多个用电用户各自的特征参数数据。其中,通过以下步骤获取用电用户的特征参数数据:获取该用电用户在预设时间段内的连续缴费记录数据;基于所述连续缴费记录数据,得到在时间上连续的多条原始数据,每条原始数据包括多种不同维度下的与缴费相关的数据;基于所述多条原始数据,获得该用电用户在不同维度下的多种特征参数数据和用于表征该用电用户是否为欠费用户的标签。

训练模块,用于获取带有标注的训练样本数据,所述训练样本数据包括多个用电用户各自的特征参数数据。

本申请实施例所提供的电费回收风险预测装置100,其实现原理及产生的技术效果和前述方法实施例相同,为简要描述,装置实施例部分未提及之处,可参考前述方法实施例中相应内容。

如图3所示,图3示出了本申请实施例提供的一种电子设备200的结构框图。所述电子设备200包括:收发器210、通存储器220、通讯总线230以及处理器240。

所述收发器210、所述通存储器220、处理器240各元件相互之间直接或间接地电性连接,以实现数据的传输或交互。例如,这些元件相互之间可通过一条或多条通讯总线230或信号线实现电性连接。其中,收发器210用于收发数据。通存储器220用于存储计算机程序,如存储有图2中所示的软件功能模块,即电费回收风险预测装置100。其中,电费回收风险预测装置100包括至少一个可以软件或固件(firmware)的形式存储于所述通存储器220中或固化在所述电子设备200的操作系统(operatingsystem,os)中的软件功能模块。所述处理器240,用于执行通存储器220中存储的可执行模块,例如添电费回收风险预测装置100包括的软件功能模块或计算机程序。例如,处理器240执行图2所示的电费回收风险预测装置100时,处理器240用于获取待预测用户在预设时间段内的连续缴费记录数据;基于所述连续缴费记录数据,得到在时间上连续的多条原始数据,每条原始数据包括多种不同维度下的与缴费相关的数据;基于所述多条原始数据,获得不同维度下的多种特征参数数据;基于事先训练好的抗噪神经网络模型和所述多种特征参数数据,确定所述待预测用户的电费回收风险,其中,所述抗噪神经网络模型的损失函数为基于两个离散型随机变量的联合分布矩阵的行列式的互信息熵dmi。

其中,通存储器220可以是,但不限于,随机存取存储器(randomaccessmemory,ram),只读存储器(readonlymemory,rom),可编程只读存储器(programmableread-onlymemory,prom),可擦除只读存储器(erasableprogrammableread-onlymemory,eprom),电可擦除只读存储器(electricerasableprogrammableread-onlymemory,eeprom)等。

处理器240可能是一种集成电路芯片,具有信号的处理能力。上述的处理器可以是通用处理器,包括中央处理器(centralprocessingunit,cpu)、网络处理器(networkprocessor,np)等;还可以是数字信号处理器(digitalsignalprocessor,dsp)、专用集成电路(applicationspecificintegratedcircuit,asic)、现场可编程门阵列(fieldprogrammablegatearray,fpga)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本申请实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器240也可以是任何常规的处理器等。

其中,上述的电子设备200,包括但不限于计算机、个人电脑等。

本申请实施例还提供了一种非易失性计算机可读取存储介质(以下简称存储介质),该存储介质上存储有计算机程序,该计算机程序被计算机如上述的电子设备200运行时,执行上述所示的电费回收风险预测方法。

需要说明的是,本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。

在本申请所提供的几个实施例中,应该理解到,所揭露的装置和方法,也可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,附图中的流程图和框图显示了根据本申请的多个实施例的装置、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分,所述模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现方式中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。

另外,在本申请各个实施例中的各功能模块可以集成在一起形成一个独立的部分,也可以是各个模块单独存在,也可以两个或两个以上模块集成形成一个独立的部分。

所述功能如果以软件功能模块的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,笔记本电脑,服务器,或者电子设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:u盘、移动硬盘、只读存储器(read-onlymemory,rom)、随机存取存储器(randomaccessmemory,ram)、磁碟或者光盘等各种可以存储程序代码的介质。

以上所述,仅为本申请的具体实施方式,但本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应所述以权利要求的保护范围为准。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1