事件发生概率预测方法及装置与流程

文档序号:11921046阅读:531来源:国知局
事件发生概率预测方法及装置与流程

本发明涉及数据处理技术领域,尤其涉及一种事件发生概率预测方法及装置。



背景技术:

在很多业务场景中,经常需要预测业务中各类事件的发生概率,以便根据预测的发生概率对相关业务进行相应的调整或者操作。例如:在第三方支付业务平台,预测用户的账号被盗事件的发生概率;或者,在融资业务平台,预测用户对所贷金额还款事件的发生概率;或者,在保险业务平台,预测用户理赔事件的发生概率等等。

目前,根据业务场景应用单一的预测模型预测业务中各类事件的发生概率,比如,在保险业务平台,应用逻辑回归预测模型对相关事件的发生概率进行预测,在融资业务平台,应用决策树预测模型对相关事件的发生概率进行预测。

然而,根据历史数据记录的业务事件的真实发生概率,分析之前的预测数据,获知目前预测方式的准确性不能达到预设的标准,降低了根据预测结果处理相关业务的有效性。



技术实现要素:

本发明旨在至少在一定程度上解决相关技术中的技术问题之一。

为此,本发明的第一个目的在于提出一种事件发生概率预测方法,提高了预测结果的准确度,进而提高了根据预测结果处理相关业务的有效性和可靠性。

本发明的第二个目的在于提出一种事件发生概率预测装置。

为了实现上述目的,本发明第一方面实施例的事件发生概率预测方法,包括:根据预设模型组中每种预测模型对预测事件的预测指标类型需求,获取与所述预测指标类型需求对应的预测指标;应用每种预测模型处理对应的预测指标,获取与每种预测模型对应的输出概率;应用预先训练的与所述模型组对应的拟合模型,处理与每种预测模型对应的输出概率,预测所述事件的发生概率。

本发明实施例的事件发生概率预测方法,首先根据预设模型组中每种预测模型对预测事件的预测指标类型需求,获取与所述预测指标类型需求对应的预测指标;然后应用每种预测模型处理对应的预测指标,获取与每种预测模型对应的输出概率;进而应用预先训练的与所述模型组对应的拟合模型,处理与每种预测模型对应的输出概率,预测所述事件的 发生概率。由此,提高了预测结果的准确度,进而提高了根据预测结果处理相关业务的有效性和可靠性。

为了实现上述目的,本发明第二方面实施例的事件发生概率预测装置,包括:第一获取模块,用于根据预设模型组中每种预测模型对预测事件的预测指标类型需求,获取与所述预测指标类型需求对应的预测指标;第二获取模块,用于应用每种预测模型处理对应的预测指标,获取与每种预测模型对应的输出概率;处理模块,用于应用预先训练的与所述模型组对应的拟合模型,处理与每种预测模型对应的输出概率,预测所述事件的发生概率。

本发明实施例的事件发生概率预测装置,通过第一获取模块根据预设模型组中每种预测模型对预测事件的预测指标类型需求,获取与所述预测指标类型需求对应的预测指标;通过第二获取模块应用每种预测模型处理对应的预测指标,获取与每种预测模型对应的输出概率;通过处理模块应用预先训练的与所述模型组对应的拟合模型,处理与每种预测模型对应的输出概率,预测所述事件的发生概率。由此,提高了预测结果的准确度,进而提高了根据预测结果处理相关业务的有效性和可靠性。

本发明附加的方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本发明的实践了解到。

附图说明

本发明上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中,

图1是本发明一个实施例的事件发生概率预测方法的流程图;

图2是拟合系数训练过程的流程图;

图3是拟合系数训练过程的示意图;

图4是本发明一个实施例的事件发生概率预测装置的结构框图;

图5是本发明另一个实施例的事件发生概率预测装置的结构框图。

具体实施方式

下面详细描述本发明的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,仅用于解释本发明,而不能理解为对本发明的限制。相反,本发明的实施例包括落入所附加权利要求书的精神和内涵范围内的所有变化、修改和等同物。

在本发明的描述中,需要理解的是,术语“第一”、“第二”等仅用于描述目的,而不能理解为指示或暗示相对重要性。在本发明的描述中,需要说明的是,除非另有明确的规定和 限定,术语“相连”、“连接”应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或一体地连接;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连。对于本领域的普通技术人员而言,可以具体情况理解上述术语在本发明中的具体含义。此外,在本发明的描述中,除非另有说明,“多个”的含义是两个或两个以上。

流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为,表示包括一个或更多个用于实现特定逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分,并且本发明的优选实施方式的范围包括另外的实现,其中可以不按所示出或讨论的顺序,包括根据所涉及的功能按基本同时的方式或按相反的顺序,来执行功能,这应被本发明的实施例所属技术领域的技术人员所理解。

以下结合附图描述根据本发明实施例的事件发生概率预测方法及装置。

图1是本发明一个实施例的事件发生概率预测方法的流程图。

如图1所示,该事件发生概率预测方法包括:

步骤101,根据预设模型组中每种预测模型对预测事件的预测指标类型需求,获取与所述预测指标类型需求对应的预测指标。

具体地,本发明实施例提供的事件发生概率预测方法被配置在事件发生概率预测装置中,其中,事件发生概率预测装置可以集成部署在不同业务场景的业务平台中,以便预测业务中各类事件的发生概率;或者,事件发生概率预测装置可以单独部署,与各个业务平台之间通过预设的接口进行数据交互,对业务平台中传输的待预测业务的预测指标进行处理后,将预测结果通过接口发送给对应的业务平台。

事件发生概率预测装置中预先设置有模型组,其中,模型组中包括至少两种预测模型,预测模型的种类很多,可以根据实际应用需要进行选择,本实施例对此不作限制,例如可以包括:逻辑回归模型、C5.0决策树模型、神经网络模型、prob回归模型以及CART回归树模型。

由于业务场景多样,相关的各种业务事件内容也不同,因此,预测不同事件的发生概率所需要的预测指标类型内容不同。并且,针对同一件事件进行预测时,不同预测模型所需要的输入预测指标类型以及具体的算法也不同。因此,当对具体业务事件的发生概率进行预测时,根据业务需要衍生出概率事件有关系的预测指标,并提取出包含历史指标样本集和目标变量(一般情况下,如果事件发生了目标变量为1,没有发生0)的历史样本。需要说明的是,预测指标的获取方式很多,根据具体的应用场景而定,例如:可以是预先存储在事件发生概率预测装置中的,也可以是通过与相关业务数据库之间的接口从业务数据库中实时获取的。

为了更加清楚的说明预测指标的获取过程,以模型组中包括:逻辑回归模型和决策树 模型两种预测模型,针对支付宝平台,预测用户的支付宝账号被盗事件的发生概率为例,具体说明如下:

应用逻辑回归模型进行预测时,需要使用包含预测变量的历史样本(记为历史指标样本集A1)预测用户的支付宝账号被盗事件的发生概率pred_1,记模型为mode1;应用决策树模型进行预测时,需要根据历史指标样本集A1拟合得到支付宝账号被盗事件的发生概率pred_2,记模型为model2;假设决策树模型和逻辑回归模的输入指标总计有30个,因此,根据决策树模型和逻辑回归模对预测事件的预测指标类型需求,从数据库中获取与30种输入指标对应的预测指标。其中,预测指标类型包括很多,比如:用户账号、当前余额、支付详单、开户时间、不良记录、信用评级、授信额度等等。

步骤102,应用每种预测模型处理对应的预测指标,获取与每种预测模型对应的输出概率。

具体地,获取与每种预测模型的指标需求对应的预测指标后,应用每种预测模型处理对应的预测指标,获取与每种预测模型对应的输出概率。不同的预测模型应用不同的算法处理对应的预测指标,从而获取与每种预测模型对应的输出概率。

步骤103,应用预先训练的与所述模型组对应的拟合模型,处理与每种预测模型对应的输出概率,预测所述事件的发生概率。

具体地,事件发生概率预测装置中设置有预先训练好的与所述模型组对应的拟合模型,其中,拟合模型是通过逻辑运算符对拟合预测指标类型和拟合系数组合生成,其中的拟合预测指标类型就是模型组中每个预测模型的输出概率,拟合系数是预先根据目标函数对训练样本集训练确定的,其中,所述拟合系数,包括:与所述模型组中每种预测模型对应的系数,和/或;与所述拟合模型对应的常系数。

需要注意的是,通过逻辑运算符对拟合预测指标类型和拟合系数组合方式很多,可以根据应用需要进行设置,本实施例对此不作限制。

获取与每种预测模型对应的输出概率之后,应用预先训练的与模型组对应的拟合模型,处理与每种预测模型对应的输出概率,预测所述事件的发生概率。

为了更加清楚的说明对事件发生概率的预测过程,继续以步骤101的例子举例说明:模型组中包括:逻辑回归模型model1和决策树模型model2两种预测模型,利用model1和model2的预测结果和logit回归算法拟合得到的最终模型model3为:

Pred=1/(1+exp(-Z)),其中,Z=a1*pred_1+a2*pred_2+a0;

其中,pred_1为与逻辑回归模型model1对应的输出概率;pred_2为与决策树模型model2对应的输出概率;a1、a2和a0为拟合系数。

应用model3预测所述事件的发生概率:即利用model1和进入模型的预测指标获得输出 概率pred_1;利用model2和进入模型的预测指标获得输出概率pred_2;将pred_1和pred_2带入model3的公式中即得到所述事件的发生概率。

本实施例的事件发生概率预测方法,首先根据模型组中每种预测模型对预测事件的指标需求,获取与所述指标需求对应的预测指标;然后应用每种预测模型处理对应的预测指标,获取与每种预测模型对应的输出概率;进而应用预先训练的与所述模型组对应的拟合模型,处理与每种预测模型对应的输出概率,预测所述事件的发生概率。由此,提高了预测结果的准确度,进而提高了根据预测结果处理相关业务的有效性和可靠性。

基于上述实施例,针对图1所示的步骤103之前,需要对拟合模型中的拟合系数进行训练,下面通过图2和图3说明拟合系数的训练过程,具体如下:

图2是拟合系数训练过程的流程图,图3是拟合系数训练过程的示意图,

如图2和图3所示,拟合系数的具体的训练过程可以包括以下步骤:

步骤201,获取用来训练所述模型组的历史指标样本集,以及与所述预测事件对应的历史发生概率样本集。

步骤202,根据所述历史指标样本集获取与所述模型组中每种预测模型对应的历史输出概率样本集。

步骤203,将所述历史输出概率样本集作为所述拟合模型的输入,以及将所述历史发生概率样本集作为所述拟合模型的输出,确定所述拟合模型中的拟合系数。

具体地,事件发生概率预测装置与训练样本集数据库之间设置接口,其中,训练样本集数据库可以是业务数据库,或者,存储业务记录的第三方平台。通过接口与训练样本集数据库之间建立连接,从训练样本集数据库获取用来训练模型组的历史指标样本集A1,以及与预测事件对应的历史发生概率样本集,根据历史指标样本集A1获取与所述模型组中每种预测模型对应的历史输出概率样本集A2,将历史输出概率样本集A2作为与模型组对应的拟合模型的输入,以及将历史发生概率样本集作为拟合模型的输出,训练历史输出概率样本集A2和历史发生概率样本集保持一致,从而确定拟合模型中的拟合系数。

参见图3,以及继续参见步骤103中的例子,根据历史指标样本集A1及模型组中多个预测模型获取与每种预测模型对应的历史输出概率样本集A2,利用logit回归算法Pred=1/(1+exp(-Z)),其中,Z=a1*pred_1+a2*pred_2+a0,使用历史输出概率样本集A2即pred_1,…pred_n作为拟合模型输入的预测变量,使用历史发生概率样本集作为拟合模型的输出,确定拟合系数a1、a2和a0,从而得到最终的拟合模型。

本实施例的事件发生概率预测方法,通过获取用来训练所述模型组的历史指标样本集,以及与所述预测事件对应的历史发生概率样本集,根据所述历史指标样本集获取与所述模型组中每种预测模型对应的历史输出概率样本集,将所述历史输出概率样本集作为所述拟 合模型的输入,以及将所述历史发生概率样本集作为所述拟合模型的输出,确定所述拟合模型中的拟合系数。由此,提高了预测结果的准确度,进而提高了根据预测结果处理相关业务的有效性和可靠性。

为了实现上述实施例,本发明的实施例还提供一种事件发生概率预测装置。

图4是根据本发明一个实施例的事件发生概率预测装置的结构框图。

如图4所示,该事件发生概率预测装置包括:

第一获取模块11,用于根据预设模型组中每种预测模型对预测事件的预测指标类型需求,获取与所述预测指标类型需求对应的预测指标;

第二获取模块12,用于应用每种预测模型处理对应的预测指标,获取与每种预测模型对应的输出概率;

处理模块13,用于应用预先训练的与所述模型组对应的拟合模型,处理与每种预测模型对应的输出概率,预测所述事件的发生概率。

其中,所述模型组包括以下至少两种预测模型:

逻辑回归模型、决策树模型、神经网络模型、prob回归模型、以及CART回归树模型。

在一个实施例中,若所述模型组包括:逻辑回归模型model 1和决策树模型model2两种预测模型,

所述处理模块13具体用于:应用预先通过逻辑回归算法训练获取的拟合模型model3处理与每种预测模型对应的输出概率,预测所述事件的发生概率,其中,所述model3为:

Pred=1/(1+exp(-Z)),其中,Z=a1*pred_1+a2*pred_2+a0;

其中,pred_1为与逻辑回归模型model 1对应的输出概率;pred_2为与决策树模型model2对应的输出概率;Pred为所述事件的发生概率;a1、a2和a0为拟合系数。

其中,在一个实施例中,所述第一获取模块11,具体用于:

从与所述预测事件对应的业务数据库中获取与所述预测指标类型需求对应的预测指标。

需要说明的是,前述对事件发生概率预测方法实施例的解释说明也适用于该实施例的事件发生概率预测装置,此处不再赘述。

本发明实施例的事件发生概率预测装置,首先根据预设模型组中每种预测模型对预测事件的预测指标类型需求,获取与所述预测指标类型需求对应的预测指标;然后应用每种预测模型处理对应的预测指标,获取与每种预测模型对应的输出概率;进而应用预先训练的与所述模型组对应的拟合模型,处理与每种预测模型对应的输出概率,预测所述事件的发生概率。由此,提高了预测结果的准确度,进而提高了根据预测结果处理相关业务的有效性和可靠性。

图5是本发明另一个实施例的事件发生概率预测装置的结构框图。

如图5所示,基于图4实施例,还包括:

第三获取模块14,用于获取用来训练所述模型组的历史指标样本集,以及与所述预测事件对应的历史发生概率样本集。

第二获取模块12,还用于根据所述历史指标样本集获取与所述模型组中每种预测模型对应的历史输出概率样本集

训练模块15,用于将所述历史输出概率样本集作为所述拟合模型的输入,以及将所述历史发生概率样本集作为所述拟合模型的输出,确定所述拟合模型中的拟合系数。

其中,所述拟合系数,包括:

与所述模型组中每种预测模型对应的系数,和/或;

与所述拟合模型对应的常系数。

需要说明的是,前述对事件发生概率预测方法实施例的解释说明也适用于该实施例的事件发生概率预测装置,此处不再赘述。

本发明实施例的事件发生概率预测装置,通过获取用来训练所述模型组的历史指标样本集,以及与所述预测事件对应的历史发生概率样本集,根据所述历史指标样本集获取与所述模型组中每种预测模型对应的历史输出概率样本集,将所述历史输出概率样本集作为所述拟合模型的输入,以及将所述历史发生概率样本集作为所述拟合模型的输出,确定所述拟合模型中的拟合系数。由此,提高了预测结果的准确度,进而提高了根据预测结果处理相关业务的有效性和可靠性。

应当理解,本发明的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中,多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。例如,如果用硬件来实现,和在另一实施方式中一样,可用本领域公知的下列技术中的任一项或他们的组合来实现:具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可编程门阵列(PGA),现场可编程门阵列(FPGA)等。

在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。

尽管已经示出和描述了本发明的实施例,本领域的普通技术人员可以理解:在不脱离 本发明的原理和宗旨的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由权利要求及其等同物限定。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1