1.本公开涉及人工智能技术领域或金融领域,具体地,涉及一种信用评价方法、装置、设备、介质和程序产品。
背景技术:2.在进行客户信用评价时,对于非活跃客户,往往缺乏其客户特征,信用资质等风险计量数据。为了科学准确地评估非活跃客户的信用,往往需要利用大量数据源以构建客户画像,大大地提升了风险控制系统的数据处理量,不利于科学高效地对客户进行信用评分,也不利于保护客户隐私。
技术实现要素:3.鉴于上述问题,本公开的实施例提供了一种高效低数据量需求的信用评价方法、装置、设备、介质和程序产品τ
4.根据本公开的第一个方面,提供了一种信用评价方法,包括:获取第二客户消费数据;将所述第二客户消费数据输入第二客户信用评价模型;以及获取第二客户的信用评分,其中,所述第二客户信用评价模型基于核密度估计算法结合贝叶斯法则预构建得到,所述第二客户信用评价模型包含第一客户信用评价参数,所述第二客户与所述第一客户共同构成客户群,其中,所述第二客户为所述客户群中的非活跃客户,所述第一客户为所述客户群中的活跃客户。
5.根据本公开的实施例,第一客户信用评价参数包括第一客户信用历史数据和第一客户历史消费数据。
6.根据本公开的实施例,第二客户信用评价模型预构建获得,预构建所述第二客户信用评价模型包括:构建第二客户先验信息函数,其中,所述第二客户先验信息函数基于核密度估计算法,利用第一客户信用历史数据构建得到,其中,所述第一客户信用历史数据包括第一客户历史信用评分以及第一客户数量信息;构建第二客户条件信息调整函数以及第二客户全量信息调整函数,其中,所述第二客户条件信息调整函数和所述第二客户全量信息调整函数基于核密度估计算法,利用第一客户历史消费数据和第一客户信用历史数据构建获得;以及利用所述第二客户先验信息函数,所述第二客户条件信息调整函数以及第二客户全量信息调整函数,基于贝叶斯法则构建得到所述第二客户信用评价模型。
7.根据本公开的实施例,构建第二客户先验信息函数包括:基于所述核密度估计算法,利用所述第一客户历史信用评分以及第一客户数量信息构建第一客户评分分布密度函数;以及以所述第一客户评分分布密度函数作为所述第二客户先验信息函数。
8.根据本公开的实施例,在构建第二客户先验信息函数后,所述方法还包括:基于所述第二客户先验信息函数获取第二客户信用初评分数。
9.根据本公开的实施例,所述第二客户先验信息函数符合正态分布,所述第二客户信用初评分数基于所述正态分布的所取概率最大值处获取。
10.根据本公开的实施例,所述构建第二客户条件信息调整函数包括:获取第一客户历史消费数据以及第一客户信用历史数据;以及构建各第一客户历史信用评分段的第二客户条件信息调整函数,其中,构建第i个第一客户历史信用评分段的第二客户条件信息调整函数的方法包括:利用第i个第一客户历史信用评分段的第一客户评分信息、第一客户历史消费数据以及第一客户数量信息,基于核密度估计算法构建第i个第一客户历史信用评分段的第二客户消费分布密度函数;以及以所述第二客户消费分布密度函数为所述第二客户条件信息调整函数,其中,所述第一客户历史信用评分段基于所述第一客户历史信用评分划分。
11.根据本公开的实施例,所述构建第二客户全量信息调整函数包括:获取第一客户历史消费数据以及第一客户信用历史数据;以及利用所述第一客户评分信息、第一客户历史消费数据以及第一客户数量信息,基于核密度估计算法构建全量第二客户消费分布密度函数,以所述第二客户消费分布密度函数为所述第二客户条件信息调整函数,其中,所述全量第二客户消费分布密度函数为全分数段第二客户消费分布密度函数。
12.根据本公开的实施例,所述第二客户条件信息调整函数或第二客户全量信息调整函数符合正态分布。
13.根据本公开的实施例,所述利用所述第二客户先验信息函数,所述第二客户条件信息调整函数以及第二客户全量信息调整函数,基于贝叶斯法则构建得到所述第二客户信用评价模型包括:利用所述第二客户先验信息函数,所述第二客户条件信息调整函数以及第二客户全量信息调整函数,基于贝叶斯法则构建得到第二客户评分经验分布函数,其中,所述第二客户信用评价模型为以第二客户消费信息为自变量的函数;以及以所述第二客户评分经验分布函数为所述第二客户信用评价模型,所述第二客户信用评价模型用于获取第二客户信用调整评分。
14.根据本公开的实施例,所述第二客户信用评价模型符合正态分布,其中,以所述第二客户评分经验分布函数的极值点为所述第二客户的信用评分。
15.根据本公开的实施例,所述第二客户消费数据基于预设的时间间隔获取,所述第二客户的信用评分与获取第二客户消费数据的时间存在映射关系。
16.根据本公开的实施例,所述方法还包括:获取连续m个时间间隔的第二客户的信用评分;以及将所述连续m个时间间隔的第二客户的信用评分进行展示。
17.根据本公开的实施例,所述第二客户为长尾客户,所述第一客户为非长尾客户。
18.本公开的第二方面提供了一种信用评价装置,包括:获取模块,配置为获取第二客户消费数据;输入模块,配置为将所述第二客户消费数据输入第二客户信用评价模型,其中,所述第二客户信用评价模型基于核密度估计结合贝叶斯法则构建,所述第二客户信用评价模型包含第一客户信用评价参数,所述第二客户与所述第一客户共同构成客户群,其中,所述第二客户为所述客户群中的非活跃客户,所述第一客户为所述客户群中的活跃客户;以及处理模块,配置为获取第二客户的信用评分。
19.根据本公开的实施例,信用评价装置还可以包括展示模块。其中,展示模块被配置为将所述连续m个时间间隔的第二客户的信用评分进行展示。
20.本公开的第三方面提供了一种第二客户信用评价模型的构建装置,包括第一构建模块、第二构建模块和第三构建模块。其中,第一构建模块被配置为构建第二客户先验信息
函数,其中,所述第二客户先验信息函数基于核密度估计算法,利用第一客户信用历史数据构建得到,其中,所述第一客户信用历史数据包括第一客户历史信用评分以及第一客户数量信息。第二构建模块被配置为构建第二客户条件信息调整函数以及第二客户全量信息调整函数,其中,所述第二客户条件信息调整函数和所述第二客户全量信息调整函数基于核密度估计算法,利用第一客户历史消费数据和第一客户信用历史数据构建获得。第三构建模块被配置为利用所述第二客户先验信息函数,所述第二客户条件信息调整函数以及第二客户全量信息调整函数,基于贝叶斯法则构建得到所述第二客户信用评价模型。
21.根据本公开的实施例,第二客户信用评价模型的构建装置还包括初评分数获取模块。其中,初评分数获取模块被配置为基于所述第二客户先验信息函数获取第二客户信用初评分数。
22.根据本公开的实施例,第一构建模块包括第一构建单元和第一形成单元。其中,第一构建单元被配置为基于所述核密度估计算法,利用所述第一客户历史信用评分以及第一客户数量信息构建第一客户评分分布密度函数。第一形成单元被配置为以所述第一客户评分分布密度函数作为所述第二客户先验信息函数。
23.根据本公开的实施例,第二构建模块包括第一获取单元、第二构建单元和第二形成单元。其中,第一获取单元被配置为获取第一客户历史消费数据以及第一客户信用历史数据。第二构建单元被配置为构建各第一客户历史信用评分段的第二客户条件信息调整函数,其中,构建第i个第一客户历史信用评分段的第二客户条件信息调整函数的方法包括:利用第i个第一客户历史信用评分段的第一客户评分信息、第一客户历史消费数据以及第一客户数量信息,基于核密度估计算法构建第i个第一客户历史信用评分段的第二客户消费分布密度函数。其中,所述第一客户历史信用评分段基于所述第一客户历史信用评分划分。第二形成单元被配置为以所述第二客户消费分布密度函数为所述第二客户条件信息调整函数。
24.根据本公开的实施例,第二构建模块还包括第三形成单元。其中,第三形成单元被配置为利用所述第一客户评分信息、第一客户历史消费数据以及第一客户数量信息,基于核密度估计算法构建全量第二客户消费分布密度函数,以所述第二客户消费分布密度函数为所述第二客户条件信息调整函数,其中,所述全量第二客户消费分布密度函数为全分数段第二客户消费分布密度函数。
25.根据本公开的实施例,第三构建模块包括第三构建单元和第四形成单元。其中,第三构建单元被配置为利用所述第二客户先验信息函数,所述第二客户条件信息调整函数以及第二客户全量信息调整函数,基于贝叶斯法则构建得到第二客户评分经验分布函数,其中,所述第二客户信用评价模型为以第二客户消费信息为自变量的函数。第四形成单元被配置为以所述第二客户评分经验分布函数为所述第二客户信用评价模型,所述第二客户信用评价模型用于获取第二客户信用调整评分。
26.本公开的第四方面提供了一种电子设备,包括:一个或多个处理器;存储器,用于存储一个或多个程序,其中,当所述一个或多个程序被所述一个或多个处理器执行时,使得一个或多个处理器执行上述信用评价方法。
27.本公开的第四方面还提供了一种计算机可读存储介质,其上存储有可执行指令,该指令被处理器执行时使处理器执行上述信用评价方法。
28.本公开的第五方面还提供了一种计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现上述信用评价方法。
29.本公开的实施例提供的方法,基于核密度估计算法结合贝叶斯法则预构建得到客户信用评价模型,从而提升贝叶斯分析中先验分布判定的客观性。本公开的实施例提供的方法,可以基于已知的活跃客户的信用数据预测未知的非活跃用户的信用评分,并且仅需在模型中输入非活跃用户的消费数据即可获取非活跃用户的信用评分,大大减少了数据处理量,提升了评分系统的稳定性和有效性。
附图说明
30.通过以下参照附图对本公开实施例的描述,本公开的上述内容以及其他目的、特征和优点将更为清楚,在附图中:
31.图1示意性示出了根据本公开实施例的信用评价方法、装置、设备、介质和程序产品的应用场景图。
32.图2示意性示出了根据本公开实施例的信用评价方法的流程图。
33.图3示意性示出了根据本公开实施例的预构建所述第二客户信用评价模型的方法的流程图。
34.图4示意性示出了根据本公开一些实施例的构建第二客户先验信息函数的方法的流程图。
35.图5示意性示出了根据本公开实施例的构建第二客户条件信息调整函数的方法的流程图。
36.图6示意性示出了根据本公开实施例的构建第i个第一客户历史信用评分段的第二客户条件信息调整函数的方法的流程图。
37.图7示意性示出了根据本公开实施例的构建第二客户全量信息调整函数的方法的流程图。
38.图8示意性示出了根据本公开实施例的利用第二客户先验信息函数,第二客户条件信息调整函数以及第二客户全量信息调整函数,基于贝叶斯法则构建得到所述第二客户信用评价模型的方法的流程图。
39.图9示意性示出了根据本公开实施例的对第二客户的信用评分进行展示的方法的流程图。
40.图10示意性示出了根据本公开实施例的第二客户的信用评分的展示图。
41.图11a示意性示出了根据本公开实施例的信用评价装置的结构框图。
42.图11b示意性示出了根据本公开另一些实施例的信用评价装置的结构框图。
43.图12示意性示出了根据本公开实施例的第二客户信用评价模型的构建装置的结构框图。
44.图13示意性示出了根据本公开另一些实施例的第二客户信用评价模型的构建装置的结构框图。
45.图14示意性示出了根据本公开实施例的第一构建模块的结构框图。
46.图15示意性示出了根据本公开实施例的第二构建模块的结构框图。
47.图16示意性示出了根据本公开另一些实施例的第二构建模块的结构框图。
48.图17示意性示出了根据本公开实施例的第三构建模块的结构框图。
49.图18示意性示出了根据本公开实施例的适于实现信用评价方法的电子设备的方框图。
具体实施方式
50.以下,将参照附图来描述本公开的实施例。但是应该理解,这些描述只是示例性的,而并非要限制本公开的范围。在下面的详细描述中,为便于解释,阐述了许多具体的细节以提供对本公开实施例的全面理解。然而,明显地,一个或多个实施例在没有这些具体细节的情况下也可以被实施。此外,在以下说明中,省略了对公知结构和技术的描述,以避免不必要地混淆本公开的概念。
51.在此使用的术语仅仅是为了描述具体实施例,而并非意在限制本公开。在此使用的术语“包括”、“包含”等表明了所述特征、步骤、操作和/或部件的存在,但是并不排除存在或添加一个或多个其他特征、步骤、操作或部件。
52.在此使用的所有术语(包括技术和科学术语)具有本领域技术人员通常所理解的含义,除非另外定义。应注意,这里使用的术语应解释为具有与本说明书的上下文相一致的含义,而不应以理想化或过于刻板的方式来解释。
53.在使用类似于“a、b和c等中至少一个”这样的表述的情况下,一般来说应该按照本领域技术人员通常理解该表述的含义来予以解释(例如,“具有a、b和c中至少一个的系统”应包括但不限于单独具有a、单独具有b、单独具有c、具有a和b、具有a和c、具有b和c、和/或具有a、b、c的系统等)。
54.客户信用评价时风险控制的重要方面,在进行客户信用评价时,对于非活跃客户,往往缺乏其客户特征,信用资质等风险计量数据。为了科学准确地评估非活跃客户的信用需利用大量数据源以构建客户画像,大大地提升了风险控制系统的数据处理量,不利于科学高效地对客户进行信用评分,也不利于保护客户隐私。
55.例如,对于银行业,随着个人消费贷业务的快速发展,贷款额度、贷款期限等业务指标和客户群体特征较业务开办之初有了很大变化,长尾客户的比重显著增加。其中,长尾客户为在银行拥有完整的基本信息,但是其账户余额较低,动账频率较低的非活跃客户。作为银行的基础客户,长尾客户规模大,潜力大,若能对“长尾”客户群体细分,实现全员管户,全员营销,根据客户实际需求配置相对应的产品,提升客户的服务体验,将有助于提升长尾客户在银行的资产规模。为了有效促进长尾客户动账,对其进行信用评分以细化客户群体,实现针对性营销是一种有效的方法。然而,由于单个银行针对长尾客户的客户特征、信用资质等风险计量数据不足,而现行评分系统需要的数据量较大,对数据利用效率较低,不能高效地实现对长尾客户进行评分。并且由于数据源较广,也不利于客户隐私的保护,有降低客户体验的风险。
56.针对现有技术中存在的上述问题,本公开的实施例提供了一种信用评价方法,包括:获取第二客户消费数据;将所述第二客户消费数据输入第二客户信用评价模型;以及获取第二客户在所述的信用评分,其中,所述第二客户信用评价模型基于核密度估计算法结合贝叶斯法则预构建得到,所述第二客户信用评价模型包含第一客户信用评价参数,所述第二客户与所述第一客户共同构成客户群,其中,所述第二客户为所述客户群中的非活跃
客户,所述第一客户为所述客户群中的活跃客户。
57.本公开的实施例提供的方法,基于核密度估计算法结合贝叶斯法则预构建得到客户信用评价模型,通过在贝叶斯法则中引入核密度估计算法可以提升贝叶斯分析中先验分布判定的客观性。本公开的实施例提供的方法,可以基于已知的活跃客户的信用数据预测未知的非活跃用户的信用评分,并且在模型运行时,仅需以非活跃用户的消费数据作为输入数据源,大大减少了数据处理量,提升了评分系统的稳定性和有效性。
58.在本公开的技术方案中,所涉及的用户个人信息的收集、存储、使用、加工、传输、提供、公开和应用等处理,均符合相关法律法规的规定,采取了必要保密措施,且不违背公序良俗。
59.在本公开的技术方案中,在获取或采集用户个人信息之前,均获取了用户的授权或同意。
60.需要说明的是,本公开实施例提供的信用评价方法、装置、设备、介质和程序产品可用于人工智能技术在风险控制相关方面,也可用于除人工智能技术之外的多种领域,如金融领域等。本公开实施例提供的信用评价方法、装置、设备、介质和程序产品的应用领域不做限定。
61.以下将结合附图及其说明文字围绕实现本公开的至少一个目的的上述操作进行阐述。
62.图1示意性示出了根据本公开实施例的信用评价方法、装置、设备、介质和程序产品的应用场景图。
63.如图1所示,根据该实施例的应用场景100可以包括终端设备101、102、103。网络104用以在终端设备101、102、103和服务器105之间提供通信链路的介质。网络104可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。
64.用户可以使用终端设备101、102、103通过网络104与服务器105交互,以接收或发送消息等。例如,用户可以使用终端设备101、102、103通过网络104向服务器105发送第二客户消费数据,并接收第二客户的信用评分。终端设备101、102、103上可以安装有各种通讯客户端应用,例如购物类应用、网页浏览器应用、搜索类应用、即时通信工具、邮箱客户端、社交平台软件等(仅为示例)。
65.终端设备101、102、103可以是具有显示屏并且支持网页浏览的各种电子设备,包括但不限于智能手机、平板电脑、膝上型便携计算机和台式计算机等等。
66.服务器105可以是提供各种服务的服务器,例如对用户利用终端设备101、102、103所浏览的网站提供支持的后台管理服务器(仅为示例)。后台管理服务器可以对接收到的用户请求等数据进行分析等处理,并将处理结果(例如根据用户请求获取或生成的网页、信息、或数据等)反馈给终端设备。例如,第二客户信用评价模型可以存储于服务器105以进行第二客户信用评分的相关处理和计算,并将第二客户信用评分通过网络104反馈给终端用户101、102、103。
67.需要说明的是,本公开实施例所提供的信用评价方法一般可以由服务器105执行。相应地,本公开实施例所提供的信用评价装置一般可以设置于服务器105中。本公开实施例所提供的信用评价方法也可以由不同于服务器105且能够与终端设备101、102、103和/或服务器105通信的服务器或服务器集群执行。相应地,本公开实施例所提供的信用评价装置也
可以设置于不同于服务器105且能够与终端设备101、102、103和/或服务器105通信的服务器或服务器集群中。
68.应该理解,图1中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要,可以具有任意数目的终端设备、网络和服务器。
69.以下将基于图1描述的场景,通过图2~图10对公开实施例的信用评价方法进行详细描述。
70.图2示意性示出了根据本公开实施例的信用评价方法的流程图。
71.如图2所示,该实施例的信用评价方法包括操作s210~操作s230,该信用评价方法可以由处理器执行,也可以由包括处理器的任何电子设备执行。
72.在操作s210,获取第二客户消费数据。
73.根据本公开的实施例,第二客户消费数据可以为当前评分时段第二客户消费数据。在一个示例中,对于银行业的信用卡业务,第二客户消费数据可以为第二客户的动账数据。
74.在操作s220,将所述第二客户消费数据输入第二客户信用评价模型。
75.根据本公开的实施例,第二客户信用评价模型基于核密度估计算法结合贝叶斯法则预构建得到。其中,贝叶斯法则是第二客户信用评价模型的主体框架。贝叶斯法则又名贝叶斯估计,其是利用贝叶斯定理结合新证据,以及先验概率以得到新的概率。贝叶斯法则基于假设的先验概率,给定假设下观察到不同数据的概率以及观察到的数据本身。传统的贝叶斯估计通常需要加入主观的先验知识,难以拟合出符合真实分布的客观模型。有鉴于此,本公开的实施例基于核密度估计算法对贝叶斯法则进行调整。核密度估计算法是非参数检验方法之一,其是可以用来估计未知的密度函数。典型的核密度估计的处理方法可以如式(1)所示的核函数表示:
[0076][0077]
式(1)为得分为a的经验函数的基函数,在该函数中,以得分p为自变量,得分a为样本点得分。该核函数选择正态分布。为每一个样本点都生成一个均值为a,方差为2a+1的正态分布,其中a不为负数。核密度估计算法无需对加入任何先验知识,而可以根据数据本身的特点、性质来拟合分布,通过在贝叶斯法则的先验知识中加入核密度估计进行调整,可以获得比传统的贝叶斯法则参数估计更好的模型,以提升评估系统的稳健性。
[0078]
在本公开的实施例中,第二客户信用评价模型包含第一客户信用评价参数。在本公开的实施例中,第二客户与第一客户共同构成客户群,其中,第二客户为所述客户群中的非活跃客户,第一客户为所述客户群中的活跃客户。通过使用第一客户信用评价参数,可以利用第一客户的信用评价关联信息对第二客户的信用评分进行预测。其中,第一客户信用评价参数可以预先获得。由此,第二客户信用评价模型所处理的数据源可以仅为第二客户消费数据。由于活跃用户信息相对完善且通常可以以单一表数据的形式进行存储,数据库和系统的开发,存储和部署成本都较低,因此采用本公开的实施例的第二客户信用评价模型对非活跃客户进行信用评价估计时,能够显著地减少系统开发成本,提高数据处理效率并获得科学性和有效性均较高的信用评分。
[0079]
在操作s230,获取第二客户的信用评分。
[0080]
需指出,在本公开的实施例中,在获取用户的信息之前,例如,获取第二客户消费数据之前,可以获得用户的同意或授权。例如,在操作s210之前,可以向第二客户发出获取其消费数据的请求。在用户同意或授权可以获取其消费数据的情况下,执行所述操作s210。
[0081]
根据本公开的实施例,第二客户可以为长尾客户,第一客户可以为非长尾客户。其中,长尾客户为在银行拥有完整的基本信息,但是其账户余额较低,动账频率较低的客户。非长尾客户为在银行拥有完整的基本信息,且账户余额较高,动账频率较高的客户。对于非长尾客户,其可以有较为准确完整的风险计量数据。由此,通过利用非长尾客户数据信息实现对长尾客户的信用评价,可以在减少数据处理量的同时高效获取较为科学准确的评价结果。
[0082]
根据本公开的实施例,第一客户信用评价参数包括第一客户信用历史数据和第一客户历史消费数据。第一客户信用评价参数部署于第二客户信用评价模型中,数据需求简单,不易缺失,能够提升评价系统的稳健性。
[0083]
在本公开的实施例中,第二客户信用评价模型预构建获得。
[0084]
图3示意性示出了根据本公开实施例的预构建所述第二客户信用评价模型的方法的流程图。
[0085]
如图3所示,该实施例的预构建所述第二客户信用评价模型的方法包括操作s310~s330。
[0086]
在操作s310,构建第二客户先验信息函数。其中,所述第二客户先验信息函数基于核密度估计算法,利用第一客户信用历史数据构建得到,其中,所述第一客户信用历史数据包括第一客户历史信用评分以及第一客户数量信息。
[0087]
在一些实施例中,可以基于图4所示的方法构建第二客户先验信息函数。
[0088]
图4示意性示出了根据本公开一些实施例的构建第二客户先验信息函数的方法的流程图。
[0089]
如图4所示,该实施例的构建第二客户先验信息函数的方法包括操作s4l0~s420。
[0090]
在操作s410,基于所述核密度估计算法,利用所述第一客户历史信用评分以及第一客户数量信息构建第一客户评分分布密度函数。
[0091]
在操作s420,以所述第一客户评分分布密度函数作为所述第二客户先验信息函数。
[0092]
根据本公开的一些具体的实施例,可以基于式(1)的处理逻辑构建第二客户先验信息函数。
[0093]
具体的,第二客户先验信息函数可以如式(2)所示:
[0094][0095]
式(2)为以第一客户信用评分p为自变量的函数,其中,m为第一客户数量,p为m个第一客户的分数集合。在式(2)中带入式(1)的具体计算公式,则i为所述m个第一客户中的第i个第一客户的得分。由此构建的式(2)可以代表每一个分数p的概率分布函数。可以理
解,对于每一个样本点(即得分p),都生成一个均值为i,方差为2i+1的正态分布。这些正态分布的分布密度函数直接相加得到总函数,该总函数在实数域上的积分值为所有样本点的个数m。例如,假设有100个第一客户信用评分,则m=100。将总函数除以m,即可得到每一个分数p的概率分布函数。
[0096]
根据本公开的实施例,在构建第二客户先验信息函数后,还可以基于所述第二客户先验信息函数获取第二客户信用初评分数。
[0097]
在一些实施例中,第二客户先验信息函数符合正态分布,所述第二客户信用初评分数基于所述正态分布的所取概率最大值处获取。
[0098]
例如,在式(2)的示例中,若式(2)在p=p0时取得最大值,则可以判定第二客户信用初评分数为p0。
[0099]
本公开的具体的实施例中,通过核密度估计算法打点式刻画客户行为,降低人工干预成分。在正态分布的核函数中,可以在实数域范围内将每个分数点及其临近区域视作一个分数段,以类似客户样本点打点并对近邻的分数段区域产生影响的方式生成概率分布函数。由此可以提高信息提取效率,具备较强的稳健性。由于仅需要第一用户的信用历史数据,且该数据在机构数据库中通常可以单一表的形式存储且数据完整性较高。从而不需要从数据存储层面新建表,基于现有数据库和系统开发较为方便,嵌入式部署开发成本较低。
[0100]
进一步的,在获取第二客户信用初评分数p0后,可以以此为基础,对第二客户开展针对性营销,以促进客户活跃度。从而可以在后续的信用评价过程中持续监测第二客户的信用变动情况,对其信用评分进行调整。
[0101]
在一些实施例中,第二客户消费数据基于预设的时间间隔获取,所述第二客户的信用评分与获取第二客户消费数据的时间存在映射关系。由此,可以获取对应于每个第二客户消费数据获取时间的第二客户信用评分。
[0102]
在操作s320,构建第二客户条件信息调整函数以及第二客户全量信息调整函数,其中,所述第二客户条件信息调整函数和所述第二客户全量信息调整函数基于核密度估计算法,利用第一客户历史消费数据和第一客户信用历史数据构建获得。
[0103]
在操作s330,利用所述第二客户先验信息函数,所述第二客户条件信息调整函数以及第二客户全量信息调整函数,基于贝叶斯法则构建得到所述第二客户信用评价模型。
[0104]
本公开的实施例中,基于核密度估计算法分别构建第二客户条件信息调整函数和所述第二客户全量信息调整函数,并基于所构建的第二客户先验信息函数,所述第二客户条件信息调整函数以及第二客户全量信息调整函数,利用贝叶斯框架构建得到第二客户信用评价模型。
[0105]
典型的贝叶斯法则构建得到的第二客户信用评价模型可以如式(3)所示,
[0106][0107]
其中,i
(x,p)
为第二客户条件信息调整函数,i
1(x)
为第二客户全量信息调整函数。p(p)为第二客户先验信息函数。在本公开的实施例中,i
(x,p)
,i
1(x)
和p(p)均利用核密度估计算法构建。从而完成对传统的贝叶斯法则框架的修改,在分布不变的情况下将核密度打点式处理流程作为客户行为数据的输入流程,可在节省算力的同时实现准确高效的信用打分。
[0108]
可以理解,本公开的实施例的第二客户信用评价模型可以用于实现在营销后对第二客户的信用评分调整。具体的,可以在获取第二客户信用初评分数后,对第二客户进行针对性营销。为检验营销成果,针对性制定后续的营销政策,可以进一步利用第二客户信用评价模型对第二客户进行二次打分。
[0109]
图5示意性示出了根据本公开实施例的构建第二客户条件信息调整函数的方法的流程图。
[0110]
如图5所示,该实施例的构建第二客户条件信息调整函数的方法包括操作s510~s520。
[0111]
在操作s510,获取第一客户历史消费数据以及第一客户信用历史数据。
[0112]
在操作s520,构建各第一客户历史信用评分段的第二客户条件信息调整函数。
[0113]
图6示意性示出了根据本公开实施例的构建第i个第一客户历史信用评分段的第二客户条件信息调整函数的方法的流程图。
[0114]
如图6所示,该实施例的构建第二客户先验信息函数的方法包括操作s610~操作s620。
[0115]
在操作s610,利用第i个第一客户历史信用评分段的第一客户评分信息、第一客户历史消费数据以及第一客户数量信息,基于核密度估计算法构建第i个第一客户历史信用评分段的第二客户消费分布密度函数。其中,所述第一客户历史信用评分段基于所述第一客户历史信用评分划分。
[0116]
在操作s620,以所述第二客户消费分布密度函数为所述第二客户条件信息调整函数。
[0117]
在一些实施例中,第二客户条件信息调整函数符合正态分布。
[0118]
典型的第二客户条件信息调整函数可以如式(4)所示:
[0119][0120]
在式(4)中,x为第二客户的消费数据,m
p
为得分为p的第一客户的数量,c
i,p
为第i个得分为p的第一客户的历史消费数据。为额度参数,其可以基于专家经验预先设定,例如可以以消费形态和常用的消费额度为依据进行设定。例如,当业务场景为银行信用卡业务时,可以设置为5000,6000,7000等。
[0121]
根据本公开的实施例,第二客户条件信息调整函数可以为p的函数族,该函数族是离散的。对每一个得分p,其是一个基于核密度估计建立的连续函数,该连续函数以第一客户的消费数据(例如第一客户的动账值)为自变量,由此可以获取在当前得分下,第一客户消费数据对第一客户信用评分变动的影响概率分布情况,从而该评分下获取第一客户消费分布密度函数。其中,由于核密度估计的连续性,可以将每个分数点及其邻近区域划分为一个评分段。由此解决了核密度估计的连续性与信用评分的离散型之间的矛盾。
[0122]
图7示意性示出了根据本公开实施例的构建第二客户全量信息调整函数的方法的流程图。
[0123]
如图7所示,该实施例的构建第二客户全量信息调整函数的方法包括操作s710~
s720。
[0124]
在操作s710,获取第一客户历史消费数据以及第一客户信用历史数据,其中,所述第一客户信用历史数据包括第一客户历史信用评分以及第一客户数量信息。
[0125]
在操作s720,利用所述第一客户评分信息、第一客户历史消费数据以及第一客户数量信息,基于核密度估计算法构建全量第二客户消费分布密度函数,以所述第二客户消费分布密度函数为所述第二客户条件信息调整函数,其中,所述全量第二客户消费分布密度函数为全分数段第二客户消费分布密度函数。
[0126]
典型的第二客户全量信息调整函数可以如式(5)所示:
[0127][0128]
在式(5)中,x为第二客户的消费数据,m为得分为第一客户的数量,ci为第i个第一客户的历史消费数据。
[0129]
在获取第二客户条件信息调整函数和第二客户全量信息调整函数后,即建立了全量第二客户和各分数段第二客户的消费数据的分布密度函数。在一个典型的示例,如1-100分的信用评分体系中,可以获取101个函数,包括1个全量信息调整函数以及100个分数段函数。以99分为例,假设99分的第一客户有30个(即m
99
=30),则该30个客户的历史消费数据生成均值为该消费额度的正态分布,进而可以生成99分段的第二客户条件信息调整函数。在获取所有分数段所有第一客户的历史消费数据后,即可生成第二客户全量信息调整函数。
[0130]
本公开创造性的根据信用评分的场景以分数段为间隔建立多个核密度函数,以下一步建立半离散贝叶斯框架的第二客户信用评分模型提供技术基础。解决了核密度估计的连续性与信用评分离散性之间的矛盾,打破了技术壁垒,提升了评分系统的稳定性。并且,该系统更新评分时所需要的数据仅为第二客户的消费数据,而不需要重新收集或提取其他客户相关信息,降低了人工操作,节省了人力成本。
[0131]
在一些实施例中,第二客户条件信息调整函数符合正态分布。
[0132]
图8示意性示出了根据本公开实施例的利用第二客户先验信息函数,第二客户条件信息调整函数以及第二客户全量信息调整函数,基于贝叶斯法则构建得到所述第二客户信用评价模型的方法的流程图。
[0133]
如图8所示,该实施例的利用第二客户先验信息函数,第二客户条件信息调整函数以及第二客户全量信息调整函数,基于贝叶斯法则构建得到所述第二客户信用评价模型的方法包括操作s810~s820。
[0134]
在操作s810,利用所述第二客户先验信息函数,所述第二客户条件信息调整函数以及第二客户全量信息调整函数,基于贝叶斯法则构建得到第二客户评分经验分布函数,其中,所述第二客户信用评价模型为以第二客户消费信息为自变量的函数。
[0135]
操作s820,以所述第二客户评分经验分布函数为所述第二客户信用评价模型,所述第二客户信用评价模型用于获取第二客户信用调整评分。
[0136]
在一些具体的实施例中,第二客户信用评价模型符合正态分布,其中,以所述第二客户评分经验分布函数的极值点为所述第二客户的信用评分。
[0137]
具体的,第二客户信用评价模型可以如式(6)所示:
[0138][0139]
根据式(6),可以取第二客户经验分布函数的极值点,即该经验分布函数所取概率最大值处作为第二客户调整后的评分p。优选的,若p小于0,可以令p=0,若得到的p大于100,可以令p=100,由此可以获得0-100分信用评分体系中第二客户消费变动后,其信用评分最大概率的分值。
[0140]
在本公开的实施例中,通过构造离散型mp函数的方式与离散贝叶斯框架相结合,既满足了信用评价这一离散业务场景的需求,又能够利用核密度估计这一连续提取数据信息的有效工具,解决了原先这两种方式难以链接的痛点。
[0141]
根据本公开的实施例,还可以对第二客户的信用评分进行展示以向业务人员直观展现第二客户的信用评分变动情况。
[0142]
图9示意性示出了根据本公开实施例的对第二客户的信用评分进行展示的方法的流程图。
[0143]
如图9所示,该实施例的对第二客户的信用评分进行展示的方法的方法包括操作s910~s920。
[0144]
在操作s910,获取连续m个时间间隔的第二客户的信用评分。
[0145]
在操作s920,将所述连续m个时间间隔的第二客户的信用评分进行展示。
[0146]
图10示意性示出了根据本公开实施例的第二客户的信用评分的展示图。如图10所示,可以使用折线图形式展示某一第二客户风险评分,亦即信用评分。例如,可以以一个月为时间间隔,连续获取该客户的风险评分,以显示信用变动情况。
[0147]
基于上述信用评价方法,本公开还提供了一种信用评价装置。以下将结合图11a对该装置进行详细描述。
[0148]
图11a示意性示出了根据本公开实施例的信用评价装置的结构框图。
[0149]
如图11a所示,该实施例的信用评价装置800包括获取模块1110、输入模块1120和处理模块1130。
[0150]
其中,获取模块1110被配置为获取第二客户消费数据。
[0151]
输入模块被1120配置为将所述第二客户消费数据输入第二客户信用评价模型,其中,所述第二客户信用评价模型基于核密度估计结合贝叶斯法则构建,所述第二客户信用评价模型包含第一客户信用评价参数,所述第二客户与所述第一客户共同构成客户群,其中,所述第二客户为所述客户群中的非活跃客户,所述第一客户为所述客户群中的活跃客户。
[0152]
处理模块1130被配置为获取第二客户的信用评分。
[0153]
根据本公开的另一些实施例,第二客户消费数据基于预设的时间间隔获取,所述第二客户的信用评分与获取第二客户消费数据的时间存在映射关系。由此,获取模块可以获取连续m个时间间隔的第二客户的信用评分。
[0154]
图11b示意性示出了根据本公开另一些实施例的信用评价装置的结构框图。
[0155]
如图11b所示,该另一些实施例的信用评价装置1100除包括获取模块1110、输入模块1120和处理模块1130外,还可以包括展示模块1140。
[0156]
其中,展示模块1140被配置为将所述连续m个时间间隔的第二客户的信用评分进行展示。
[0157]
根据本公开的实施例,第二客户信用评价模型可以通过预构建获得。
[0158]
本公开的实施例还提供了一种第二客户信用评价模型的构建装置。以下将结合图12对该装置进行详细描述。
[0159]
图12示意性示出了根据本公开实施例的第二客户信用评价模型的构建装置的结构框图。
[0160]
如图12所示,该实施例的第二客户信用评价模型的构建装置1200包括第一构建模块1210、第二构建模块1220和第三构建模块1230。
[0161]
第一构建模块1210被配置为构建第二客户先验信息函数,其中,所述第二客户先验信息函数基于核密度估计算法,利用第一客户信用历史数据构建得到,其中,所述第一客户信用历史数据包括第一客户历史信用评分以及第一客户数量信息。
[0162]
第二构建模块1220被配置为构建第二客户条件信息调整函数以及第二客户全量信息调整函数,其中,所述第二客户条件信息调整函数和所述第二客户全量信息调整函数基于核密度估计算法,利用第一客户历史消费数据和第一客户信用历史数据构建获得。
[0163]
第三构建模块1230被配置为利用所述第二客户先验信息函数,所述第二客户条件信息调整函数以及第二客户全量信息调整函数,基于贝叶斯法则构建得到所述第二客户信用评价模型。
[0164]
图13示意性示出了根据本公开另一些实施例的第二客户信用评价模型的构建装置的结构框图。
[0165]
如图13所示,该另一些实施例的第二客户信用评价模型的构建装置1200除包括第一构建模块1210、第二构建模块1220和第三构建模块1230外,还包括初评分数获取模块1240。
[0166]
其中,初评分数获取模块1240被配置为基于所述第二客户先验信息函数获取第二客户信用初评分数。
[0167]
图14示意性示出了根据本公开实施例的第一构建模块的结构框图。
[0168]
如图14所示,该实施例的第一构建模块1210包括第一构建单元12101和第一形成单元12102。
[0169]
其中,第一构建单元12101被配置为基于所述核密度估计算法,利用所述第一客户历史信用评分以及第一客户数量信息构建第一客户评分分布密度函数。
[0170]
第一形成单元12102被配置为以所述第一客户评分分布密度函数作为所述第二客户先验信息函数。
[0171]
图15示意性示出了根据本公开实施例的第二构建模块的结构框图。
[0172]
如图15所示,该实施例的第二构建模块1220包括第一获取单元12201、第二构建单元12202和第二形成单元12203。
[0173]
其中,第一获取单元12201被配置为获取第一客户历史消费数据以及第一客户信用历史数据。
[0174]
第二构建单元12202被配置为构建各第一客户历史信用评分段的第二客户条件信息调整函数,其中,构建第i个第一客户历史信用评分段的第二客户条件信息调整函数的方法包括:利用第i个第一客户历史信用评分段的第一客户评分信息、第一客户历史消费数据以及第一客户数量信息,基于核密度估计算法构建第i个第一客户历史信用评分段的第二客户消费分布密度函数。其中,所述第一客户历史信用评分段基于所述第一客户历史信用评分划分。
[0175]
第二形成单元12203被配置为以所述第二客户消费分布密度函数为所述第二客户条件信息调整函数。
[0176]
图16示意性示出了根据本公开另一些实施例的第二构建模块的结构框图。
[0177]
如图16所示,该实施例的第二构建模块1220除包括第一获取单元12201、第二构建单元12202和第二形成单元12203外,还包括第三形成单元12204。
[0178]
其中,第三形成单元12204被配置为利用所述第一客户评分信息、第一客户历史消费数据以及第一客户数量信息,基于核密度估计算法构建全量第二客户消费分布密度函数,以所述第二客户消费分布密度函数为所述第二客户条件信息调整函数,其中,所述全量第二客户消费分布密度函数为全分数段第二客户消费分布密度函数。
[0179]
图17示意性示出了根据本公开实施例的第三构建模块的结构框图。
[0180]
如图17所示,该实施例的第三构建模块1230包括第三构建单元12301和第四形成单元12302。
[0181]
其中,第三构建单元12301被配置为利用所述第二客户先验信息函数,所述第二客户条件信息调整函数以及第二客户全量信息调整函数,基于贝叶斯法则构建得到第二客户评分经验分布函数,其中,所述第二客户信用评价模型为以第二客户消费信息为自变量的函数。
[0182]
第四形成单元12302被配置为以所述第二客户评分经验分布函数为所述第二客户信用评价模型,所述第二客户信用评价模型用于获取第二客户信用调整评分。
[0183]
根据本公开的实施例,获取模块1110、输入模块1120、处理模块1130、展示模块1140、第一构建模块1210、第二构建模块1220、第三构建模块1230、初评分数获取模块1240、第一构建单元12101、第一形成单元12102、第一获取单元12201、第二构建单元12202、第二形成单元12203、第三形成单元12204、第三构建单元12301和第四形成单元12302中的任意多个模块可以合并在一个模块中实现,或者其中的任意一个模块可以被拆分成多个模块。或者,这些模块中的一个或多个模块的至少部分功能可以与其他模块的至少部分功能相结合,并在一个模块中实现。根据本公开的实施例,获取模块1110、输入模块1120、处理模块1130、展示模块1140、第一构建模块1210、第二构建模块1220、第三构建模块1230、初评分数获取模块1240、第一构建单元12101、第一形成单元12102、第一获取单元12201、第二构建单元12202、第二形成单元12203、第三形成单元12204、第三构建单元12301和第四形成单元12302中的至少一个可以至少被部分地实现为硬件电路,例如现场可编程门阵列(fpga)、可编程逻辑阵列(pla)、片上系统、基板上的系统、封装上的系统、专用集成电路(asic),或可以通过对电路进行集成或封装的任何其他的合理方式等硬件或固件来实现,或以软件、硬件以及固件三种实现方式中任意一种或以其中任意几种的适当组合来实现。或者,获取模块1110、输入模块1120、处理模块1130、展示模块1140、第一构建模块1210、第二构建模块
1220、第三构建模块1230、初评分数获取模块1240、第一构建单元12101、第一形成单元12102、第一获取单元12201、第二构建单元12202、第二形成单元12203、第三形成单元12204、第三构建单元12301和第四形成单元12302中的至少一个可以至少被部分地实现为计算机程序模块,当该计算机程序模块被运行时,可以执行相应的功能。
[0184]
图18示意性示出了根据本公开实施例的适于实现信用评价方法的电子设备的方框图。
[0185]
如图18所示,根据本公开实施例的电子设备900包括处理器901,其可以根据存储在只读存储器(rom)902中的程序或者从存储部分908加载到随机访问存储器(ram)903中的程序而执行各种适当的动作和处理。处理器901例如可以包括通用微处理器(例如cpu)、指令集处理器和/或相关芯片组和/或专用微处理器(例如,专用集成电路(asic))等等。处理器901还可以包括用于缓存用途的板载存储器。处理器901可以包括用于执行根据本公开实施例的方法流程的不同动作的单一处理单元或者是多个处理单元。
[0186]
在ram 903中,存储有电子设备900操作所需的各种程序和数据。处理器901、rom 902以及ram 903通过总线904彼此相连。处理器901通过执行rom 902和/或ram 903中的程序来执行根据本公开实施例的方法流程的各种操作。需要注意,所述程序也可以存储在除rom 902和ram 903以外的一个或多个存储器中。处理器901也可以通过执行存储在所述一个或多个存储器中的程序来执行根据本公开实施例的方法流程的各种操作。
[0187]
根据本公开的实施例,电子设备900还可以包括输入/输出(i/o)接口905,输入/输出(i/o)接口905也连接至总线904。电子设备900还可以包括连接至i/o接口905的以下部件中的一项或多项:包括键盘、鼠标等的输入部分906;包括诸如阴极射线管(crt)、液晶显示器(lcd)等以及扬声器等的输出部分907;包括硬盘等的存储部分908;以及包括诸如lan卡、调制解调器等的网络接口卡的通信部分909。通信部分909经由诸如因特网的网络执行通信处理。驱动器910也根据需要连接至i/o接口905。可拆卸介质911,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器910上,以便于从其上读出的计算机程序根据需要被安装入存储部分908。
[0188]
本公开还提供了一种计算机可读存储介质,该计算机可读存储介质可以是上述实施例中描述的设备/装置/系统中所包含的;也可以是单独存在,而未装配入该设备/装置/系统中。上述计算机可读存储介质承载有一个或者多个程序,当上述一个或者多个程序被执行时,实现根据本公开实施例的方法。
[0189]
根据本公开的实施例,计算机可读存储介质可以是非易失性的计算机可读存储介质,例如可以包括但不限于:便携式计算机磁盘、硬盘、随机访问存储器(ram)、只读存储器(rom)、可擦式可编程只读存储器(eprom或闪存)、便携式紧凑磁盘只读存储器(cd-rom)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本公开中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。例如,根据本公开的实施例,计算机可读存储介质可以包括上文描述的rom 902和/或ram 903和/或rom 902和ram 903以外的一个或多个存储器。
[0190]
本公开的实施例还包括一种计算机程序产品,其包括计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。当计算机程序产品在计算机系统中运行时,该程序代码用于使计算机系统实现本公开实施例所提供的方法。
[0191]
在该计算机程序被处理器901执行时执行本公开实施例的系统/装置中限定的上述功能。根据本公开的实施例,上文描述的系统、装置、模块、单元等可以通过计算机程序模块来实现。
[0192]
在一种实施例中,该计算机程序可以依托于光存储器件、磁存储器件等有形存储介质。在另一种实施例中,该计算机程序也可以在网络介质上以信号的形式进行传输、分发,并通过通信部分909被下载和安装,和/或从可拆卸介质911被安装。该计算机程序包含的程序代码可以用任何适当的网络介质传输,包括但不限于:无线、有线等等,或者上述的任意合适的组合。
[0193]
在这样的实施例中,该计算机程序可以通过通信部分909从网络上被下载和安装,和/或从可拆卸介质911被安装。在该计算机程序被处理器901执行时,执行本公开实施例的系统中限定的上述功能。根据本公开的实施例,上文描述的系统、设备、装置、模块、单元等可以通过计算机程序模块来实现。
[0194]
根据本公开的实施例,可以以一种或多种程序设计语言的任意组合来编写用于执行本公开实施例提供的计算机程序的程序代码,具体地,可以利用高级过程和/或面向对象的编程语言、和/或汇编/机器语言来实施这些计算程序。程序设计语言包括但不限于诸如java,c++,python,“c”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。在涉及远程计算设备的情形中,远程计算设备可以通过任意种类的网络,包括局域网(lan)或广域网(wan),连接到用户计算设备,或者,可以连接到外部计算设备(例如利用因特网服务提供商来通过因特网连接)。
[0195]
附图中的流程图和框图,图示了按照本公开各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,上述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图或流程图中的每个方框、以及框图或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
[0196]
本领域技术人员可以理解,本公开的各个实施例和/或权利要求中记载的特征可以进行多种组合或/或结合,即使这样的组合或结合没有明确记载于本公开中。特别地,在不脱离本公开精神和教导的情况下,本公开的各个实施例和/或权利要求中记载的特征可以进行多种组合和/或结合。所有这些组合和/或结合均落入本公开的范围。
[0197]
以上对本公开的实施例进行了描述。但是,这些实施例仅仅是为了说明的目的,而并非为了限制本公开的范围。尽管在以上分别描述了各实施例,但是这并不意味着各个实施例中的措施不能有利地结合使用。本公开的范围由所附权利要求及其等同物限定。不脱离本公开的范围,本领域技术人员可以做出多种替代和修改,这些替代和修改都应落在本公开的范围之内。