信息处理方法及装置与流程

文档序号：27249393发布日期：2021-11-03 20:19阅读：82来源：国知局

1.本公开涉及数据处理技术领域，具体涉及到一种信息处理方法及装置。

背景技术：

2.在大数据时代，企业利用机器学习在已有数据的基础上建立特定领域的模型并指导企业的生产发展已成为一种重要的方式。现行的一般方式是使用机器学习建立模型，并生成业务评分卡。利用业务评分卡对客户进行评分，然后根据分数结果判断是否给予其信用额度。此时分数阈值的设定直接关系到模型的使用效果。
3.相关技术中，采用该方法无法确定风险与收益的关系。

技术实现要素：

4.本公开的主要目的在于提供一种信息处理方法及装置。
5.为了实现上述目的，根据本公开的第一方面，提供了一种信息处理方法，包括：在预建立的机器学习模型的分类阈值下，基于样本预测结果，确定对应的净收益值；响应于接收到对所述分类阈值进行实时调整的请求，确定调整后的分类阈值对应的净收益值；在所述分类阈值在不断被调整，得到动态净收益值后，从所述动态净收益值中确定最大动态净收益值。
6.可选地，在预建立的机器学习模型的分类阈值下，基于样本预测结果，确定对应的净收益值包括：在预建立的机器学习模型的分类阈值下，得到所述机器学习模型的预测结果；基于样本预测结果为目标结果的样本数据量、预设收益规则，确定在所述分类阈值下，目标结果对应的净收益值。可选地，方法还包括：响应于接收到对收益规则进行实时调整的请求，确定调整后的收益规则对应的净收益值；和/或，响应于接收到对所述分类阈值、以及收益规则进行实时调整的请求，确定调整后的分类阈值、以及调整后的收益规则对应的净收益值。
7.可选地，基于样本预测结果为目标结果的样本数据量、预设收益规则，确定在所述分类阈值下，目标结果对应的净收益值包括：确定样本预测结果为目标结果、且预测结果与实际值相符的第一样本数据量；基于第一样本数据量、以及每一个样本预测结果与实际值相符时产生的收益值r1，确定预测后的总收益r1；确定样本预测结果目标结果、且预测结果预实际值不符的第二样本数据量；基于第二样本数据量、以及每一个样本预测结果与实际值不符时产生的损失值r2，确定预测后的总损失值r2；基于所述总收益r1、总损失值r2确定在所述分类阈值下，目标结果对应的净收益值。
8.可选地，响应于接收到对收益规则进行实时调整的请求，确定调整后的收益规则对应的净收益值包括：响应于接收到对每一个样本预测结果与实际值相符时产生的收益值进行实时调整的请求，确定调整后的收益值对应的净收益值。
9.可选地，响应于接收到对所述分类阈值、以及收益规则进行实时调整的请求，确定调整后的分类阈值、以及调整后的收益规则对应的净收益值包括：响应于接收到对所述分
类阈值进行实时调整的请求，所述机器学习模型重新确定样本的新预测结果；基于样本的新预测结果为目标结果的样本数据量、调整后的收益规则，重新确定对应的净收益值。
10.可选地，响应于接收到对所述分类阈值进行实时调整的请求，确定调整后的分类阈值对应的净收益值，包括：响应于接收到对所述分类阈值进行实时调整的请求，所述机器学习模型重新确定样本的新预测结果；基于样本的新预测结果为目标结果的样本数据量、预设收益规则，确定在所述分类阈值下，目标结果对应的净收益值。
11.根据本公开的第二方面，提供了一种信息处理装置，包括：第一确定单元，被配置成在预建立的机器学习模型的分类阈值下，基于样本预测结果，确定对应的净收益值；第二确定单元，被配置成响应于接收到对所述分类阈值进行实时调整的请求，确定调整后的分类阈值对应的净收益值；第三确定单元，被配置成在所述分类阈值在不断被调整，得到动态净收益值后，从所述动态净收益值中确定最大动态净收益值。
12.根据本公开的第三方面，提供了一种计算机可读存储介质，存储有计算机指令，计算机指令用于使计算机执行权利要求第一方面任意一项实施例所述的信息处理方法。
13.根据本公开的第四方面，提供了一种电子设备，包括：至少一个处理器；以及与所述至少一个处理器通信连接的存储器；其中，存储器存储有可被所述至少一个处理器执行的计算机程序，所述计算机程序被所述至少一个处理器执行，以使所述至少一个处理器执行第一方面任意一项所述的信息处理方法。
14.在本公开实施例中，首先在预建立的机器学习模型的分类阈值下，基于样本预测结果，确定对应的净收益值；而后响应于接收到对分类阈值进行实时调整的请求，确定调整后的分类阈值对应的净收益值；最后在分类阈值在不断被调整，得到动态净收益值后，从动态净收益值中确定最大动态净收益值。通过根据风险偏好动态调整分类阈值，最终确定最大化净收益，准确地确定了风险与收益之间的动态关系。解决了相关技术中无法基于机器学习模型确定收益的问题。
附图说明
15.为了更清楚地说明本公开具体实施方式或现有技术中的技术方案，下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图是本公开的一些实施方式，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。
16.图1是根据本公开实施例的信息处理方法流程图；
17.图2是根据本公开实施例的信息处理方法的应用场景图；
18.图3是根据本公开实施例的信息处理装置的结构图；
19.图4是根据本公开实施例的电子设备的示意图。
具体实施方式
20.为了使本技术领域的人员更好地理解本公开方案，下面将结合本公开实施例中的附图，对本公开实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本公开一部分的实施例，而不是全部的实施例。基于本公开中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都应当属于本公开保护的范
围。
21.需要说明的是，本公开的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象，而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换，以便这里描述的本公开的实施例。此外，术语“包括”和“具有”以及他们的任何变形，意图在于覆盖不排他的包含，例如，包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元，而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
22.需要说明的是，在不冲突的情况下，本公开中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本公开。
23.根据本公开实施例，提供了一种信息处理方法，本实施例利用机器学习进行收益测算的方法，该方法可以直观的表达风险与收益之间的关系，帮助客户在进行阈值选择时，根据其自身的风险偏好选择合适的阈值。
24.如图1所示，该方法包括如下的步骤101至步骤103：
25.步骤101：在预建立的机器学习模型的分类阈值下，基于样本预测结果，确定对应的净收益值。
26.在本实施例中，建立机器学习模型后，可以利用模型预测建模时样本数据的目标列(target)，并比对模型预测结果和样本数据的真实结果，从而获得模型的准确率、召回率、精确度、f1值、特异度等指标。当target为二分类的数据时，模型在预测target的结果时计算得到的是分类概率(例如该条数据有80.4％的概率为“真”)，并通过特定的分类阈值将概率转化为具体的分类结果(例如模型默认的分类概率阈值为60％，如果该数据预测大于60％，则预测分类结果为“真”)。
27.作为本实施例一种可选的实现方式，在预建立的机器学习模型的分类阈值下，基于样本预测结果，确定对应的净收益值包括：在预建立的机器学习模型的分类阈值下，得到所述机器学习模型的预测结果；基于样本预测结果为目标结果的样本数据量、预设收益规则，确定在所述分类阈值下，目标结果对应的净收益值。
28.在本可选的实现方式中，预设收益规则包括计算规则、预测(目标结果)正确时，产生的收益值。
29.作为本实施例一种可选的实现方式，基于样本预测结果为目标结果的样本数据量、预设收益规则，确定在所述分类阈值下，目标结果对应的净收益值包括：确定样本预测结果为目标结果、且预测结果与实际值相符的第一样本数据量；基于第一样本数据量、以及每一个样本预测结果与实际值相符时产生的收益值r1，确定预测后的总收益r1；确定样本预测结果目标结果、且预测结果预实际值不符的第二样本数据量；基于第二样本数据量、以及每一个样本预测结果与实际值不符时产生的损失值r2，确定预测后的总损失值r2；基于所述总收益r1、总损失值r2确定在所述分类阈值下，目标结果对应的净收益值。
30.在本可选的实现方式中，首先使用样本数据和机器学习算法，建立机器学习模型。而后调整收益规则，收益规则可以根据风险偏好和市场环境调整设定：假设模型预测为“真”且预测正确一条数据时产生的收益计为r1，以及假设预测为“真”且预测错误一条数据时造成的损失计为l1。此时，可以得到在默认分类阈值t1，下，模型预测为“真”且预测正确的数据量n1，模型预测为“真”且预测错误的数据量m1，则可以计算得到机器学习模
型对于样本数据完成预测后的总收益r1＝r1*n1和总损失l1＝l1*m1，此时总净收益为n1＝r1‑
l1。
31.步骤102：响应于接收到对所述分类阈值进行实时调整的请求，确定调整后的分类阈值对应的净收益值。
32.在本实施例中，可根据企业的业务性质和风险偏好，动态调整分类阈值。
33.作为本实施一种可选的实现方式，响应于接收到对所述分类阈值进行实时调整的请求，确定调整后的分类阈值对应的净收益值，包括：响应于接收到对所述分类阈值进行实时调整的请求，所述机器学习模型重新确定样本的新预测结果；基于样本的新预测结果为目标结果的样本数据量、预设收益规则，确定在所述分类阈值下，目标结果对应的净收益值。
34.在本可选的实现方式中，在收益假设不变的情况下，可以根据企业的业务性质和风险偏好，动态调整分类阈值。由于模型在预测target的结果时计算得到的是分类概率，并通过特定的分类阈值将概率转化为具体的分类结果，根据风险的偏好动态调整默认分类阈值t1可以改变模型的最终分类结果，并因此可以得到固定假设收益下实现最大化净收益的分类阈值。调整后新的分类阈值计为t
1a
，则此时模型预测为“真”且正确的数据量n
1a
，模型预测为“真”且错误的数据量m
1a
，则机器学习模型对于样本数据完成预测后的总收益r
1a
＝r1*n
1a
和总损失l
1a
＝l1*m
1a
，此时总净收益为n
1a
＝r
1a
‑
l
1a
。相似的，当调整分类阈值至t
1b
时，会重新计算模型的预测结果以及对应的收益损失。通过一系列的动态调整，可以得到固定假设收益下的最大化净收益的分类阈值。
35.步骤103：在所述分类阈值在不断被调整，得到动态净收益值后，从所述动态净收益值中确定最大动态净收益值。
36.在本实施例中，通过一系列的动态调整，可以得到固定假设收益下的最大化净收益的分类阈值。直观、准确地表述了风险与收益之间的关系。
37.作为本实施例一种可选的实现方式，方法还包括：响应于接收到对收益规则进行实时调整的请求，确定调整后的收益规则对应的净收益值；和/或，响应于接收到对所述分类阈值、以及收益规则进行实时调整的请求，确定调整后的分类阈值、以及调整后的收益规则对应的净收益值。
38.在本可选的实现方式中，当收益规则不变，基于企业的业务性质和风险偏好，动态调整分类阈值；当市场环境发生变化，可以动态调整收益规则和分类阈值；也可以只对收益规则进行调整。调整收益规则以及调整分类阈值包括但不限于应用在金融风控领域的信用额度风险评估，还可以量化用于其他模型预测结果对于业务的影响，例如机器学习模型预测股票涨跌时的收益及损失、预测广告吸引顾客购买行为时的收益和损失、预测天气状态时的收益和损失等等。
39.作为本实施例一种可选的实现方式，响应于接收到对收益规则进行实时调整的请求，确定调整后的收益规则对应的净收益值包括：响应于接收到对每一个样本预测结果与实际值相符时产生的收益值进行实时调整的请求，确定调整后的收益值对应的净收益值。
40.作为本实施例一种可选的实现方式，响应于接收到对所述分类阈值、以及收益规则进行实时调整的请求，确定调整后的分类阈值、以及调整后的收益规则对应的净收益值包括：响应于接收到对所述分类阈值进行实时调整的请求，所述机器学习模型重新确定样
本的新预测结果；基于样本的新预测结果为目标结果的样本数据量、调整后的收益规则，重新确定对应的净收益值。
41.在上述可选的实现方式中，在收益规则不变的情况下，可以根据企业的业务性质和风险偏好，动态调整分类阈值。由于模型在预测target的结果时计算得到的是分类概率，并通过特定的分类阈值将概率转化为具体的分类结果，根据风险的偏好动态调整默认分类阈值t1可以改变模型的最终分类结果，并因此可以得到固定假设收益下实现最大化净收益的分类阈值。手动调整后新的分类阈值计为t
1a
，则此时模型预测为“真”且正确的数据量n
1a
，模型预测为“真”且错误的数据量m
1a
，则机器学习模型对于样本数据完成预测后的总收益r
1a
＝r1*n
1a
和总损失l
1a
＝l1*m
1a
，此时总净收益为n
1a
＝r
1a
‑
l
1a
。相似的，当调整分类阈值至t
1b
时，会重新计算模型的预测结果以及对应的收益损失。通过一系列的动态调整，可以得到固定假设收益下的最大化净收益的分类阈值。
42.接下来，在市场环境发生变化时，可以修改收益假设和分类阈值，得到最大化净收益下的收益假设和分类阈值的组合，此时假设模型预测为“真”且预测正确一条数据时产生的收益计为r2，以及假设预测为“真”且预测错误一条数据时造成的损失计为l2。当企业风险偏好更为激进时，可以降低分类阈值至t
2a
(t1＞t
2a
,此时，模型会将更多数据预测为“真”，此时的模型预测正确的数据量为n
2a
，模型预测错误的数据量为m
2a
,则在收益假设不变时，调整分类阈值后的模型预测总收益r
2a
＝r2*n
2a
，总损失l
2a
＝l2*m
2a
，总净收益为n
2a
＝r
2a
‑
l
2a
。不断调整分类阈值，则可以得到最大化净收益的n
2max
。
43.针对上述模型，当企业的风险偏好或市场环境发生变化时，可以重复上述步骤，及时调整收益假设及分类阈值，得到特定收益假设下，满足最大化收益的分类阈值。
44.具体地，以调整收益规则为例，调整收益假设，即是将模型预测结果的对错进行量化评估，通过数据假设更好地了解模型预测的结果。以应用于金融风控领域的信用贷款为例，假设样本数据中贷款给每位target为0的用户收益500(r1＝500)，贷款给每位target为1的用户损失700(l1＝700)，此时模型的默认分类阈值为0.6(t1＝0.6)模型预测为“0(真)”且预测正确(实际为“0”)的数据量为100,000条(n1＝100,000)，模型预测为“0(真)”且预测错误(实际为“1”)的数据量为1,500条(m1＝1,500)，则机器学习模型对于样本数据完成预测后的总收益r1＝r1*n1＝50,000,000和总损失l1＝l1*m1＝1，050，000，此时总净收益为n1＝r1‑
l1＝48,950,000。这样，通过收益假设可以量化得到总收益。调整收益假设包括但不限于应用在金融风控领域的信用额度风险评估，还可以量化用于其他模型预测结果对于业务的影响，例如机器学习模型预测股票涨跌时的收益及损失、预测广告吸引顾客购买行为时的收益和损失、预测天气状态时的收益和损失等等。
45.以调整分类阈值为例，调整分类阈值，即是调整模型在将分类概率转为分类结果时的门槛，通过调整分类阈值可以在风险偏好、市场环境变化时快速的调整模型的预测结果，获得最大化的收益。以应用于金融风控领域的信用贷款为例，若模型默认分类阈值为60％(t1＝60％)，即对于预测计算后分类概率大于60％的数据分类为0，对其给予贷款额度；对于分类概率小于60％的数据分类为1，拒绝其贷款申请。则在企业风险偏好更高时，可以调低分类阈值至55％(t
1a
＝55％)，此时可以有更多的数据被分类为0，获得贷款额度，从而得到新的净收益值。在不断动态调整分类阈值后，可以得到最大化净收益值。
46.调整分类阈值包括但不限于应用于金融风控领域的信用额度风险评估。还可以用
于其他模型，以快速应对外界环境变化对于模型结果的影响，例如机器学习模型预测股票涨跌时的分类阈值、预测广告吸引顾客购买时的分类阈值和预测天气状态时的分类阈值等等。
47.参考图2，图2示出了信息处理方法的应用流程图，图中示出了动态模拟收益方法，在建立机器学习模型后，可实时动态调整收益假设(即收益规则)，以及分类阈值，实时获得收益模拟结果，直至结束。
48.上述实施例和可选的实现方式，通过机器学习的动态模拟收益测算方法，可以实现动态调整机器学习模型的分类阈值，并从可以根据风险偏好，从收益测算的角度量化模型预测结果的盈利水平，帮助客户根据其业务性质和风险偏好，选择合适的阈值。
49.本实施例实现从假设收益角度量化机器学习模型的预测结果，模拟基于该模型预测结果的盈利水平和收益情况，直观的表达风险与收益之间的关系。可业务性质和风险偏好调整模型的分类阈值，获得特定假设收益和最大化收益下的结果。实现了在企业风险偏好或市场环境发生变化时，快速调整假设收益和分类阈值，共同测算机器学习模型对于业务的预测结果，从而模拟业务在不同情况下的最大化收益。
50.需要说明的是，在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行，并且，虽然在流程图中示出了逻辑顺序，但是在某些情况下，可以以不同于此处的顺序执行所示出或描述的步骤。
51.根据本公开实施例，还提供了一种用于实施上述信息处理方法的装置，如图3所示，该装置包括：第一确定单元301，被配置成在预建立的机器学习模型的分类阈值下，基于样本预测结果，确定对应的净收益值；第二确定单元302，被配置成响应于接收到对所述分类阈值进行实时调整的请求，确定调整后的分类阈值对应的净收益值；第三确定单元303，被配置成在所述分类阈值在不断被调整，得到动态净收益值后，从所述动态净收益值中确定最大动态净收益值。
52.本公开实施例提供了一种电子设备，如图4所示，该电子设备包括一个或多个处理器41以及存储器42，图4中以一个处理器43为例。
53.该控制器还可以包括：输入装置43和输出装置44。
54.处理器41、存储器42、输入装置43和输出装置44可以通过总线或者其他方式连接，图4中以通过总线连接为例。
55.处理器41可以为中央处理器(centralprocessingunit，cpu)。处理器41还可以为其他通用处理器、数字信号处理器(digitalsignalprocessor，dsp)、专用集成电路(applicationspecificintegratedcircuit，asic)、现场可编程门阵列(field
‑
programmablegatearray，fpga)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等芯片，或者上述各类芯片的组合。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
56.存储器42作为一种非暂态计算机可读存储介质，可用于存储非暂态软件程序、非暂态计算机可执行程序以及模块，如本公开实施例中的控制方法对应的程序指令/模块。处理器41通过运行存储在存储器42中的非暂态软件程序、指令以及模块，从而执行服务器的各种功能应用以及数据处理，即实现上述方法实施例的信息处理方法。
57.存储器42可以包括存储程序区和存储数据区，其中，存储程序区可存储操作系统、
至少一个功能所需要的应用程序；存储数据区可存储根据服务器操作的处理装置的使用所创建的数据等。此外，存储器42可以包括高速随机存取存储器，还可以包括非暂态存储器，例如至少一个磁盘存储器件、闪存器件、或其他非暂态固态存储器件。在一些实施例中，存储器42可选包括相对于处理器41远程设置的存储器，这些远程存储器可以通过网络连接至网络连接装置。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
58.输入装置43可接收输入的数字或字符信息，以及产生与服务器的处理装置的用户设置以及功能控制有关的键信号输入。输出装置44可包括显示屏等显示设备。
59.一个或者多个模块存储在存储器42中，当被一个或者多个处理器41执行时，执行如图1所示的方法。
60.本领域技术人员可以理解，实现上述实施例方法中的全部或部分流程，是可以通过计算机程序来指令相关的硬件来完成，的程序可存储于一计算机可读取存储介质中，该程序在执行时，可包括如上述各电机控制方法的实施例的流程。其中，存储介质可为磁碟、光盘、只读存储记忆体(read
‑
onlymemory，rom)、随机存储记忆体(randomaccessmemory，ram)、快闪存储器(flashmemory)、硬盘(harddiskdrive，缩写：hdd)或固态硬盘(solid
‑
statedrive，ssd)等；存储介质还可以包括上述种类的存储器的组合。
61.虽然结合附图描述了本公开的实施方式，但是本领域技术人员可以在不脱离本公开的精神和范围的情况下作出各种修改和变型，这样的修改和变型均落入由所附权利要求所限定的范围之内。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：贡建军;贾震;陈浩;谭坤霖
技术所有人：上海玳鸽信息技术有限公司
我是此专利的发明人

上一篇：三通管侧管口自动加工成型设备的制作方法
上一篇：一种集成式防火卷帘门的制作方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。