一种风险预测方法、装置及计算机设备与流程

文档序号:29925419发布日期:2022-05-07 10:56阅读:62来源:国知局
一种风险预测方法、装置及计算机设备与流程

1.本发明涉及数据分析技术领域,具体涉及一种风险预测方法、装置及计算机设备。


背景技术:

2.随着人工智能和机器学习技术的普及和发展,越来越多的公司开始尝试利用机器学习技术来解决业务问题。大量的数据能够被采集,为机器学习技术的使用、提升机器学习模型的性能创造了条件。
3.以预估居民各种风险为例,由于居民人口基数大,造成风险的因素多,因此,需要使用机器学习技术准确预测居民可能面临的各种风险,将居民进行精准分类,从而可以进行有效的资源分配。


技术实现要素:

4.因此,本发明要解决的技术问题在于解决目前无法精准分类居民、无法准确预测居民可能面临的各种风险的问题,从而提供一种风险预测方法、装置及计算机设备。
5.根据第一方面,本发明实施例提供了一种风险预测方法,包括:获取目标对象的待测信息数据和外部影响因素信息,并基于预设标准数据及所述待测信息数据进行特征预处理,获得特征预处理数据,所述预设标准数据为已知贫困对象的信息数据;基于所述特征预处理数据及预设的数据分析模型得到输出数据,所述输出数据为基于所述数据分析模型得到的所述特征预处理数据的排名结果信息,所述预设的数据分析模型为基于样本数据和所述外部影响因素训练生成的;基于所述输出数据与所述预设标准数据综合分析所述目标对象的风险,得到分析结果。
6.可选地,所述基于预设标准数据及所述待测信息数据进行特征预处理,所述方法包括:将所述待测信息数据进行分类处理,获得分类结果;基于所述分类结果将所述待测信息数据进行整合,获得待测信息数据合集,所述待测信息数据合集为所述目标对象的基本信息数据。
7.可选地,所述基于预设标准数据及所述待测信息数据进行特征预处理,所述方法包括:基于所述待测信息数据集合进行数据处理,获得符合预设标准的处理数据集合。
8.可选地,所述基于所述待测信息数据进行特征预处理,所述方法包括:基于所述待测信息数据和所述预设标准数据组建向量矩阵;基于向量矩阵计算所述待测信息数据与所述预设标准数据之间的差值。
9.可选地,所述基于所述特征预处理数据及预设的数据分析模型得到输出数据,所述方法包括:基于所述特征预处理数据提取第一指标数据和第二指标数据;基于所述第一指标数据和第二指标数据构建判别矩阵,通过所述判别矩阵获取所述特征预处理数据中影响因素权重占比;基于所述特征预处理数据中影响因素数据权重占比获得所述待测信息数据影响因素以及外部影响因素信息的排位信息;基于所述排位信息以及预设的数据分析模型得到所述输出数据。
10.可选地,所述基于所述待测信息数据排位信息以及预设的数据分析模型,得到所述输出数据,所述方法包括:基于所述待测信息数据排位信息以及所述差值构建决策矩阵,通过所述决策矩阵对所述待测信息数据拟合分数,基于所述分数获得待测信息数据与预设标准数据之间的贴近度;基于所述贴近度对所述待测信息数据进行排序,得到输出数据。
11.根据第二方面,本发明实施例提供一种风险预测装置,包括:特征预处理模块,用于获取目标对象的待测信息数据和外部影响因素信息,并基于预设标准数据及所述待测信息数据进行特征预处理,获得特征预处理数据;所述预设标准数据为已知贫困对象的信息数据;模型训练模块,用于基于所述特征预处理数据及预设的数据分析模型得到输出数据,所述输出数据为基于所述数据分析模型得到的所述特征预处理数据的排名结果信息,所述预设的数据分析模型为基于样本数据和所述外部影响因素训练生成的;综合分析模块,用于基于所述输出数据与所述预设标准数据综合分析所述目标对象的风险,得到分析结果。
12.根据第三方面,本发明实施例提供了一种风险预测设备,包括:通信单元、存储器和处理器,所述存储器和所述处理器之间互相通信连接,所述存储器中存储有计算机指令,所述处理器通过执行所述计算机指令,从而执行第一方面或任一可选实施方式所述的方法。
13.根据第四方面,本发明实施例提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机指令,所述计算机指令用于使所述计算机执行第一方面或任一可选实施方式所述的方法。
14.本发明技术方案,具有如下优点:
15.本发明实施例提供的一种风险预测方法、装置及设备,该预测方法包括:获取目标对象的待测信息数据和外部影响目标对象的因素,基于已知贫困对象的信息数据及所述待测信息数据进行特征预处理,获得特征预处理数据,基于特征预处理数据以及基于目标对象的信息数据和外部影响因素训练生成的数据分析模型,得到所述特征预处理数据的排名结果,基于所述排名结果与已知贫困对象的信息数据综合分析得到所述目标对象的风险排名信息。通过对目标对象的待测信息数据以及已知贫困对象的信息数据的处理,并基于上述信息数据处理结果结合外部影响因素综合分析得到目标对象基于待测信息数据的排名信息,能够精准的将居民分类、准确预测居民可能面临的各种风险。
附图说明
16.为了更清楚地说明本发明具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
17.图1为本发明实施例中风险预测方法的一个具体示例的流程图;
18.图2为本发明实施例中风险预测方法的聚类分布示例示意图;
19.图3为本发明实施例中风险预测方法的又一个具体示例的流程图;
20.图4为本发明实施例中风险预测装置的一个具体示例的原理框图;
21.图5为本发明实施例的风险预测设备的结构示意图。
具体实施方式
22.下面将结合附图对本发明的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
23.此外,下面所描述的本发明不同实施方式中所涉及的技术特征只要彼此之间未构成冲突就可以相互结合。
24.本发明实施例是通过对目标对象的数据信息、预设标准信息以及外部影响因素信息综合分析,得到所述目标对象的排名信息,下述各实施例仅为本发明的较佳实施例,本发明并不以此为限。
25.图1示出了根据本发明实施例的一种风险预测方法的流程图,该风险预测方法具体包括以下步骤:
26.s100:获取目标对象的待测信息数据和外部影响因素信息,并基于预设标准数据及所述待测信息数据进行特征预处理,获得特征预处理数据,所述预设标准数据为已知贫困对象的信息数据。
27.具体地,在本发明实施例中,获取居民的待测信息数据,和外部影响因素,所述待测信息数据包括但不限于家庭信息、家庭成员信息、医保数据信息,所述外部影响因素信息包括但不限于周边就业形式信息、周边地区gdp信息。基于上述数据信息以及已知贫困人员与上述数据信息相关的数据信息进行特征预处理,获得特征预处理数据。
28.s200:基于所述特征预处理数据及预设的数据分析模型得到输出数据,所述输出数据为基于所述数据分析模型得到的所述特征预处理数据的排名结果信息,所述预设的数据分析模型为基于样本数据和所述外部影响因素训练生成的。
29.具体地,在本发明实施例中,基于居民数据信息和外部影响因素训练生成数据分析模型,将所述居民数据信息以家庭信息为基础构成待测数据集合,基于所述待测数据集合以及所述特征预处理数据得到所述特征预处理数据的排名结果信息。
30.s300:基于所述输出数据与所述预设标准数据综合分析所述目标对象的风险,得到分析结果。
31.具体地,在本发明实施例中,基于所述排名结果信息与所述已知贫困人员的数据信息综合分析,得到所述居民的风险指数,以此判断所述居民是否处于具有风险的状态。
32.本发明实施例提供的一种风险预测方法,通过对目标对象的待测数据信息和外部影响因素进行特征预处理,并基于特征预处理数据与预设的数据分析模型得到特征预处理数据的排名结果信息,基于所述排名结果信息与预设标准数据综合分析判断所述目标对象是否有风险。通过对目标对象的待测数据、外部影响因素信息以及已知贫困人员的数据信息综合分析,能够准确预测目标对象是否有风险,提升了数字化治理能力,及时对具有风险的人员进行帮扶,提升居民生活技能,同时可以对形成风险的根源和内外部环境的影响因素进行全面分析,对后续预测风险提供了依据。
33.在本发明的一个可选实施例中,上述步骤s100中基于预设标准数据及所述待测信息数据进行特征预处理的方法,包括以下步骤:
34.(1)将所述待测信息数据进行分类处理,获得分类结果;
35.(2)基于所述分类结果将所述待测信息数据进行整合,获得待测信息数据合集,所
述待测信息数据合集为所述目标对象的基本信息数据。
36.具体地,在本发明实施例中,根据居民的待测信息数据进行分类,例如可以将居民的家庭信息分为一类,将居民的家庭成员相对应的信息分为一类、将居民的医保数据信息分为一类,本发明并不以此为限,基于上述分类结果将待测信息数据进行整合,获得待测信息数据合集。
37.在本发明实施例中,通过将目标对象的基本信息数据进行分类并基于分类结果将所述信息数据整合获得待测信息数据合集,可以更加清晰地基于目标对象的待测数据信息进行排序分析,提升了工作效率。
38.在本发明的一个可选实施例中,上述步骤s100中基于预设标准数据及所述待测信息数据进行特征预处理的方法,还包括以下步骤:
39.(1)基于所述待测信息数据集合进行数据处理,获得符合预设标准的数据处理集合。
40.具体地,在本发明实施例中,对所述待测信息数据集合进行数据处理,筛选所述待测信息数据集合中数据信息丰富的集合,基于筛选后的待测信息数据集合进行再次数据处理,判断筛选后的待测信息数据集合中所含的数据信息是否有空缺,若有空缺,则基于同一筛选后的待测信息数据集合的平均数值进行填充,获得符合预设标准的数据处理集合。通过对待测信息数据集合进行数据处理,可以更加清晰地基于目标对象的待测数据信息进行排序分析,提升了工作效率。在实际应用中,亦可以基于预设标准删除所述待测信息数据集合中不符合标准的数据信息,亦可以对所述待测信息数据集合进行其它相关操作以获得预设标准的数据处理集合,本发明并不以此为限。
41.在本发明的一个可选实施例中,上述步骤s100中基于所述待测信息数据进行特征预处理的过程,包括以下步骤:
42.(1)基于所述待测信息数据和所述预设标准数据组建向量矩阵;
43.(2)基于向量矩阵计算所述待测信息数据与所述预设标准数据之间的差值。
44.具体地,在本发明实施例中,如图2所示的聚类分布图,将居民的待测信息数据进行聚类,并以已知贫困人员的数据作为标准数据,以此构建向量矩阵,在向量矩阵中以已知贫困人员的数据为标准数据,精确计算待测信息数据与标准数据之间的距离差值。
45.如图3所示,在本发明的一个可选实施例中,上述步骤s200中基于所述特征预处理数据及预设的数据分析模型得到输出数据的过程,包括以下步骤:
46.s201:基于所述特征预处理数据提取第一指标数据和第二指标数据。
47.具体地,基于所述特征预处理数据提取第一指标数据i和第二指标数据j,使用stanty一致矩阵法确定i、j的分数,并进行分数梯度排名。
48.具体地,在实际应用中例如可以是下表所示分数梯度排名:
[0049][0050][0051]
s202:基于所述第一指标数据和第二指标数据构建判别矩阵,通过所述判别矩阵获取所述特征预处理数据中影响因素权重占比。
[0052]
具体地,基于所述第一指标数据和第二指标数据构建判别矩阵 a=(a
ij
)n×n,a
ij
》0,通过所述判别矩阵获得所述特征预处理数据中影响因素权重占比,并进行归一化处理得到权重系数wi/∑wi,其中wi为矩阵中各行平均数,同时通过一致性指标平均随机一致性随机一致性比率检验一致性。在实际应用中,选择权重的方式可以是因子分析和主成分法,利用数据的信息浓缩原理以及方差解释率进行权重计算;可以是ahp层次法和优序图法,此类方法利用数字的相对大小信息进行权重计算;可以是熵值法(熵权法),此类方法利用数据熵值信息即信息量大小进行权重计算;可以是critic、独立性权重和信息量权重,此类方法主要是利用数据的波动性或者数据之间的相关关系情况进行权重计算,本发明并不以此为限。
[0053]
s203:基于所述特征预处理数据中影响因素数据权重占比获得所述待测信息数据影响因素以及外部影响因素信息的排位信息。
[0054]
具体地,按照权重系数将所述特征预处理数据中各影响因素进行排序,基于所述特征预处理数据中影响因素的排序信息,获得待测信息数据以及外部影响因素的排位信息。
[0055]
s204:基于所述排位信息以及预设的数据分析模型得到所述输出数据。
[0056]
具体地,基于所述排位信息以及预设的数据分析模型,对所述待测数据信息进行排名,得到所述输出信息。
[0057]
在本发明实施例中,将基于所述特征预处理数据提取第一指标数据和第二指标数据,进行分数梯度排名,并基于所述第一指标数据和第二指标数据构建判别矩阵,得到所述特征预处理数据中影响因素权重占比,通过归一化处理获得权重系数,基于所述权重系数
将所述特征预处理数据中各影响因素进行排序,基于所述特征预处理数据中影响因素的排序信息,获得所述影响因素所对应的待测信息数据以及外部影响因素的排位信息,基于所述排位信息以及预设的数据分析模型,对所述待测数据信息进行排名获得输出信息。通过特征预处理数据获得各影响因素的权重占比,可以更加有效地基于目标对象的待测数据信息进行排序分析,提升了工作效率。
[0058]
在本发明的一个可选实施例中,上述步骤s300中基于所述待测信息数据排位信息以及预设的数据分析模型,得到所述输出数据的过程,包括以下步骤:
[0059]
(1)基于所述待测信息数据排位信息以及所述差值构建决策矩阵,通过所述决策矩阵对所述待测信息数据拟合分数,基于所述分数获得待测信息数据与预设标准数据之间的贴近度;
[0060]
(2)基于所述贴近度对所述待测信息数据进行排序,得到输出数据。
[0061]
在本发明实施例中,基于所述待测信息数据排位信息以及所述待测信息数据与标准数据之间的距离差值,构建决策矩阵,并制定5分制标准,对所述待测信息数据拟合分数,通过分数判断所述待测信息数据中影响因素是否为影响居民风险预测的主要因素,通过欧式距离计算所述待测信息数据与预设标准数据之间的贴近度,,其中,其中,基于所述贴近度对所述待测信息数据进行排序,得到输出数据。通过决策矩阵获得所述待测信息数据与预设标准数据之间的贴近度,基于贴近度对所述待测信息数据进行排名,能够更加准确的判断目标对象与已知贫困人员之间的差距,实现精准预测居民可能要面临的各种风险。
[0062]
如图4所示,本实施例提供一种风险预测装置,包括特征预处理模块1、模型训练模块2和综合分析模块3,其中:
[0063]
特征预处理模块1,用于获取目标对象的待测信息数据和外部影响因素信息,并基于预设标准数据及所述待测信息数据进行特征预处理,获得特征预处理数据,所述预设标准数据为已知贫困对象的信息数据,详细内容可以参见上述任意方法实施例的步骤s100的相关描述;
[0064]
模型训练模块2,用于基于所述特征预处理数据及预设的数据分析模型得到输出数据,所述输出数据为基于所述数据分析模型得到的所述特征预处理数据的排名结果信息,所述预设的数据分析模型为基于样本数据和所述外部影响因素训练生成的,详细内容可以参见上述任意方法实施例的步骤s200的相关描述;
[0065]
综合分析模块3,用于基于所述输出数据与所述预设标准数据综合分析所述目标对象的风险,得到分析结果,详细内容可以参见上述任意方法实施例的步骤s300的相关描述。
[0066]
本发明实施例提供的一种风险预测装置,通过对目标对象的待测数据信息和外部影响因素进行特征预处理,并基于特征预处理数据与预设的数据分析模型得到特征预处理数据的排名结果信息,基于所述排名结果信息与预设标准数据综合分析判断所述目标对象是否有风险。通过对目标对象的待测数据、外部影响因素信息以及已知贫困人员的数据信
only memory,rom)、随机存储记忆体(random accessmemory,ram)、快闪存储器(flash memory)、硬盘(hard disk drive,缩写:hdd)或固态硬盘(solid-state drive,ssd)等;所述存储介质还可以包括上述种类的存储器的组合。
[0075]
显然,上述实施例仅仅是为清楚地说明所作的举例,而并非对实施方式的限定。对于所属领域的普通技术人员来说,在上述说明的基础上还可以做出其它不同形式的变化或变动。这里无需也无法对所有的实施方式予以穷举。而由此所引伸出的显而易见的变化或变动仍处于本发明创造的保护范围之中。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1