本发明属于深度学习与评估学的交叉领域,尤其涉及基于主客观信息融合表示的行为危险倾向预测方法及系统。
背景技术:
1、本部分的陈述仅仅是提供了与本发明相关的背景技术信息,不必然构成在先技术。
2、行为预测的方法可以分为两类:医学临床评估和统计学评估。其中,医学临床评估需要专业的心理学人士进行临床观测,评定结果很大程度上依赖于评估者的理论知识水平以及实际观察,此方法评估效率较低,在推广方面也存在着一定的难度。统计学评估具有可量化、评价标准明确的特点,这种方法综合考虑了与行为危险倾向等级相关联的多维度变量,评估结果更加准确。
3、现有的行为危险倾向预测方法存在如下缺陷:
4、在危险倾向预测中,特征选择是一个关键的步骤。它涉及从原始数据中提取出有意义的特征,供模型学习和预测使用。特征选择的挑战之一是在原始数据中识别与目标行为相关的特征,同时排除那些无关或冗余的特征。传统方法往往很难解决这个问题,当选择过多或不相关的特征时,可能会导致维度灾难,使模型变得更加复杂,增加计算成本,并可能导致过拟合,降低模型的泛化能力。
5、另外,很难有一种算法能适用于所有情况。因此在选择模型时需要考虑到具体的问题和数据特征。错误的模型选择可能导致性能下降或预测结果的不准确性。然而,现有行为危险倾向预测方法大多采用固定算法进行行为预测,针对不同行为预测对象以及不同环境的适用性差。
技术实现思路
1、为了解决上述背景技术中存在的至少一项技术问题,本发明提供基于主客观信息融合表示的行为危险倾向预测方法及系统,其通过深度学习的方式,实现对主客观信息的综合利用,降低人为因素的影响,以期对行为危险倾向进行全面客观地评估,节省人力物力,提高评估效率。
2、为了实现上述目的,本发明采用如下技术方案:
3、本发明的第一个方面提供基于主客观信息融合表示的行为倾向预测方法,包括如下步骤:
4、获取待预测对象的主观信息和客观信息,处理得到待预测对象的主客观融合信息;
5、结合主客观融合信息和训练好的数据重构网络,得到对应的重构数据;
6、将重构数据划分成多个数据子集;对每个子集中应用存储在算法仓中的分类算法,通过评价指标的衡量为每个数据子集选择最优算法,并打上算法标签,以带标签的数据为基础构建数据库;
7、基于训练好的数据重构网络,分别对存储在数据库的数据和待预测对象的数据进行编码,得到相应的数据编码,基于相应的数据编码,通过最近邻节点算法对两者进行比对,并选择与数据适配度最高的分类算法,应用该分类算法得到待评估对象的行为倾向预测结果。
8、本发明的第二个方面提供基于主客观信息融合表示的行为危险倾向预测系统,包括:
9、数据处理模块,其用于获取待评估对象的主观信息和客观信息,处理得到待评估对象的主客观融合信息;
10、编码模块,其用于结合主客观融合信息和训练好的数据重构网络,得到对应的重构数据;
11、数据库构建模块,其用于将重构数据划分成多个数据子集;对每个数据子集应用存储在算法仓中的分类算法,通过评价指标的衡量为每条数据选择最优算法,并打上算法标签,以带标签的数据为基础构建数据库;
12、等级评估模块,其用于基于训练好的数据重构网络,分别对存储在数据库的数据和待预测对象的数据进行编码,得到相应的数据编码,基于相应的数据编码,通过最近邻节点算法对两者进行比对,并选择与数据适配度最高的分类算法,应用该分类算法得到待评估对象的行为倾向预测结果。
13、本发明的第三个方面提供一种计算机可读存储介质。
14、一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如第一方面所述的一种基于主客观信息融合表示的行为危险倾向预测方法中的步骤。
15、本发明的第四个方面提供一种计算机设备。
16、一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如第一方面所述的一种基于主客观信息融合表示的行为危险倾向预测方法中的步骤。
17、与现有技术相比,本发明的有益效果是:
18、1、本发明采用开放型模型,该模型对原始数据的预处理、数据重构、算法仓所存储的算法和数据比对与算法选择方式等都是可选择的,可以适用于不同评估对象,应对不同环境,以及不同主客观信息,从而使该算法的泛化能力得到提高。
19、2、本发明采用主客观融合信息表示进行行为预测,降低人为因素对评估结果的影响,提升了行为预测的准确率。
20、本发明附加方面的优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本发明的实践了解到。
1.一种基于主客观信息融合表示的行为危险倾向预测方法,其特征在于,包括如下步骤:
2.如权利要求1所述的一种基于主客观信息融合表示的行为危险倾向预测方法,其特征在于,所述自编码器的训练过程为:采用数据重构网络进行训练,所述数据重构网络包括编码器和解码器,将待评估对象的主客观融合信息作为编码器的输入,输出数据编码;将数据编码作为解码器的输入,输出重构数据,通过最小化重构数据与输入数据的特征距离,指导编码器输出数据编码。
3.如权利要求1所述的一种基于主客观信息融合表示的行为危险倾向预测方法,其特征在于,所述将重构数据划分成多个数据子集时,采用k均值算法。
4.如权利要求1所述的一种基于主客观信息融合表示的行为危险倾向预测方法,其特征在于,所述将重构数据划分成多个数据子集时,具体包括:随机选择初始聚类中心,计算各数据与聚类中心的余弦距离,依据最近距离原则,为数据分组,并以组为单位计算出新的聚类中心;迭代更新聚类中心,直到其保持不变或在一定范围波动。
5.如权利要求1所述的一种基于主客观信息融合表示的行为危险倾向预测方法,其特征在于,所述算法仓中的分类算法包括对点排序聚类算法,朴素贝叶斯算法、c4.5算法和随机森林算法。
6.如权利要求1所述的一种基于主客观信息融合表示的行为危险倾向预测方法,其特征在于,所述评价指标包括分类的准确率和微观f1。
7.如权利要求1所述的一种基于主客观信息融合表示的行为危险倾向预测方法,其特征在于,所述通过最近邻节点算法对两者进行比对时,计算与测试数据最相似的前n条数据库数据,通过多数投票的方式选出得票数最高的算法用于此次评估。
8.一种基于主客观信息融合表示的行为危险倾向预测系统,其特征在于,包括:
9.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1-7中任一项所述的一种基于主客观信息融合表示的行为危险倾向预测方法中的步骤。
10.一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1-7中任一项所述的一种基于主客观信息融合表示的行为危险倾向预测方法中的步骤。