本发明涉及企业数据处理,特别涉及一种企业经营风险的评估方法、介质及装置。
背景技术:
1、在企业的发展过程中,需要对企业的经营风险及异常预判并采取补救措施。
2、在现有技术中,比如专利公开号为cn115131039b的基于非线性降维的企业风险评估方法、计算机设备及存储介质,通过结合专业人员的分析经验,有效地量化企业的经营健康程度,并提供多因素、可解释的企业风险评估结果;又如专利公开号为cn110135689a的企业经营风险预警方法装置及计算机可读存储介质,通过对bp神经网络模型进行训练来得到企业经营风险预警模型。但上述专利所公开的技术在实际应用中,其企业经营风险的预测准确率较低,且波动性较大。
技术实现思路
1、为了解决现有技术的上述问题,本发明提供一种企业经营风险的评估方法、介质及装置,能够保证企业经营风险的预测准确率和稳定性。
2、为了达到上述目的,本发明采用的技术方案为:
3、第一方面,本发明提供一种企业经营风险的评估方法,包括:
4、步骤s1、获取大环境因素相关的大环境文本内容,基于大语言模型对所述大环境文本内容进行命名实体识别以得到大环境实体信息,并且进行语义情感分析以得到大环境影响分级,形成包括所述大环境实体信息和大环境影响分级的大环境度量数据;
5、步骤s2、获取企业基本信息数据、企业业务数据以及企业风险及异常判定数据,得到企业度量数据;
6、步骤s3、将行业分类和地区编码作为关联字段,以将所述大环境度量数据和所述企业度量数据进行关联,得到待训练数据集,其中,所述待训练数据集中每一个样本数据均包括作为输入数据的企业基本信息数据、企业业务数据和大环境度量数据以及作为输出数据的企业风险及异常判定数据;
7、步骤s4、基于所述待训练数据集对神经网络模型进行训练,以得到训练好的企业经营风险评估模型;
8、步骤s5、将企业实时的大环境度量数据、实时的企业基本信息数据和实时的企业业务数据输入到企业经营风险评估模型,得到该企业的经营风险;
9、所述步骤s1包括:
10、获取大环境因素相关的大环境文本内容,所述大环境因素包括政府政策和风险事件;
11、在大语言模型中输入第一提示内容以及所述大环境文本内容,使得所述大语言模型对所述大环境文本内容进行命名实体识别以得到大环境实体信息,所述第一提示内容包括需要进行命名实体识别的说明以及需要生成的实体对象,所述实体对象包括大环境因素、影响行业、影响区域和影响持续时间;
12、在大语言模型中输入第二提示内容以及所述大环境文本内容,使得所述大语言模型对所述大环境文本内容进行语义情感分析以得到大环境影响分级,所述第二提示内容包括需要进行语义情感分析的说明以及需要生成的情感内容;
13、汇总所述大环境实体信息和大环境影响分级,得到大环境度量数据。
14、本发明的有益效果在于:本发明将大环境因素转换为大环境度量数据,并通过行业分类和地区编码与企业度量数据进行关联,将关联后的数据集进行神经网络模型的训练,从而避免了大环境因素影响所带来的企业经营冲击,消除了只在业务数据边界内去评估企业经营异常和风险的局限,能以更高的视角进行审视和分析深层次原因,保证了企业经营风险的预测准确率和稳定性。同时,在考虑大环境因素时,通过大语言模型对大环境文本内容进行命名实体识别,并基于语义情感分析以得到大环境影响分级,从而避免用户的主观判断所带来的主观偏差,使得大环境度量数据更加客观、合理且可靠。
15、可选地,所述步骤s2中还包括:
16、获取企业基本信息数据中的企业唯一标识,将所述企业唯一标识中的旧版统一信用代码按照编码转换关系,批量转换更新为新版统一信用代码,将所述企业唯一标识中的工商注册号按照编码映射关系,批量转换更新为新版统一信用代码;
17、对每一个企业中的企业唯一标识进行重复数据和异常数据的清理转换,使得每一个企业主键都是唯一且属于同一类别。
18、根据上述描述可知,实现企业主键的统一。
19、可选地,所述步骤s2中还包括:
20、获取预设的风险异常分级分类表,在将企业风险及异常判定数据与企业唯一标识进行关联时,以所述风险异常分级分类表中的分类等级作为选择优先级,通过coalesce函数对所有企业风险及异常判定数据进行判断,以得到最终的关联关系。
21、根据上述描述可知,能够消除企业风险和异常判断数据冲突或重复的信息。
22、可选地,所述步骤s4包括:
23、获取预先设计好的多层感知机;
24、按照初始训练超参数和所述待训练数据集对预先设计好的多层感知机进行训练,在训练过程中根据预测效果进行训练超参数调整,最终得到符合预期效果的企业经营风险评估模型,所述初始训练超参数包括迭代轮数epochs:100-200轮,batch大小:32-128,初始化学习率:0.01,dropout:丢弃概率取0.2。
25、根据上述描述可知,初始训练超参数的设置使得多层感知机的训练效果较佳,且有助于防止模型过拟合。
26、可选地,所述多层感知机使用交叉熵损失函数和adam优化器,其包括:
27、输入层,其神经元数量与所述输入数据的样本特征数量一致;
28、隐藏层,设置为2层,分别为8个神经元和4个神经元,且使用relu激活函数;
29、以及输出层,使用softmax激活函数。
30、可选地,所述步骤s4之后还包括:
31、步骤s6、加载所述企业经营风险评估模型的评估模式,存储在变量model中,分析所述企业经营风险评估模型中各层权重的矩阵,并将每个特征对应的权重保存到一个python字典feature_weights中,根据所述feature_weights、所述企业经营风险评估模型中输入层的各个特征所对应的名称以及所述输入数据中每一列特征的列名形成一可视化分析图,所述可视化分析图中可视化显示输入数据中每一个特征在所述企业经营风险评估模型中的影响权重和组合方式;
32、其中,步骤s5和步骤s6为并联关系。
33、可选地,所述步骤s6之后还包括:
34、步骤s7、基于所述可视化分析图,生成并输出在预设时间周期内企业风险的内外原因组合关系和影响程度分析的结论文档。
35、第二方面,本发明提供一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被执行时,实现第一方面的一种企业经营风险的评估方法。
36、第三方面,本发明提供一种企业经营风险的评估装置,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现第一方面的一种企业经营风险的评估方法。
37、其中,第二方面所提供一种计算机可读存储介质以及第三方面所提供的一种企业经营风险的评估装置所对应的技术效果参照第一方面所提供的一种企业经营风险的评估方法的相关描述。