本申请涉及一种处理方法及电子设备。
背景技术:
1、随机机器学习技术的快速发展,机器学习模型的应用越来越广泛。但是,机器学习模型通常无法自适应样本数量的极端不平衡,在样本数量极端不平衡的情况下,通常很难形成很好的训练效果。
技术实现思路
1、本申请提供了一种处理方法及电子设备,本申请实施例采用的技术方案如下所示。
2、本申请第一方面提供了一种处理方法,包括:
3、获取待检测信息;
4、根据所述待检测信息,基于智能引擎,确定所述待检测信息为第一类信息的概率;
5、其中,所述智能引擎包括合成第一类信息的样本。
6、在一些实施例中,根据所述待检测信息,基于智能引擎,确定所述待检测信息为第一类信息的概率,包括:
7、对所述待检测信息进行预处理,获取待检特征矩阵;
8、对待检特征矩阵进行特征提取,获取待检参量;
9、通过智能引擎基于所述待检参量,确定所述待检测信息为第一类信息的概率。
10、在一些实施例中,所述智能引擎包括多级模块;通过智能引擎基于所述待检参量,确定所述待检测信息为第一类信息的概率,包括:
11、通过所述智能引擎的第t级模块输出用于表征所述待检测信息为第一类信息的概率的t级类参量;其中,t为正整数;
12、将所述t级类参量和所述待检参量拼接,形成第t+1级模块的输入参量;
13、通过第t+1级模块基于所述输入参量,输出表征所述待检测信息为第一类信息的概率的t+1级类参量。
14、在一些实施例中,对待检特征矩阵进行特征提取,获取待检参量,包括:
15、通过k个大小不同的窗口对待检特征矩阵进行特征提取,获取k个大小不同的待检参量,k为正整数。
16、在一些实施例中,所述方法还包括:
17、获取第一样本和第二样本;所述第一样本属于第一类信息,所述第二样本属于不同于所述第一类信息的第二类信息;
18、分别对所述第一样本和所述第二样本进行特征提取,分别获取第一样本参量和第二样本参量;
19、平衡所述第一样本参量和所述第二样本参量的数量;
20、基于平衡后的所述第一样本参量和所述第二样本参量,构建训练数据集;
21、基于所述训练数据集对所构建的模型进行训练,形成所述智能引擎。
22、在一些实施例中,平衡所述第一样本参量和所述第二样本参量的数量,包括:
23、增加所述第一样本参量的数量,以平衡所述第一样本参量和所述第二样本参量。
24、在一些实施例中,增加所述第一样本参量的数量,包括:
25、通过支持向量机对所述第一样本参量和所述第二样本参量进行预分类,确定分类超平面;
26、构建与所述分类超平面的向量距离小于第一阈值的第一样本参量,以增加所述第一样本参量的数量。
27、在一些实施例中,平衡所述第一样本参量和所述第二样本参量的数量,包括:
28、减少所述第二样本参量的数量,以平衡所述第一样本参量和所述第二样本参量。
29、在一些实施例中,减少所述第二样本参量的数量,包括:
30、通过支持向量机对所述第一样本参量和所述第二样本参量进行预分类,确定分类超平面;
31、去除与所述分类超平面的向量距离大于第二阈值的第二样本参量,以减少所述第二样本参量的数量。
32、本申请第二方面提供了一种电子设备,包括:
33、获取模块,用于获取待检测信息;
34、确定模块,用于根据所述待检测信息,基于智能引擎,确定所述待检测信息为第一类信息的概率;
35、其中,所述智能引擎包括合成第一类信息的样本。
36、本申请实施例的处理方法,所利用智能引擎在训练过程中通过合成属于第一类信息的样本,来平衡训练数据集中属于第一类信息的样本和属于第二类信息的样本的数量,从而保证的智能引擎具有较好的训练效果,进而保证了智能引擎的检测结果具有较高的准确性。在实际使用过程中,通过获取待检测信息,根据所述待检测信息,基于智能引擎,确定所述待检测信息为第一类信息的概率,检测结果准确,能够用于检测用户投诉概率,进而使得厂商或服务商能够提前干预用户投诉概率较高的工单或订单,降低用户投诉率,降低售后运维成本,有益于提高用户满意度。
1.一种处理方法,包括:
2.根据权利要求1所述的方法,根据所述待检测信息,基于智能引擎,确定所述待检测信息为第一类信息的概率,包括:
3.根据权利要求2所述的方法,所述智能引擎包括多级模块;通过智能引擎基于所述待检参量,确定所述待检测信息为第一类信息的概率,包括:
4.根据权利要求2所述的方法,对待检特征矩阵进行特征提取,获取待检参量,包括:
5.根据权利要求1所述的方法,所述方法还包括:
6.根据权利要求5所述的方法,平衡所述第一样本参量和所述第二样本参量的数量,包括:
7.根据权利要求6所述的方法,增加所述第一样本参量的数量,包括:
8.根据权利要求5所述的方法,平衡所述第一样本参量和所述第二样本参量的数量,包括:
9.根据权利要求8所述的方法,减少所述第二样本参量的数量,包括:
10.一种电子设备,包括: