本技术涉及计算机,具体涉及一种对象检测方法、装置、设备和可读存储介质。
背景技术:
1、随着资源转移业务的开拓,实现境内外的对象之间的资源转移。为了提高境内外的资源转移业务的安全性,需要对境内外的资源转移事件的商户/机构进行异常识别。
2、相关技术通过人工分析现有的境内外的资源转移异常案例,并提取出资源转移异常案例中的资源转移特征,从而,根据资源转移特征去识别参与境内外资源转移事件的其他异常对象。
3、在对现有技术的研究和实践过程中,本技术的发明人发现现有技术在识别其他异常对象时,需要花费大量的人力成本提取出资源转移特征,效率低,且仅考虑案例中的资源转移特征,这使得在识别异常对象时具有局限性,降低了异常对象识别的准确度,影响了资源转移的安全性。
技术实现思路
1、本技术实施例提供一种对象检测方法、装置、设备和可读存储介质,无需通过人工方式从样本数据中提取资源转移特征,且结合样本的多维特征来识别出其他对象,提高对象识别的准确度,确保了后续资源转移的安全性。
2、本技术实施例提供一种对象检测方法,包括:
3、获取样本目标对象在资源转移时的样本目标属性和样本描述文本,以及获取待检测对象在资源转移时的待检测属性和待检测描述文本;
4、根据所述待检测描述文本与所述样本描述文本之间的文本相似度确定文本特征值,以及根据所述待检测属性与所述样本目标属性之间的相同属性确定属性特征值;
5、将所述文本特征值和属性特征值进行拼接得到多维特征矩阵,所述多维特征矩阵包含所述待检测对象在不同特征维度上的特征值;
6、根据所述样本目标属性和样本描述文本构建多个样本特征变量,并按照分箱算法计算出每个样本特征变量的特征子变量权重最大的目标分箱阈值区间;
7、从所述多维特征矩阵中提取在所述每个样本特征变量维度下的目标特征值,并根据每个目标特征值与对应的目标分箱阈值区间之间的分布关系计算所述待检测对象的转移分值;
8、根据所述转移分值确定所述待检测对象的检测结果。
9、相应的,本技术实施例提供一种对象检测装置,包括:
10、获取单元,用于获取样本目标对象在资源转移时的样本目标属性和样本描述文本,以及获取待检测对象在资源转移时的待检测属性和待检测描述文本;
11、确定单元,用于根据所述待检测描述文本与所述样本描述文本之间的文本相似度确定文本特征值,以及根据所述待检测属性与所述样本目标属性之间的相同属性确定属性特征值;
12、拼接单元,用于将所述文本特征值和属性特征值进行拼接得到多维特征矩阵,所述多维特征矩阵包含所述待检测对象在不同特征维度上的特征值;
13、构建单元,用于根据所述样本目标属性和样本描述文本构建多个样本特征变量,并按照分箱算法计算出每个样本特征变量的特征子变量权重最大的目标分箱阈值区间;
14、计算单元,用于从所述多维特征矩阵中提取在所述每个样本特征变量维度下的目标特征值,并根据每个目标特征值与对应的目标分箱阈值区间之间的分布关系计算所述待检测对象的转移分值;
15、检测单元,用于根据所述转移分值确定所述待检测对象的检测结果。
16、在一些实施方式中,所述确定单元,还用于:
17、确定所述待检测描述文本与所述样本描述文本之间在向量上的文本相似度;
18、根据所述文本相似度确定所述待检测描述文本在特征维度上的文本特征值。
19、在一些实施方式中,所述确定单元,还用于:
20、对所述样本描述文本进行向量化表示,得到样本文本向量;
21、对所述待检测描述文本进行向量化表示,得到待检测文本向量;
22、对所述样本文本向量与所述待检测文本向量进行余弦相似度计算,得到所述待检测描述文本的文本相似度。
23、在一些实施方式中,所述确定单元,还用于:
24、根据词性信息对所述样本描述文本进行分词处理,得到多个词信息;
25、查询每个词信息对应的词向量;
26、对多个词向量进行求和并正则化处理,得到样本文本向量。
27、在一些实施方式中,所述样本目标对象的数量为多个,所述确定单元,还用于:
28、对所述待检测描述文本与每个样本目标对象关联的样本描述文本之间进行文本相似度计算,得到多个文本相似度;
29、从多个文本相似度中选取数值最大的目标文本相似度;
30、根据所述目标文本相似度确定所述待检测描述文本在特征维度上的文本特征值。
31、在一些实施方式中,所述确定单元,还用于:
32、确定所述待检测属性与所述样本目标属性之间相同属性的目标属性数量;
33、根据所述目标属性数量确定所述待检测属性在特征维度上的属性特征值。
34、在一些实施方式中,所述构建单元,还用于:
35、对每个样本特征变量进行特征分箱处理,得到多个分箱阈值区间;
36、读取所述每个样本特征变量在每个分箱阈值区间的响应数值和非响应数值,并根据所述响应数值和非响应数值计算所述每个分箱阈值区间的特征子变量权重;
37、从多个所述分箱阈值区间中选取所述特征子变量权重最大的目标分箱阈值区间。
38、在一些实施方式中,所述对象检测装置还包括选取单元,用于:
39、对多个所述特征子变量权重进行加权求和,得到每个样本特征变量对应的信息量系数;
40、根据多个信息量系数之间的大小关系,选取目标样本特征变量;
41、则所述计算单元,还用于从所述多维特征矩阵中提取在所述目标样本特征变量维度下的目标特征值。
42、在一些实施方式中,所述计算单元,还用于:
43、读取每个目标分箱阈值区间中的区间边界值,并根据所述区间边界值确定每个目标分箱阈值区间对应的特征分类阈值;
44、根据所述目标特征值与对应的特征分类阈值之间对比结果,确定所述目标特征值的特征分值系数;
45、根据所述目标特征值关联的特征类别确定对应的特征分值权重,并将所述特征分值权重与所述特征分值系数进行加权求和,得到所述待检测对象的转移分值。
46、在一些实施方式中,所述获取单元,还用于:
47、获取待检测对象在目标时长内的资源转移数据;
48、从所述资源转移数据中提取所述待检测对象在资源转移时的待检测属性;
49、从所述资源转移数据中遍历提取文本语句,并根据每个文本语句的出现频次依序选取目标数量的目标文本语句;
50、对所述目标数量的目标文本语句进行拼接,得到所述待检测对象在资源转移时的待检测描述文本。
51、此外,本技术实施例还提供一种计算机设备,包括处理器和存储器,所述存储器存储有计算机程序,所述处理器用于运行所述存储器内的计算机程序实现本技术实施例提供的任一种对象检测方法中的步骤。
52、此外,本技术实施例还提供一种计算机可读存储介质,所述计算机可读存储介质存储有多条指令,所述指令适于处理器进行加载,以执行本技术实施例所提供的任一种对象检测方法中的步骤。
53、此外,本技术实施例还提供一种计算机程序产品,包括计算机指令,所述计算机指被执行时实现本技术实施例所提供的任一种对象检测方法中的步骤。
54、本技术实施例可以获取样本目标对象在资源转移时的样本目标属性和样本描述文本,以及获取待检测对象在资源转移时的待检测属性和待检测描述文本;根据待检测描述文本与样本描述文本之间的文本相似度确定文本特征值,以及根据待检测属性与样本目标属性之间的相同属性确定属性特征值;将文本特征值和属性特征值进行拼接得到多维特征矩阵,多维特征矩阵包含待检测对象在不同特征维度上的特征值;根据样本目标属性和样本描述文本构建多个样本特征变量,并按照分箱算法计算出每个样本特征变量的特征子变量权重最大的目标分箱阈值区间;从多维特征矩阵中提取在每个样本特征变量维度下的目标特征值,并根据每个目标特征值与对应的目标分箱阈值区间之间的分布关系计算待检测对象的转移分值;根据转移分值确定待检测对象的检测结果。由此可得,本方案可分别获取样本目标对象待检测对象的结构化的属性数据和非结构化的文本数据,并根据待检测对象与样本目标对象之间的结构化数据特征值和非结构化数据特征值来拼接,以构建待检测对象的多维特征矩阵,然后,对样本目标对象的结构化数据和非结构化数据转换为特变量,并通过分箱处理方式确定每个特征变量的最大特征子变量权重得目标分箱阈值区间,最后,根据多维特征矩阵中的特征值与目标分箱阈值区间分布关系来计算待检测对象的转移分值,以通过转移分值来表示待检测对象是否存在风险;以此,无需通过人工方式从样本数据中提取特征,且可结合结构化和非结构化的数据来构建多维特征,以用过多维特征来检测出其他对象,提高对象识别的准确度,确保了后续资源转移的安全性。