本申请涉及电信安全,特别涉及一种反电信诈骗用户群扩增的方法及装置。
背景技术:
1、近年来,电信诈骗手段层出不穷,如通过电话、短信等媒介,对受害者进行钱财诈骗、个人信息套取等。
2、为有效打击电信诈骗行为,现有技术中存在将异常行为号码或易受害者号码存入数据库以进行识别的方法,但数据库中的数据标签是固定的,其对应的用户也是固定的、小范围的,从而无法准确识别新的异常行为号码。构建挖掘模型可以预判目标用户,但准确率低,无法用于高敏感、高精度场景。因此,亟需一种方法来大范围、准确地存储目标用户。
技术实现思路
1、基于上述问题,本申请提供了一种反电信诈骗用户群扩增的方法及装置,以大范围、准确地存储目标用户。
2、本申请公开了一种反电信诈骗用户群扩增的方法,所述方法包括:
3、对来自扩增节点的用户群进行特征提取,得到目标特征;
4、根据所述目标特征,查询数据源的所有用户中具备所述目标特征的扩增用户;
5、将所述扩增用户组成扩增用户群与所述用户群去重保存为新的用户群,并将所述新的用户群发送至所述扩增节点。
6、可选的,所述将所述扩增用户组成扩增用户群与所述用户群去重保存为新的用户群,包括:
7、解密来自扩增节点的用户群,获得第一哈希值;
8、在所述数据源的所有用户的哈希值中,查询与所述第一哈希值相同的哈希值,作为第二哈希值;
9、将所述第二哈希值在所述数据源的所有用户的哈希值中进行映射,得到映射用户群;
10、将所述映射用户群作为所述用户群,与所述扩增用户群去重保存为新的用户群。
11、可选的,在对来自扩增节点的用户群进行特征提取前,所述方法还包括:
12、通过所述数据源获取用户群;
13、对所述用户群进行加密,传输给扩增节点。
14、可选的,所述数据源包括数据库,所述通过数据源获取用户群,包括:
15、获取数据库表、表和表字段;
16、获取标签名称和标签值;
17、根据所述标签名称和所述标签值,在所述数据库表、所述表和所述表字段中查询获得用户群。
18、可选的,所述数据源包括安全文件传输协议sftp,所述通过数据源获取用户群,包括:
19、获取标签名称和标签值;
20、连接sftp,下载用户信息文件;
21、将所述标签名对应到所述用户信息文件的文件列,使用所述标签值过滤所述用户信息文件的文件行,得到用户群。
22、基于上述一种反电信诈骗用户群扩增的方法,本申请还公开了一种反电信诈骗用户群扩增的装置,包括:特征提取单元、扩增查询单元和再扩增单元;
23、所述特征提取单元,用于对来自扩增节点的用户群进行特征提取,得到目标特征;
24、所述扩增查询单元,用于根据所述目标特征,查询数据源的所有用户中具备所述目标特征的扩增用户;
25、所述再扩增单元,用于将所述扩增用户组成扩增用户群与所述用户群去重保存为新的用户群,并将所述新的用户群发送至所述扩增节点。
26、可选的,所述再扩增单元,包括:
27、解密子单元,用于解密来自扩增节点的用户群,获得第一哈希值;
28、比对子单元,用于在所述数据源的所有用户的哈希值中,查询与所述第一哈希值相同的哈希值,作为第二哈希值;
29、映射子单元,用于将所述第二哈希值在所述数据源的所有用户的哈希值中进行映射,得到映射用户群;
30、去重子单元,用于将所述映射用户群作为所述用户群,与所述扩增用户群去重保存为新的用户群。
31、可选的,所述装置还包括:
32、用户群获取单元,用于通过所述数据源获取用户群;
33、加密单元,用于对所述用户群进行加密,传输给扩增节点。
34、可选的,所述数据源包括数据库,所述用户群获取单元,包括:
35、表获取子单元,用于获取数据库表、表和表字段;
36、第一标签获取子单元,用于获取标签名称和标签值;
37、用户群获取子单元,用于根据所述标签名称和所述标签值,在所述数据库表、所述表和所述表字段中查询获得用户群。
38、可选的,所述数据源包括安全文件传输协议sftp,所述用户群获取单元,包括:
39、第二标签获取子单元,用于获取标签名称和标签值;
40、下载子单元,用于连接sftp,下载用户信息文件;
41、映射用户群获取子单元,用于将所述标签名对应到所述用户信息文件的文件列,使用所述标签值过滤所述用户信息文件的文件行,得到用户群。
42、本申请公开了一种反电信诈骗用户群扩增的方法及装置。根据对来自扩增节点的用户群进行特征提取,得到目标特征。根据所述目标特征,查询数据源的所有用户中具备所述目标特征的扩增用户。将所述扩增用户组成扩增用户群与所述用户群去重保存为新的用户群,并将所述新的用户群发送至所述扩增节点。支持多节点集群部署,通过互相传递的用户群,不断扩充用户群中的样本,显著地提升了目标用户的样本量,从而显著地提升了后续识别操作的范围。不采用预测方式,保证了目标用户存储的准确性。且为反电信诈骗场景提供了一种通用的扩样方法。
1.一种反电信诈骗用户群扩增的方法,其特征在于,包括:
2.根据权利要求1所述的方法,其特征在于,所述将所述扩增用户组成扩增用户群与所述用户群去重保存为新的用户群,包括:
3.根据权利要求1所述的方法,其特征在于,在对来自扩增节点的用户群进行特征提取前,所述方法还包括:
4.根据权利要求3所述的方法,其特征在于,所述数据源包括数据库,所述通过数据源获取用户群,包括:
5.根据权利要求3所述的方法,其特征在于,所述数据源包括安全文件传输协议sftp,所述通过数据源获取用户群,包括:
6.一种反电信诈骗用户群扩增的装置,其特征在于,包括:特征提取单元、扩增查询单元和再扩增单元;
7.根据权利要求6所述的装置,其特征在于,所述再扩增单元,包括:
8.根据权利要求6所述的装置,其特征在于,所述装置还包括:
9.根据权利要求8所述的装置,其特征在于,所述数据源包括数据库,所述用户群获取单元,包括:
10.根据权利要求8所述的装置,其特征在于,所述数据源包括安全文件传输协议sftp,所述用户群获取单元,包括: