本发明属于电信业务,特别涉及一种基于tf-idf算法的电信订单拦截方法、系统、设备及存储介质。
背景技术:
1、电信运营商的批量生成订单的过程,存在同一个人购买同时购买多张电信卡的行为,为了避免恶意下单购买,需要针对订单数据进行分析,确定规则,并识别异常订单行为并进行拦截。
2、针对从不同渠道汇聚过来的用户订单,主要有:订单号,客户姓名,客户手机号码,收货人姓名,收货人联系电话,收货地址,商品名称,下单时间,入网号码等。通过手机号码、收货地址、身份证号的黑名单限制方式判断不能满足全部拦截要求;而通过人工的判断工作量非常大。故急需一种自动判断订单异常的方法。
技术实现思路
1、针对上述的问题,本发明提供一种基于tf-idf算法的电信订单拦截方法、系统、设备及存储介质,该方法包括:
2、获取用户订单,所述用户订单包括客户姓名、客户手机号码、收货人姓名、收货人手机号码以及收货地址;
3、判断所述用户订单是否位于黑名单内,若存在于所述黑名单内,则进行拦截;
4、若不存在于所述黑名单内,则采用tf-idf余弦相似度算法确定所述收货地址和历史收货地址的相似度;
5、基于预设阈值确定所述收货地址与所述历史收货地址是否匹配;
6、若匹配,则进行拦截;若不匹配,则所述用户订单通过并生产。
7、优选的是,采用tf-idf余弦相似度算法确定所述收货地址和历史收货地址的相似度包括:
8、采用tf-idf模型,分别确定所述收货地址句子特征向量和所述历史收货地址句子特征向量;
9、采用余弦距离分析法确定所述收货地址句子特征向量和所述历史收货地址句子特征向量。
10、优选的是,采用tf-idf模型,确定所述收货地址的句子向量包括:
11、tf-idf值分别定义为:
12、tf=词在句子中出现的次数/该句子的总词数;
13、idf=log(历史收货地址中的句子总数/(包含该词的句子数+1));
14、tf-idf=tf*idf;
15、采用tf-idf模型对所述句子中包含的词进行加权平均,得到所述收货地址句子特征向量和所述历史收货地址句子特征向量。
16、优选的是,采用余弦距离分析法确定所述收货地址的句子向量与所述历史收货地址的句子向量的相似度包括:
17、
18、式中:ai和bi分别为收货地址句子特征向量和历史收货地址句子特征向量。
19、本发明实施例提供的一种基于tf-idf算法的电信订单拦截的系统,包括:
20、获取模块,用于获取用户订单,所述用户订单包括客户姓名、客户手机号码、收货人姓名、收货人手机号码以及收货地址;
21、判断模块,用于判断所述用户订单是否位于黑名单内,若存在于所述黑名单内,则进行拦截;若不存在于所述黑名单内,则采用tf-idf余弦相似度算法确定所述收货地址和历史收货地址的相似度;
22、匹配模块,用于基于预设阈值确定所述收货地址与所述历史收货地址是否匹配;若匹配,则进行拦截;若不匹配,则所述用户订单通过并生。
23、优选的是,采用tf-idf余弦相似度算法确定所述收货地址和历史收货地址的相似度包括:
24、采用tf-idf模型,分别确定所述收货地址句子特征向量和所述历史收货地址句子特征向量;
25、采用余弦距离分析法确定所述收货地址句子特征向量和所述历史收货地址句子特征向量。
26、优选的是,采用tf-idf模型,确定所述收货地址的句子向量包括:
27、tf-idf值分别定义为:
28、tf=词在句子中出现的次数/该句子的总词数;
29、idf=log(历史收货地址中的句子总数/(包含该词的句子数+1));
30、tf-idf=tf*idf;
31、采用tf-idf模型对所述句子中包含的词进行加权平均,得到所述收货地址句子特征向量和所述历史收货地址句子特征向量。
32、优选的是,采用余弦距离分析法确定所述收货地址的句子向量与所述历史收货地址的句子向量的相似度包括:
33、
34、式中:ai和bi分别为收货地址句子特征向量和历史收货地址句子特征向量。
35、本发明实施例提供的一种设备,包括至少一个处理单元以及至少一个存储单元,其中,所述存储单元存储有程序,当所述程序被所述处理单元执行时,使得所述处理单元执行上述所述的方法。
36、本发明实施例提供的一种计算机可读存储介质,其存储有可由电子设备执行的计算机程序,当所述程序在所述电子设备上运行时,使得所述电子设备执行上述所述的方法。
37、与原有技术相比,本发明的有益效果为:
38、本发明增加了针对收货地址的相似度的规则拦截,从而提升异常订单拦截的准确性。
1.一种基于tf-idf算法的电信订单拦截方法,其特征在于,包括:
2.根据权利要求1所述的基于tf-idf算法的电信订单拦截方法,其特征在于,采用tf-idf余弦相似度算法确定所述收货地址和历史收货地址的相似度包括:
3.根据权利要求2所述的基于tf-idf算法的电信订单拦截方法,其特征在于,采用tf-idf模型,确定所述收货地址的句子向量包括:
4.根据权利要求3所述的基于tf-idf算法的电信订单拦截方法,其特征在于,采用余弦距离分析法确定所述收货地址的句子向量与所述历史收货地址的句子向量的相似度包括:
5.一种基于tf-idf算法的电信订单拦截系统,其特征在于,包括:
6.根据权利要求5所述的基于tf-idf算法的电信订单拦截系统,其特征在于,采用tf-idf余弦相似度算法确定所述收货地址和历史收货地址的相似度包括:
7.根据权利要求6所述的基于tf-idf算法的电信订单拦截系统,其特征在于,采用tf-idf模型,确定所述收货地址的句子向量包括:
8.根据权利要求7所述的基于tf-idf算法的电信订单拦截系统,其特征在于,采用余弦距离分析法确定所述收货地址的句子向量与所述历史收货地址的句子向量的相似度包括:
9.一种设备,其特征在于,包括至少一个处理单元以及至少一个存储单元,其中,所述存储单元存储有计算机程序,当所述程序被所述处理单元执行时,使得所述处理单元执行权利要求1~4任一权利要求所述的方法。
10.一种存储介质,其特征在于,其存储有可由电子设备执行的计算机程序,当所述程序在所述电子设备上运行时,使得所述电子设备执行权利要求1~4任一权利要求所述的方法。