本发明涉及数据处理,尤其涉及一种刷单行为确定方法。
背景技术:
1、随着电商行业的飞速发展,为提高物品提供方的成交量,物品提供方可能会进行刷单。目前的刷单行为主要是依靠寄送空包件或是提供不真实的寄件信息。但是,随着刷单产业链的逐渐升级,刷单行为下的快件不仅可以提供相应的寄件信息,还会在快件中装入一根橡皮筋、一张纸等方式掩饰刷单行为。
2、针对上述刷单行为,现有的对于刷单行为的识别方式主要是依靠快递员对疑似刷单行为的快件的重量、寄件费用等特征进行人工经验的判定,但是,基于上述方式确定是否存在刷单行为,容易出现对刷单行为的误判。另外,在大量快件中识别刷单快件,也会出现识别快件的覆盖范围不全,即查全率低的问题。同时,基于上述方式识别刷单行为识别效率也较低。
技术实现思路
1、本发明提供了一种刷单行为确定方法,解决了现有技术中需要依靠人工经验识别刷单行为导致的较高误判率和较低查全率以及识别效率低的问题,提高了刷单行为识别的准确度和效率。
2、根据本发明的一方面,提供了一种刷单行为确定方法,该方法包括:
3、获取待寄件在至少一个预设特征下所对应的特征数值,其中,至少一个预设特征包括待寄件的产品类型特征、寄件重量特征、寄件用户特征、所属平台标识特征、寄件费用特征、寄件优惠率特征以及待寄件所属寄件用户在预设时长内的平均寄件量特征中的至少一个;
4、依据每个预设特征所对应的特征数值,确定在每个预设特征下所对应的目标分箱;其中,每个预设特征包括至少一个待选择分箱,待选择分箱对应于不同的数值范围,待选择分箱是基于历史特征数据和目标算法确定的;
5、依据目标分箱所对应的待使用风险评估值,确定待寄件的目标风险评估值;
6、当目标风险评估值大于预设风险评估值阈值时,确定待寄件为刷单行为下的快件。
7、根据本发明的另一方面,提供了一种刷单行为确定装置,该装置包括:
8、特征数值获取模块,用于获取待寄件在至少一个预设特征下所对应的特征数值,其中,至少一个预设特征包括待寄件的产品类型特征、寄件重量特征、寄件用户特征、所属平台标识特征、寄件费用特征、寄件优惠率特征以及待寄件所属寄件用户在预设时长内的平均寄件量特征中的至少一个;
9、目标分箱确定模块,用于依据每个预设特征所对应的特征数值,确定在每个预设特征下所对应的目标分箱;其中,每个预设特征包括至少一个待选择分箱,待选择分箱对应于不同的数值范围,待选择分箱是基于历史特征数据和目标算法确定的;
10、评估值确定模块,用于依据目标分箱所对应的待使用风险评估值,确定待寄件的目标风险评估值;
11、刷单行为识别模块,用于当目标风险评估值大于预设风险评估值阈值时,确定待寄件为刷单行为下的快件。
12、根据本发明的另一方面,提供了一种电子设备,该电子设备包括:
13、至少一个处理器;以及
14、与至少一个处理器通信连接的存储器;其中,
15、存储器存储有可被至少一个处理器执行的计算机程序,计算机程序被至少一个处理器执行,以使至少一个处理器能够执行本发明任一实施例的刷单行为确定方法。
16、根据本发明的另一方面,提供了一种计算机可读存储介质,该计算机可读存储介质存储有计算机指令,计算机指令用于使处理器执行时实现本发明任一实施例的刷单行为确定方法。
17、本发明实施例的技术方案,通过获取待寄件在至少一个预设特征下所对应的特征数值,使得根据每个预设特征所对应的特征数值,确定在每个预设特征下所对应的目标分箱,之后根据目标分箱所对应的待使用风险评估值,确定待寄件的目标风险评估值,当目标风险评估值大于预设风险评估值阈值时,则确定待寄件为刷单行为下的快件。解决了现有技术中依靠人工经验识别刷单行为导致的刷单行为的误判以及查全率低的问题,以及在大量快件下基于人工方式识别刷单行为导致的识别效率低的问题,实现了通过分析待寄件的预设特征对应的特征数值,确定其对应的目标分箱,从而进一步的确定是否为刷单行为下的快件,提高了刷单行为识别的准确度和效率。
18、应当理解,本部分所描述的内容并非旨在标识本发明的实施例的关键或重要特征,也不用于限制本发明的范围。本发明的其它特征将通过以下的说明书而变得容易理解。
1.一种刷单行为确定方法,其特征在于,包括:
2.根据权利要求1所述的方法,其特征在于,还包括:
3.根据权利要求2所述的方法,其特征在于,所述分别确定每个历史寄件在所述至少一个预设特征下的历史特征数据,包括:
4.根据权利要求2或3所述的方法,其特征在于,所述依据与各预设特征相关联的历史特征数据的数据属性,确定初始分箱参数,得到与每个预设特征下相关联的至少一个待调整分箱,包括:
5.根据权利要求2所述的方法,其特征在于,所述基于目标算法对每个初始分箱参数下的历史特征数据进行处理,并根据处理结果对所述初始分箱参数进行调整,得到与各预设特征相关联的至少一个待选择分箱,包括:
6.根据权利要求2所述的方法,其特征在于,在得到每个预设特征下的至少一个待选择分箱之后,还包括:
7.根据权利要求6所述的方法,其特征在于,所述基于每个待选择初始分箱下的历史特征数据,确定逻辑回归模型,包括:
8.根据权利要求7所述的方法,其特征在于,所述基于所述逻辑回归模型确定每个待选择分箱的风险评估值,包括:
9.根据权利要求1所述的方法,其特征在于,还包括:
10.根据权利要求1所述的方法,其特征在于,所述依据所述目标分箱所对应的待使用风险评估值,确定所述待寄件的目标风险评估值,包括: