1.一种挖掘潜在客户的方法,其特征在于,所述方法包括:
获取商家的样本客户的各个属性标签,并计算所述样本客户的各个属性标签的集中度,以及所述样本客户的各个属性标签的属性值域的权重;
将所述样本客户的各个属性标签按照预设组合标准进行组合,得到多个属性标签组合,计算每个所述属性标签组合的集中度;
根据每个所述属性标签组合的集中度,以及组成每个所述属性标签组合的属性标签的集中度,从多个所述属性标签组合中选择所述样本客户的挖掘属性标签,并计算所述样本客户的各个所述挖掘属性标签的属性值域的权重;
根据所述样本客户的各个属性标签的属性值域的权重、所述样本客户的各个挖掘属性标签的属性值域的权重,采用图聚类方法对所述样本客户进行社群划分,得到多个客户社群;
获取新客户的各个属性标签,并根据所述新客户的各个属性标签的属性值、每个所述客户社群中的所述样本客户的各个属性标签的属性值、各个挖掘属性标签的属性值,按照预设概率公式计算得到所述新客户属于每个所述客户社群的概率;
当所述新客户属于每个所述客户社群的概率中存在一概率大于预设概率阈值时,则确定所述新客户是所述商家的潜在客户。
2.如权利要求1所述的方法,其特征在于,所述属性值域的权重包括:属性值的权重或属性值类区间的权重。
3.如权利要求2所述的方法,其特征在于,计算所述样本客户的各个属性标签的属性值域的权重,包括:
判断所述样本客户的各个属性标签的类别;
如果所述样本客户的某属性标签是文本类,则按照预设权重计算公式计算所述样本客户的文本类的某属性标签的各个属性值的权重;
如果所述样本客户的某属性标签的属性值是数字类,则采用动态聚类方 法对所述样本客户的数字类的某属性标签的各个属性值进行数据区间统计,得到多个属性值类区间,按照预设权重计算公式计算所述样本客户的数字类的某属性标签的各个属性值类区间的权重。
4.如权利要求3所述的方法,其特征在于,所述预设权重计算公式为:
其中,对于文本类的某属性标签:xi表示文本类的某属性标签的属性值是xi,w(xi)表示文本类的某属性标签的属性值xi的权重,CRn表示文本类的某属性标签的集中度,c(xi)表示文本类的某属性标签的属性值xi的个数,c(X)表示文本类的某属性标签的所有属性值的总个数;对于数字类的某属性标签:xi表示数字类的某属性标签的属性值类区间是xi,w(xi)表示数字类的某属性标签的属性值类区间的权重,CRn表示数字类的某属性标签的集中度,c(xi)表示数字类的某属性标签的属性值类区间中元素的个数,c(X)表示数字类的某属性标签的所有属性值类区间中元素的总个数。
5.如权利要求2所述的方法,其特征在于,将所述样本客户的各个属性标签按照预设组合标准进行组合,得到多个属性标签组合,包括:
将所述样本客户的各个属性标签的属性值的权重或属性值类区间的权重,与预设权重阈值进行比较,得到所述样本客户的属性标签的属性值的权重或属性值类区间的权重小于所述预设权重阈值的多个属性标签;
将所述样本客户的小于所述预设权重阈值的多个属性标签进行二二组合,得到多个所述属性标签组合。
6.如权利要求5所述的方法,其特征在于,计算所述样本客户的各个所述挖掘属性标签的属性值域的权重,包括:
判断组成所述样本客户的各个所述挖掘属性标签的二个属性标签的类别;
如果组成所述样本客户的某所述挖掘属性标签的二个属性标签的类别均是文本类,则按照预设权重计算公式计算所述样本客户的某所述挖掘属性标签的各个属性值的权重;
如果组成所述样本客户的某所述挖掘属性标签的二个属性标签的类别 一个是文本类、一个是数字类,则采用动态聚类方法对所述样本客户的某所述挖掘属性标签的各个属性值进行数据区间统计,得到多个属性值类区间,按照所述预设权重计算公式计算所述样本客户的某所述挖掘属性标签的各个属性值类区间的权重;
如果组成所述样本客户的某所述挖掘属性标签的二个属性标签的类别均是数字类,则采用自组织映射SOM聚类方法对所述样本客户的某所述挖掘属性标签的各个属性值进行数据区间统计,得到多个属性值类区间,按照所述预设权重计算公式计算所述样本客户的某所述挖掘属性标签的各个属性值类区间的权重。
7.如权利要求2所述的方法,其特征在于,根据每个所述属性标签组合的集中度,以及组成每个所述属性标签组合的属性标签的集中度,从多个所述属性标签组合中选择所述样本客户的挖掘属性标签,包括:
将每个所述属性标签组合的集中度,分别与组成每个所述属性标签组合的属性标签的集中度进行比较;
如果某个所述属性标签组合的集中度大于组成某个所述属性标签组合的所有属性标签的集中度,则确定某个所述属性标签组合能够作为所述样本客户的所述挖掘属性标签;
如果某个所述属性标签组合的集中度小于等于组成某个所述属性标签组合的任一属性标签的集中度,则确定某个所述属性标签组合不能够作为所述样本客户的所述挖掘属性标签。
8.如权利要求2所述的方法,其特征在于,根据所述样本客户的各个属性标签的属性值域的权重、所述样本客户的各个挖掘属性标签的属性值域的权重,采用图聚类方法对所述样本客户进行社群划分,得到多个客户社群,包括:
从所有的所述样本客户中随机选择一个所述样本客户,根据所述样本客户的各个属性标签的属性值的权重或属性值类区间的权重、所述样本客户的各个挖掘属性标签的属性值的权重或属性值类区间的权重,按照预设最大连接权重选择公式,从随机选择的所述样本客户与其他各个所述样本客户之间的连接权重中,选择连接权重最大的一个其他所述样本客户,并将连接权重 最大的一个其他所述样本客户与随机选择的所述样本客户组成待定客户社群;
根据预设聚合公式,计算所述待定客户社群之外的其他所述样本客户与所述待定客户社群的聚合效应,根据所述待定客户社群之外的其他所述样本客户与待定客户社群的聚合效应,确定是否将所述待定客户社群之外的其他所述样本客户添加到所述待定客户社群组成所述客户社群;
从所述客户社群之外的所述样本客户中随机选择一个所述样本客户,然后执行计算随机选择的所述样本客户与其他各个所述样本客户之间的连接权重的步骤。
9.如权利要求8所述的方法,其特征在于,所述预设最大连接权重选择公式如下:
其中,v*表示与随机选择的所述样本客户v的连接权重最大的一个其他所述样本客户,Ev-connect表示随机选择的所述样本客户v与随机选择的所述样本客户v有共同属性值的任一所述样本客户的连接权重。
10.如权利要求9所述的方法,其特征在于,所述预设聚合公式如下:
其中,当w(Sin)表示随机选择的所述样本客户v与所述待定客户社群中的其他所述样本客户的连接权重、w(Sout)表示随机选择的所述样本客户v与所述待定客户社群之外的其他所述样本客户的连接权重时,Condensity(gi)表示所述待定客户社群的聚合效应值;当w(Sin)表示随机选择的所述样本客户v与所述客户社群中的其他所述样本客户的连接权重、w(Sout)表示随机选择的所述样本客户v与所述客户社群之外的其他所述样本客户的连接权重时,Condensity(gi)表示所述客户社群的聚合效应值。
11.如权利要求10所述的方法,其特征在于,根据所述待定客户社群之外的其他所述样本客户与所述待定客户社群的聚合效应,确定是否将所述待定客户社群之外的其他所述样本客户添加到所述待定客户社群组成所述客户社群,包括:
将所述待定客户社群的聚合效应值与所述客户社群的聚合效应值进行比较;
如果所述客户社群的聚合效应值大于所述待定客户社群的聚合效应值,则确定将所述待定客户社群之外的其他所述样本客户添加到所述待定客户社群组成所述客户社群;
如果所述客户社群的聚合效应值小于等于所述待定客户社群的聚合效应值,则确定不将所述待定客户社群之外的其他所述样本客户添加到所述待定客户社群组成所述客户社群。
12.如权利要求2所述的方法,其特征在于,按照预设概率公式计算得到所述新客户属于每个所述客户社群的概率之后,还包括:
将所述新客户属于每个所述客户社群的概率进行比较,得到所述新客户属于所述客户社群的最大概率;
确定所述新客户属于最大概率对应的所述客户社群;
更新所述样本客户的各个属性标签的属性值的权重或属性值类区间的权重。
13.如权利要求12所述的方法,其特征在于,所述预设概率公式如下:
其中,Y表示所述新客户的属性标签,yi表示所述新客户的属性标签的第i个属性值,n表示所述新客户的属性标签有n个属性值,B表示任一所述客户社群。
14.如权利要求2所述的方法,其特征在于,确定所述新客户是所述商家的潜在客户之后,还包括:
获取所述商家的反馈信息;其中,所述反馈信息包括确定的某所述新客户是所述商家的潜在客户不正确、和/或原来的某所述样本客户当前不符合所述商家的客户标准;
根据所述商家的反馈信息,按照预设权重矫正公式对所述样本客户或所述新客户的各个属性标签的属性值的权重或属性值类区间的权重进行矫正, 并根据所述商家的反馈信息,对所述客户社群进行矫正。
15.如权利要求14所述的方法,其特征在于,所述预设权重矫正公式如下:
其中,表示所述样本客户或所述新客户的矫正后的属性标签A的属性值或属性值类区间在矫正后的所述客户社群中的权重;表示所述样本客户或所述新客户的矫正前的属性标签A的属性值或属性值类区间在矫正后的所述客户社群中的权重;表示所述样本客户或所述新客户的矫正后的属性标签A在矫正前的所述客户社群中的权重。
16.一种挖掘潜在客户的装置,其特征在于,所述装置包括:
获取模块,用于获取商家的样本客户的各个属性标签,并计算所述样本客户的各个属性标签的集中度,以及所述样本客户的各个属性标签的属性值域的权重;
组合计算模块,用于将所述样本客户的各个属性标签按照预设组合标准进行组合,得到多个属性标签组合,计算每个所述属性标签组合的集中度;
确定计算模块,用于根据每个所述属性标签组合的集中度,以及组成每个所述属性标签组合的属性标签的集中度,从多个所述属性标签组合中选择所述样本客户的挖掘属性标签,并计算所述样本客户的各个所述挖掘属性标签的属性值域的权重;
划分模块,用于根据所述样本客户的各个属性标签的属性值域的权重、所述样本客户的各个挖掘属性标签的属性值域的权重,采用图聚类方法对所述样本客户进行社群划分,得到多个客户社群;
概率计算模块,用于获取新客户的各个属性标签,并根据所述新客户的各个属性标签的属性值、每个所述客户社群中的所述样本客户的各个属性标签的属性值、各个挖掘属性标签的属性值,按照预设概率公式计算得到所述新客户属于每个所述客户社群的概率;
潜在客户确定模块,用于当所述新客户属于每个所述客户社群的概率中 存在一概率大于预设概率阈值时,则确定所述新客户是所述商家的潜在客户。
17.如权利要求16所述的装置,其特征在于,所述属性值域的权重包括:属性值的权重或属性值类区间的权重。
18.如权利要求17所述的装置,其特征在于,所述获取模块包括:
第一判断单元,用于判断所述样本客户的各个属性标签的类别;
第一计算单元,用于如果所述样本客户的某属性标签是文本类,则按照预设权重计算公式计算所述样本客户的文本类的某属性标签的各个属性值的权重;
第二计算单元,用于如果所述样本客户的某属性标签的属性值是数字类,则采用动态聚类装置对所述样本客户的数字类的某属性标签的各个属性值进行数据区间统计,得到多个属性值类区间,按照预设权重计算公式计算所述样本客户的数字类的某属性标签的各个属性值类区间的权重。
19.如权利要求18所述的装置,其特征在于,所述预设权重计算公式为:
其中,对于文本类的某属性标签:xi表示文本类的某属性标签的属性值是xi,w(xi)表示文本类的某属性标签的属性值xi的权重,CRn表示文本类的某属性标签的集中度,c(xi)表示文本类的某属性标签的属性值xi的个数,c(X)表示文本类的某属性标签的所有属性值的总个数;对于数字类的某属性标签:xi表示数字类的某属性标签的属性值类区间是xi,w(xi)表示数字类的某属性标签的属性值类区间的权重,CRn表示数字类的某属性标签的集中度,c(xi)表示数字类的某属性标签的属性值类区间中元素的个数,c(X)表示数字类的某属性标签的所有属性值类区间中元素的总个数。
20.如权利要求17所述的装置,其特征在于,所述组合计算模块包括:
第一比较单元,用于将所述样本客户的各个属性标签的属性值的权重或属性值类区间的权重,与预设权重阈值进行比较,得到所述样本客户的属性标签的属性值的权重或属性值类区间的权重小于所述预设权重阈值的多个 属性标签;
组合单元,用于将所述样本客户的小于所述预设权重阈值的多个属性标签进行二二组合,得到多个所述属性标签组合。
21.如权利要求20所述的装置,其特征在于,所述确定计算模块还包括:
第二判断单元,用于判断组成所述样本客户的各个所述挖掘属性标签的二个属性标签的类别;
第三计算单元,用于如果组成所述样本客户的某所述挖掘属性标签的二个属性标签的类别均是文本类,则按照所述预设权重计算公式计算所述样本客户的某所述挖掘属性标签的各个属性值的权重;
第四计算单元,用于如果组成所述样本客户的某所述挖掘属性标签的二个属性标签的类别一个是文本类、一个是数字类,则采用动态聚类装置对所述样本客户的某所述挖掘属性标签的各个属性值进行数据区间统计,得到多个属性值类区间,按照所述预设权重计算公式计算所述样本客户的某所述挖掘属性标签的各个属性值类区间的权重;
第五计算单元,用于如果组成所述样本客户的某所述挖掘属性标签的二个属性标签的类别均是数字类,则采用自组织映射SOM聚类装置对所述样本客户的某所述挖掘属性标签的各个属性值进行数据区间统计,得到多个属性值类区间,按照所述预设权重计算公式计算所述样本客户的某所述挖掘属性标签的各个属性值类区间的权重。
22.如权利要求17所述的装置,其特征在于,所述确定计算模块包括:
第二比较单元,用于将每个所述属性标签组合的集中度,分别与组成每个所述属性标签组合的属性标签的集中度进行比较;
第一确定单元,用于如果某个所述属性标签组合的集中度大于组成某个所述属性标签组合的所有属性标签的集中度,则确定某个所述属性标签组合能够作为所述样本客户的所述挖掘属性标签;
第二确定单元,用于如果某个所述属性标签组合的集中度小于等于组成某个所述属性标签组合的任一属性标签的集中度,则确定某个所述属性标签 组合不能够作为所述样本客户的所述挖掘属性标签。
23.如权利要求17所述的装置,其特征在于,所述划分模块包括:
选择单元,用于从所有的所述样本客户中随机选择一个所述样本客户,根据所述样本客户的各个属性标签的属性值的权重或属性值类区间的权重、所述样本客户的各个挖掘属性标签的属性值的权重或属性值类区间的权重,按照预设最大连接权重选择公式,从随机选择的所述样本客户与其他各个所述样本客户之间的连接权重中,选择连接权重最大的一个其他所述样本客户,并将连接权重最大的一个其他所述样本客户与随机选择的所述样本客户组成待定客户社群;
第三确定单元,用于根据预设聚合公式,计算所述待定客户社群之外的其他所述样本客户与所述待定客户社群的聚合效应,根据所述待定客户社群之外的其他所述样本客户与待定客户社群的聚合效应,确定是否将所述待定客户社群之外的其他所述样本客户添加到所述待定客户社群组成所述客户社群;
通知单元,用于从所述客户社群之外的所述样本客户中随机选择一个所述样本客户,然后通知所述选择单元执行计算随机选择的所述样本客户与其他各个所述样本客户之间的连接权重的步骤。
24.如权利要求23所述的装置,其特征在于,所述预设最大连接权重选择公式如下:
其中,v*表示与随机选择的所述样本客户v的连接权重最大的一个其他所述样本客户,Ev-connect表示随机选择的所述样本客户v与随机选择的所述样本客户v有共同属性值的任一所述样本客户的连接权重。
25.如权利要求24所述的装置,其特征在于,所述预设聚合公式如下:
其中,当w(Sin)表示随机选择的所述样本客户v与所述待定客户社群中的其他所述样本客户的连接权重、w(Sout)表示随机选择的所述样本客户v与所述待定客户社群之外的其他所述样本客户的连接权重时,Condensity(gi)表示所 述待定客户社群的聚合效应值;当w(Sin)表示随机选择的所述样本客户v与所述客户社群中的其他所述样本客户的连接权重、w(Sout)表示随机选择的所述样本客户v与所述客户社群之外的其他所述样本客户的连接权重时,Condensity(gi)表示所述客户社群的聚合效应值。
26.如权利要求25所述的装置,其特征在于,所述第三确定单元包括:
比较子单元,用于将所述待定客户社群的聚合效应值与所述客户社群的聚合效应值进行比较;
第一确定子单元,用于如果所述客户社群的聚合效应值大于所述待定客户社群的聚合效应值,则确定将所述待定客户社群之外的其他所述样本客户添加到所述待定客户社群组成所述客户社群;
第二确定子单元,用于如果所述客户社群的聚合效应值小于等于所述待定客户社群的聚合效应值,则确定不将所述待定客户社群之外的其他所述样本客户添加到所述待定客户社群组成所述客户社群。
27.如权利要求17所述的装置,其特征在于,所述装置还包括:
比较模块,用于按照预设概率公式计算得到所述新客户属于每个所述客户社群的概率之后,将所述新客户属于每个所述客户社群的概率进行比较,得到所述新客户属于所述客户社群的最大概率;
确定模块,用于确定所述新客户属于最大概率对应的所述客户社群;
更新模块,用于更新所述样本客户的各个属性标签的属性值的权重或属性值类区间的权重。
28.如权利要求27所述的装置,其特征在于,所述预设概率公式如下:
其中,Y表示所述新客户的属性标签,yi表示所述新客户的属性标签的第i个属性值,n表示所述新客户的属性标签有n个属性值,B表示任一所述客户社群。
29.如权利要求17所述的装置,其特征在于,所述装置还包括:
反馈模块,用于确定所述新客户是所述商家的潜在客户之后,获取所述 商家的反馈信息;其中,所述反馈信息包括确定的某所述新客户是所述商家的潜在客户不正确、和/或原来的某所述样本客户当前不符合所述商家的客户标准;
矫正模块,用于根据所述商家的反馈信息,按照预设权重矫正公式对所述样本客户或所述新客户的各个属性标签的属性值的权重或属性值类区间的权重进行矫正,并根据所述商家的反馈信息,对所述客户社群进行矫正。
30.如权利要求29所述的装置,其特征在于,所述预设权重矫正公式如下:
其中,表示所述样本客户或所述新客户的矫正后的属性标签A的属性值或属性值类区间在矫正后的所述客户社群中的权重;表示所述样本客户或所述新客户的矫正前的属性标签A的属性值或属性值类区间在矫正后的所述客户社群中的权重;表示所述样本客户或所述新客户的矫正后的属性标签A在矫正前的所述客户社群中的权重。