客户流失预测方法及装置、存储介质及电子设备与流程

文档序号:28808425发布日期:2022-02-09 03:13阅读:167来源:国知局
客户流失预测方法及装置、存储介质及电子设备与流程

1.本公开涉及客户流失预测技术领域,具体而言,涉及一种客户流失预测方法、客户流失预测装置、计算机可读存储介质和电子设备。


背景技术:

2.客户流失是客户放弃继续使用企业提供的某项服务的一种现象。对于企业而言,客户流失必然造成经济损失。因此,对客户流失的精准预测是企业实施对应的维挽操作的前提。
3.现有在客户流失预测中,大多使用的是基于经验规则的简单预测方法,针对的也是客户类型比较单一的场景,对于物流企业等客户类型比较复杂的企业而言,存在着较多的误报和漏报问题,导致预测精准度较差。


技术实现要素:

4.本公开提供一种客户流失预测方法、客户流失预测装置、计算机可读存储介质和电子设备,进而提供一种预测精准度更高的客户流失预测方法。
5.根据本公开的第一方面,提供了一种客户流失预测方法,包括:
6.获取待预测客户的流失属性数据;
7.根据所述待预测客户的流失属性数据,确定所述待预测客户的特征数据和标签;
8.将所述待预测客户的特征数据和标签输入至融合模型中,确定出所述待预测客户的综合流失概率;
9.根据所述综合流失概率,确定出目标流失客户。
10.本公开的一种实施方式中,根据所述待预测客户的流失属性数据,确定所述待预测客户的特征数据,包括:
11.根据所述流失属性数据,确定所述待预测客户的单量相关特征和包裹量相关特征;
12.其中,所述单量相关特征包括当前单量特征、历史单量特征、单量环比特征和单量同比特征;
13.所述包裹量相关特征包括当前包裹量特征、历史包裹量特征、包裹量环比特征和包裹量同比特征。
14.本公开的一种实施方式中,所述当前单量特征包括:日粒度当前单量特征和周粒度当前单量特征;
15.所述历史单量特征包括:日粒度历史单量特征、周粒度历史单量特征和月粒度历史单量特征;
16.所述单量环比特征包括:日单量环比特征、周单量环比特征和月单量环比特征;
17.所述单量同比特征包括:日单量同比特征、周单量同比特征和月单量同比特征。
18.本公开的一种实施方式中,所述当前包裹量特征包括:日粒度当前包裹量特征和
周粒度当前包裹量特征;
19.所述历史包裹量特征包括:日粒度历史包裹量特征、周粒度历史包裹量特征和月粒度历史包裹量特征;
20.所述包裹量环比特征包括:日包裹量环比特征、周包裹量环比特征和月包裹量环比特征;
21.所述包裹量同比特征包括:日包裹量同比特征、周包裹量同比特征和月包裹量同比特征。
22.本公开的一种实施方式中,根据所述待预测客户的流失属性数据,确定所述待预测客户的特征数据,包括:
23.根据所述流失属性数据,确定所述待预测客户的数值型属性特征和文字型属性特征;
24.其中,所述文字型属性特征是将文字型属性转换为数值特征后获得的。
25.本公开的一种实施方式中,将所述文字型属性转换为数值特征包括:
26.建立所有所述待预测客户的属性词汇集合;
27.根据所述属性词汇集合,确定每个所述文字型属性数据对应的词向量,作为所述数值特征。
28.本公开的一种实施方式中,建立所有所述待预测客户的属性词汇集合包括:
29.根据所有所述待预测客户的文字型属性切分为类别属性,以确定所述属性词汇集合。
30.本公开的一种实施方式中,在所述待预测客户为第一商家时,所述特征数据还包括网店经营特征;
31.其中,所述网店经营特征包括网店的用户访问量、页面浏览量及网店用户评分。
32.本公开的一种实施方式中,确定所述待预测客户的标签包括:根据流失判断标准确定所述待预测客户的标签;其中,
33.所述流失判断标准包括在所述待预测客户的当前预设期限内存在单量的情况下,如果后续预设期限内没有单量,则确定所述待预测客户的标签为1;如果后续预设期限内有单量,则确定所述待预测客户的标签为0。
34.本公开的一种实施方式中,将所述待预测客户的特征数据和标签输入至融合模型中,确定出所述待预测客户的综合流失概率包括:
35.将所述待预测客户的特征数据和标签输入至多个预测模型中,确定出每个所述预测模型对应的流失概率;
36.根据每个所述预测模型的流失概率和权重系数,确定出所述待预测客户的综合流失概率。
37.本公开的一种实施方式中,所述方法还包括:
38.将所述待预测客户分为第一类客户和第二类客户,所述第一类客户的收入贡献大于所述第二类客户的收入贡献;
39.将所述第一类客户的特征数据和标签输入至融合模型中,确定出所述第一类客户的综合流失概率;
40.将所述第二类客户的特征数据和标签输入至融合模型中,确定出所述第二类客户
的综合流失概率。
41.本公开的一种实施方式中,还包括:
42.根据流失规则,确定所述目标流失客户;
43.其中,所述流失规则包括预设期内单量的下降幅度超过预设阈值的待预测客户。
44.本公开的一种实施方式中,根据流失规则,确定所述目标流失客户包括:
45.从前第3周的单量相对前第2周下降幅度大于第一阈值,且前第2周的商家单量相对前第1周下降幅度大于第二阈值的所述待预测客户中,确定所述目标流失客户。
46.根据本公开的第二方面,提供了一种客户流失预测装置,包括:
47.数据获取模块,用于获取待预测客户的流失属性数据;
48.特征确定模块,用于根据所述待预测客户的流失属性数据,确定所述待预测客户的特征数据和标签;
49.概率确定模块,用于将所述待预测客户的特征数据和标签输入至融合模型中,确定出所述待预测客户的综合流失概率;
50.流失客户确定模块,用于根据所述综合流失概率,确定出目标流失客户。
51.根据本公开的第三方面,提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现上述的客户流失预测方法。
52.根据本公开的第四方面,提供了一种电子设备,包括处理器;存储器,用于存储一个或多个程序,当一个或多个程序被处理器执行时,使得所述处理器实现上述的客户流失预测方法。
53.本公开的示例性实施方式提供的客户流失预测方法,采用模型融合的方案,通过将待预测客户的特征数据和标签输入至融合模型中,可以综合融合模型中各个预测模型的优势,以确定出待预测客户的综合流失概率来进行目标流失客户预测,从而提高了流失客户预测的精度和准确度。
54.应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。
附图说明
55.此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理。显而易见地,下面描述中的附图仅仅是本公开的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。在附图中:
56.图1示意性示出了根据本公开的示例性实施方式的客户流失预测方法的流程图;
57.图2示意性示出了根据本公开的示例性实施方式的待预测客户的特征数据包含内容图;
58.图3示意性示出了根据本公开的示例性实施方式的客户流失预测方法中模型预测模块的流程框图;
59.图4示意性示出了根据本公开的示例性实施方式的客户流失预测方法的一种步骤流程图;
60.图5示意性示出了根据本公开的示例性实施方式的客户流失预测装置的方框图;
61.图6示意性示出了根据本公开的示例性实施方式的电子设备的模块示意图。
具体实施方式
62.现在将参考附图更全面地描述示例实施方式。然而,示例实施方式能够以多种形式实施,且不应被理解为限于在此阐述的范例;相反,提供这些实施方式使得本公开将更加全面和完整,并将示例实施方式的构思全面地传达给本领域的技术人员。所描述的特征、结构或特性可以以任何合适的方式结合在一个或更多实施方式中。在下面的描述中,提供许多具体细节从而给出对本公开的实施方式的充分理解。然而,本领域技术人员将意识到,可以实践本公开的技术方案而省略所述特定细节中的一个或更多,或者可以采用其它的方法、组元、装置、步骤等。在其它情况下,不详细示出或描述公知技术方案以避免喧宾夺主而使得本公开的各方面变得模糊。
63.此外,附图仅为本公开的示意性图解,并非一定是按比例绘制。图中相同的附图标记表示相同或类似的部分,因而将省略对它们的重复描述。附图中所示的一些方框图是功能实体,不一定必须与物理或逻辑上独立的实体相对应。可以采用软件形式来实现这些功能实体,或在一个或多个硬件模块或集成电路中实现这些功能实体,或在不同网络和/或处理器装置和/或微控制器装置中实现这些功能实体。
64.附图中所示的流程图仅是示例性说明,不是必须包括所有的步骤。例如,有的步骤还可以分解,而有的步骤可以合并或部分合并,因此实际执行的顺序有可能根据实际情况改变。另外,下面所有的术语“第一”、“第二”仅是为了区分的目的,不应作为本公开内容的限制。
65.对于大型的物流企业而言,当前存在着比较严重的客户流失现象,几乎每周都会有数百家的商家客户流失,从而造成巨大的经济损失。因此,提前预测可能会流失的客户,并采取有效策略以及时维护这些商家,则能够减少企业的损失,对企业的降本、增效、创收等意义重大。
66.对于物流企业等客户类型非常复杂的企业而言,在客户流失预测过程中,如果使用基于业务总结的经验规则算法进行客户流失预测,极大可能存在着误报和漏报的风险,达不到精准预测的目的。
67.基于上述问题,本公开的示例性实施方式中提供了一种客户流失预测方法和装置,旨在提升客户流失预测准确率的同时,提高预测的普适性,以满足客户类型较为复杂的企业的需求。该客户流失预测方法和装置广泛应用于各种设备中,例如:手机、电脑等各种设备中,本示例性实施方式对具体使用本公开实施例方案的设备不予限定。
68.图1示意性示出了本公开的示例性实施方式的客户流失预测方法的流程图。参考图1,客户流失预测方法可以包括以下步骤:
69.步骤s110、获取待预测客户的流失属性数据。
70.对于不同的企业通常会有不同的流失属性数据,以物流企业为例,流失属性数据是评价客户和物流服务各方面中与客户流失相关性较强的属性。例如,客户单量的消失是流失现象的直接体现,因此,可以将客户单量作为其中一项重要的流失属性数据。
71.鉴于一个订单可能包含有多个包裹,在本公开的示例性实施方式中,流失属性数据除过包括上述的客户单量之外,还可以包括包裹量。另外,除过单量和包裹量属性数据之
外,根据物流企业的客户类型复杂性,还可以包括客户属性数据。
72.本公开的示例性实施方式中,客户属性数据可以包括数值型属性数据和文字型属性数据,其中,数值型属性数据可以包括物流履约率、保价金额、代收货款上限、当前日期距离营业执照有效期跨度、签约日期距当前日期跨度等。对这些数值型属性数据进行数据清洗后,可以将它们直接作为待预测客户的特征数据。文字型属性数据则主要包括主营类目、客户类型、公司性质、商家渠道、签约区域、是否航空运输、是否认证、商家级别等。这些数值型属性数据和文字型属性数据也都是与客户流失相关的属性数据,对于客户流失预测具有非常重要的意义。
73.通常初步采集的流失属性数据往往比较脏,存在一些异常数据或者重要数据缺失等情况。因此,在获取到待预测客户的流失属性数据后,需要对数据进行清洗加工,去除一些异常数据,对于缺失数据进行填充等处理,以获得可用的待预测客户的流失属性数据。
74.步骤s130、根据待预测客户的流失属性数据,确定待预测客户的特征数据和标签。
75.本公开的示例性实施方式中,在获取到可用的待预测客户的流失属性数据之后,首先需要根据流失属性数据,确定出待预测客户的特征数据。
76.其中,根据待预测客户的流失属性数据,确定待预测客户的特征数据可以包括:根据流失属性数据,确定待预测客户的单量相关特征和包裹量相关特征;参照图2,单量相关特征包括当前单量特征、历史单量特征、单量环比特征和单量同比特征;包裹量相关特征包括当前包裹量特征、历史包裹量特征、包裹量环比特征和包裹量同比特征。
77.对于单量相关特征而言,当前单量特征主要用于表征近期单量特征,其变化分析的时间尺度较小,可以用于快速预警流失问题。本公开的示例性实施方式中,当前单量特征包括日粒度当前单量特征和周粒度当前单量特征。其中,日粒度当前单量特征可以包括当天(指的是客户下订单的日期)、前一天、当天所在周的日均、当天所在月的日均等日粒度单量特征;周粒度当前单量特征可以包括当天所在周的前1周或前第2周等周粒度单量特征。
78.由于单量相关特征随着时间变化也会存在一定程度的波动,因此,通过历史单量特征可以反映较大时间尺度上的单量波动情况,也可以用于反映客户流失的一些迹象,用于客户流失预测中。其中,历史单量特征可以包括:日粒度历史单量特征、周粒度历史单量特征和月粒度历史单量特征。其中,日粒度历史单量特征可以包括以当天为基础,上个月同天和去年同天这两个日粒度单量特征;周粒度历史单量特征可以包括当天所在周的前第3周直到前第8周或预设周次的周粒度单量特征;对于月粒度历史单量特征而言,可以以月为计量单位,选择当天所在月的上月、前第2月、前第3月等月粒度单量特征;或者,以4周为计量单位,选择当天所在周的前第1周-前第4周、前第5周-前第8周、前第9周-前第12周等月粒度单量特征。
79.需要说明的是,在日粒度单量特征、周粒度单量特征和月粒度单量特征确定过程中,具体的个数可以根据实际情况重新设定和调整,上述所提供的实施方式只是一种示例,并不是对本公开实施例技术方案的限定,任何对日粒度、周粒度或月粒度等技术方式和个数的改变均落入本公开实施例的保护范围之内。
80.在实际应用中,环比指的是连续2个单位周期内的量的变化比,同比指的是一个单位周期内和另一个更大周期的同一个段周期内的变化比,属于周期间的变化比。本公开实施例的示例性实施方式中,单量环比特征包括:日单量环比特征、周单量环比特征和月单量
环比特征。其中,日单量环比特征是当天相对于前一天的日单量,如公式(1)所示;周单量环比特征可以包括当天所在周的前1周相对前第2周、前第3周、前第4周的周环比,或者是前第2周相对于前第3周的周环比,或者是前第3周相对于第4周的周环比;月单量环比特征可以包括当天所在月的上月相对于前第2月、前第2月相对于前第3月,或者是前第3月相对于前第4月的月环比,也可以是以4周为一个月进行月环比计算,具体可参照前述实施方式,此处不再赘述。
[0081][0082]
其中,p
日单量环比
为日单量环比特征,n
当天
为当天的日单量,n
昨天
为前一天的日单量。
[0083]
本公开实施例的示例性实施方式中,单量同比特征可以包括日单量同比特征、周单量同比特征和月单量同比特征。其中,日单量同比特征、周单量同比特征和月单量同比特征。其中,日单量同比特征是当天相对于上月同天的日同比,如公式(2)所示,日单量同比特征还可以是当天相对于去年同天的日同比;周单量同比特征可以包括当天所在周的日均相对于去年同周的日均同比,其中的当天所在周的日均可以是本周截止到当天的日均单量,如公式(3)所示;月单量同比特征可以包括当天所在月的日均相对于去年同月的日均同比。
[0084][0085]
其中,q
日单量同比
为日单量同比特征,n
当天
为当天的日单量,n
上月同天
为上月同天的日单量。
[0086][0087]
其中,n
ave
为本周截止到当天的日均单量,n1、n2、nk分别为本周第1天到第k天的各天单量。
[0088]
参照图2,与单量相关特征类似的,包裹量相关特征中,当前包裹量特征可以包括:日粒度当前包裹量特征和周粒度当前包裹量特征;历史包裹量特征可以包括:日粒度历史包裹量特征、周粒度历史包裹量特征和月粒度历史包裹量特征;包裹量环比特征可以包括:日包裹量环比特征、周包裹量环比特征和月包裹量环比特征;包裹量同比特征可以包括:日包裹量同比特征、周包裹量同比特征和月包裹量同比特征。其中,上述各个包裹量特征的计算方式与单量特征的计算方式相同,此处不再一一赘述。
[0089]
本公开的示例性实施方式中,除过根据流失属性数据确定出单量相关特征和包裹量相关特征之外,还需要根据流失属性数据,确定待预测客户的数值型属性特征和文字型属性特征,其中,文字型属性特征是将文字型属性转换为数值特征后获得的。
[0090]
以物流企业为例,数值型属性特征可以包括:物流履约率、保价金额、代收货款上限、当前日期距离营业执照有效期跨度、签约日期距当前日期跨度等。在实际应用中,还可以根据具体情况对上述数值型属性特征进行增减,以满足模型预测的需要。
[0091]
本公开的示例性实施方式中,在获得文字型属性特征之前,需要对文字型属性进行转换,以获得可以用于模型计算的数值特征。对于物流企业而言,文字型属性可以包括主营类目、客户类型、公司性质、商家渠道、签约区域、是否航空运输、是否认证、商家级别等。
[0092]
将文字型属性转换为数值特征的过程可以包括:建立所有待预测客户的属性词汇
集合;根据属性词汇集合,确定每个文字型属性数据对应的词向量,作为数值特征。
[0093]
下面以“主营类目”属性为例对上述的转换过程进行举例说明,由于主营类目通常包含有很多个,因此,可以先对主营类目进行中文切词,将其切分为更细粒度的类别属性,以确定属性词汇集合。例如,对于物流企业而言,其客户的主营类目很多,比如电器、保健品、生活用品、家电、体育用品等,这些更细粒度的类别属性就可以建立起客户的属性词汇集合。如果类别属性非常杂多的时候,可以只选择出现频率较高的类别应用到属性词汇集合中。
[0094]
然后,基于上述属性词汇集合,将每个文字型属性数据转换为词向量。可以将词向量统一采用multi-hot方式表征,具体形式如下:
[0095]
k=(维度,[位置],[频率])
ꢀꢀ
(4)
[0096]
其中,“维度”项对应于该属性词汇集合的实际容量;“位置”和“频率”项则分别为某客户在某日期的该属性的相关取值在词汇集合中的位置序号与出现频率。
[0097]
现举例对公式(4)进行说明,假设对于物流企业而言,客户的“主营类目”可以切分出200个类别属性,那么,“维度”项就为200。假如某一个客户在某日期的“主营类目”是“电器”和“家电”,而“电器”在众多“主营类目”中的位置为第3位与第4位,那么“位置”项就为3和4。客户在某一日期的属性值内容一般是不重复的,因此上述两个属性取值的频率都是1。按照这种方式,就可以将待预测客户的文字属性转换为可用于模型预测的数值特征,即文字型属性特征。
[0098]
在实际应用中,属性词汇集合中的词汇数量也可以根据实际情况来确定,本公开的示例性实施方式中,在确定属性词汇集合中的具体词汇数量的过程中,可以对所有的词汇根据出现次数进行排序,选择出现次数大于预设次数的词汇,作为属性词汇集合中的词汇。或者,根据所有词汇的出现次数排序顺序,选择预设数量的词汇作为,作为属性词汇集合中的词汇。本公开示例性实施方式对此不作特殊限定。
[0099]
另外,对于部分物流企业而言,客户可能分为:第一商家和第二商家;其中,第一商家指的是客户借用该物流企业的平台销售商品,第二商家指的是客户仅使用物流企业的物流服务,不在该物流企业的平台销售商品。
[0100]
对于第二商家而言,特征数据可以按照上述的方式获取,而对于第一商家而言,由于第一商家在物流企业的平台开设了网店,为了保证模型预测的准确率,还可以对第一商家建立额外的网店经营情况方面的额外特征。
[0101]
也就是说,在待预测客户为第一商家时,特征数据还可以包括网店经营特征,其中,网店经营特征可以包括网店的用户访问量、页面浏览量及网店用户评分。网店用户评分则具有两个维度:其一是网店的综合评分,包括商品、服务、物流三个方面的评分;其二是订单评分,包括商品符合度、店家服务态度、快递配送速度、快递员服务、快递包装等方面的评分。
[0102]
本公开的示例性实施方式中,在确定出待预测客户的特征数据后,还需要确定出待预测客户的标签。具体可以根据流失判断标准来确定上述标签。该流失判断标准可以包括:在待预测客户的当前预设期限内存在单量的情况下,如果后续预设期限内没有单量,则确定所述待预测客户的标签为1;如果后续预设期限内有单量,则确定所述待预测客户的标签为0。
[0103]
以当前预设期限为当前周为例,如果待预测客户在当前周存在单量的情况下,如公式(5)所示:
[0104]n当前周
》0
ꢀꢀ
(5)
[0105]
如果后续预设期限,例如后续预设4周内,没有单量,即如公式(6)所示,后续4周的单量为0,则确定该待预测客户为正样本,其对应的标签为1。
[0106]n后第1周
+n
后第2周
+n
后第3周
+n
后第4周
=0
ꢀꢀ
(6)
[0107]
对于不同的待预测客户可以设定不同的预设期限。例如,可以将待预测客户分为第一类客户和第二类客户,其中,对于企业而言,第一类客户的收入贡献大于第二类客户的收入贡献。以客户的季度收入贡献为例,假如存在收入贡献登记不同的a、b、c、d和e五类客户,每类客户的季度收入贡献分别为:a》=10万,5万《=b《10万,1万《=c《5万,3000《=d《1万,0《e《3000;其中,可以将a、b、c类客户限定为第一类客户,单量和价值较大,需要及时预警第一类客户的流失情况。对于d、e类组成的第二类客户则可以设置较长的预设期限,例如,可以将预设期限设定为月期限。在当前月期限内存在单量的情况下,如果后续3个月内没有单量,则确定标签为1;如果后续3个月内有单量,则确定标签为0。
[0108]
上述的预设期限和第一类客户和第二类客户的客户分类方式只是一种示例,不能作为对本公开实施例的限定,根据实际情况可以灵活调整预设期限和客户分类方式,本公开的示例性实施方式对此不作特殊限定。
[0109]
在实际应用中,由于负样本数量通常远大于正样本数量,通过对负样本降采样方式将正负样本比例设置为约1:5,从而有助于提升准确率。
[0110]
步骤s150、将待预测客户的特征数据和标签输入至融合模型中,确定出待预测客户的综合流失概率。
[0111]
本公开的示例性实施方式中,融合模型可以由多个预测模型组成,例如,参照图3,多个预测模型可以包括:随机森林(random forest,rf)、gbdt(gradient boosting decision tree,梯度下降决策树)算法和mlp(muti-layer perception,多层感知器)神经网络。这三种预测模型用于建立二分类模型,在输入待预测客户的特征数据和标签后,会预测出客户的流失概率,分别可以从不同方面提升模型预测的整体精度。
[0112]
其中,随机森林主要关注减少算法的预测方差,从而提升泛化效果;gbdt算法则逐步聚焦于基分类器判别错误的训练样本,致力于减少最终模型的偏差。鉴于算法预测误差是偏差和方差的结合,因此,本公开的示例性实施方式通过将随机森林和gbdt算法两种算法集成,可以获得综合性能更优的预测结果。
[0113]
另外,mlp神经网络是具有输入层、隐藏层、输出层的3层神经网络,通过各网络层神经元的全连接与非线性激活,从而实现特征交叉。隐藏层采用relu激活函数,输出层采用softmax激活函数,从而输出各个类别的概率值。输入层的神经元个数等于特征工程阶段输出的总特征维度数;隐藏层设置一定数量的神经元,如10;输出层的神经元个数为具体的类别数,对于流失预警问题,神经元个数为2。
[0114]
在确定出每个预测模型的流失概率之后,可以结合各个预测模型的权重系数,确定出待预测客户的综合流失概率。本公开的示例性实施方式中,通过模型融合方案可以综合上述三种预测模型的各自优势,假设随机森林、gbdt算法、mlp神经网络对样本的预测概率分别为pr、pg和pm,则三者的综合流失概率为:
[0115]
p=αpr+βpg+γpmꢀꢀ
(7)
[0116]
其中,α、β和γ分别为三种算法相应的权重系数,三者的加和等于1.0。三个权重系数的实际取值可以根据它们对实际问题的预测性能而定。综合流失概率p反映了客户流失的可能性;概率值越大,流失可能性越大。
[0117]
需要说明的是,上述三种预测模型只是一种示例。在实际应用中,还可以根据客户的实际情况,灵活调整预测模型,采用更新的或者更优的预测模型添加到融合模型中,以获得更优的预测结果。
[0118]
本公开的示例性实施方式中,可以对第一类客户和第二类客户进行综合流失概率预测,例如,将第一类客户的特征数据和标签输入至融合模型中,确定出第一类客户的综合流失概率;将第二类客户的特征数据和标签输入至融合模型中,确定出第二类客户的综合流失概率。
[0119]
步骤s170、根据综合流失概率,确定出目标流失客户。
[0120]
本公开的示例性实施方式中,在确定出综合流失概率之后,可以根据综合流失概率的大小对所有客户进行排序,再根据需要确定的流失客户的数量,确定出目标流失客户。
[0121]
通过根据综合流失概率确定出的目标流失客户,可能存在数据不全、数据异常或者数据缺失等不足的情况,本公开的示例性实施方式中,参照图3,为了弥补上述不足,还可以根据流失规则来确定目标流失客户。
[0122]
本公开的示例性实施方式中,流失规则可以包括预设期内单量的下降幅度超过预设阈值的待预测客户。例如,从前第3周的单量相对前第2周下降幅度h1大于第一阈值a(公式8),且前第2周的商家单量相对前第1周下降幅度h2大于第二阈值b(公式9)的待预测客户中,确定出目标流失客户。
[0123][0124][0125]
根据上述流失规则,再对满足上述两个条件的所有待预测客户,根据这些待预测客户两周内的单量下降幅度总和hd从大到小排序,如公式(10)所示:
[0126][0127]
根据单量下降幅度总和hd的排序结果来确定目标流失客户。
[0128]
在实际应用中,在需要确定的所有数量的目标流失客户中,例如,按照比例分配,90%可以通过综合流失概率来确定,10%可以通过流失规则来确定。本公开示例性实施方式对于具体的确定比例不作特殊限定。
[0129]
本公开的示例性实施方式提供的客户流失预测方法,参照图3,在确定出待预测客户的流失属性数据后,再输入数据进行特征提取,在提取出特征数据和标签后,可以将特征数据和标签输入到融合模型中,即输入到随机森林、gbdt算法和mlp神经网络等预测模型中,确定出各个预测模型的流失概率。再对随机森林、gbdt算法和mlp神经网络进行权重累加获得综合概率。再结合规则算法,按照比例分配确定出目标流失客户的名单,并输出名单。
[0130]
在实际应用中,以物流企业为例,可以根据第一类客户和第二类客户分别进行融合模型训练,以确定出目标流失客户。参照图4,可以在预设时间周期获取流失属性数据,即预设周期提取数据。例如可以是每周一或每周日等提取最新数据,此处不作特殊限定。接着,进行数据清洗;之后,针对第一商家,确定特征数据和标签,即建立第一商家特征,同样,建立第二商家特征。再针对上述两种商家特征进行不同的流失模型训练,即训练第一类客户流失模型和第二类客户流失模型,此处的流失模型包括融合模型和流失规则,例如,训练abc类客户流失模型和训练de类客户流失模型。从而可以分别预测出第一商家的客户流失名单和第二商家的客户流失名单。
[0131]
在确定出客户流失名单后,可以根据不同的阈值,对客户进行流失风险等级划分,例如,划分为“高”、“中”、“低”三档等,例如,综合流失概率大于0.9的为“高”档,综合流失概率在0.9到0.75之间的为“中”档,综合流失概率在0.75到0.5之间的为“低”档。另外,在客户流失名单中还可以给出辅助原因,包括一些单量变化维度属性,以及物流履约率、商家情况等,用于辅助解释可能流失的具体原因。根据实际需求,选择相关风险等级中特定数量的客户,将最终名单下发给各区域的客户经理,从而针对性地维护潜在流失客户。客服经理完成与商家的沟通后,及时反馈获取的流失意向与流失原因等方面的信息;它们将被用于进一步完善算法,如丰富模型中的流失特征等,从而形成完整的闭环优化过程。上述过程可以总结为下发流失名单和辅助原因,根据上述的流失名单和辅助原因采取相关维挽操作并反馈。
[0132]
本公开的示例性实施方式提供的客户流失预测方法,采用模型融合的方案,通过将待预测客户的特征数据和标签输入至融合模型中,可以综合融合模型中各个预测模型的优势,以确定出待预测客户的综合流失概率来进行目标流失客户预测,从而提高了流失客户预测的精度和准确度。另一方面,进一步结合规则算法,最终确定存在较高流失风险的客户,通过提前维护达到降低流失率的目的,提高了流失客户预测的覆盖率。
[0133]
另外,建立了多维度和多时间尺度的商家流失特征;维度方面包括单量和包裹量变化、物流履约情况、商家的各种主要属性等;时间尺度方面包括单量和包裹量基于日粒度、周粒度、月粒度的数量、同比、环比等统计形式。采用商家分类分级的策略,将客户类型分为第一商家与第二商家,并基于贡献价值将客户分为五个等级,相应建立专门流失特征与流失判断标准,使得客户流失的预测精准度更高,便于制定更有针对性的维挽措施。
[0134]
应当注意,尽管在附图中以特定顺序描述了本公开中方法的各个步骤,但是,这并非要求或者暗示必须按照该特定顺序来执行这些步骤,或是必须执行全部所示的步骤才能实现期望的结果。附加的或备选的,可以省略某些步骤,将多个步骤合并为一个步骤执行,以及/或者将一个步骤分解为多个步骤执行等。
[0135]
进一步的,本示例实施方式中还提供了一种客户流失预测装置。
[0136]
图5示意性示出了本公开的示例性实施方式的客户流失预测装置的方框图。参考图5,根据本公开的示例性实施方式的客户流失预测装置500可以包括:数据获取模块510、特征确定模块520、概率确定模块530和流失客户确定模块540。
[0137]
具体的,数据获取模块510可以用于获取待预测客户的流失属性数据;特征确定模块520可以用于根据所述待预测客户的流失属性数据,确定所述待预测客户的特征数据和标签;概率确定模块530可以用于将所述待预测客户的特征数据和标签输入至融合模型中,
确定出所述待预测客户的综合流失概率;流失客户确定模块540可以用于根据所述综合流失概率,确定出目标流失客户。
[0138]
由于本公开实施方式的客户流失预测装置的各个功能模块与上述方法实施方式中相同,在此不再赘述。
[0139]
通过以上的实施方式的描述,本领域的技术人员易于理解,这里描述的示例性实施方式可以通过软件实现,也可以通过软件结合必要的硬件的方式来实现。因此,根据本公开实施方式的技术方案可以以软件产品的形式体现出来,该软件产品可以存储在一个非易失性存储介质(可以是cd-rom,u盘,移动硬盘等)中或网络上,包括若干指令以使得一台计算设备(可以是个人计算机、服务器、终端装置、或者网络设备等)执行根据本公开实施方式的方法。
[0140]
此外,上述附图仅是根据本公开示例性实施例的方法所包括的处理的示意性说明,而不是限制目的。易于理解,上述附图所示的处理并不表明或限制这些处理的时间顺序。另外,也易于理解,这些处理可以是例如在多个模块中同步或异步执行的。
[0141]
应当注意,尽管在上文详细描述中提及了用于动作执行的设备的若干模块或者单元,但是这种划分并非强制性的。实际上,根据本公开的实施方式,上文描述的两个或更多模块或者单元的特征和功能可以在一个模块或者单元中具体化。反之,上文描述的一个模块或者单元的特征和功能可以进一步划分为由多个模块或者单元来具体化。
[0142]
在本公开的示例性实施例中,还提供了一种能够实现上述方法的电子设备。
[0143]
所属技术领域的技术人员能够理解,本发明的各个方面可以实现为系统、方法或程序产品。因此,本发明的各个方面可以具体实现为以下形式,即:完全的硬件实施方式、完全的软件实施方式(包括固件、微代码等),或硬件和软件方面结合的实施方式,这里可以统称为“电路”、“模块”或“系统”。
[0144]
下面参照图6来描述根据本发明的这种实施方式的电子设备600。图6显示的电子设备600仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。
[0145]
如图6所示,电子设备600以通用计算设备的形式表现。电子设备600的组件可以包括但不限于:上述至少一个处理单元610、上述至少一个存储单元620、连接不同系统组件(包括存储单元620和处理单元610)的总线630、显示单元640。
[0146]
其中,所述存储单元620存储有程序代码,所述程序代码可以被所述处理单元610执行,使得所述处理单元610执行本说明书上述“示例性方法”部分中描述的根据本发明各种示例性实施方式的步骤。例如,所述处理单元610可以执行如图1中所示的步骤s110、获取待预测客户的流失属性数据;步骤s130、根据待预测客户的流失属性数据,确定待预测客户的特征数据和标签;步骤s150、将待预测客户的特征数据和标签输入至融合模型中,确定出待预测客户的综合流失概率;步骤s170、根据综合流失概率,确定出目标流失客户。
[0147]
存储单元620可以包括易失性存储单元形式的可读介质,例如随机存取存储单元(ram)6201和/或高速缓存存储单元6202,还可以进一步包括只读存储单元(rom)6203。
[0148]
存储单元620还可以包括具有一组(至少一个)程序模块6205的程序/实用工具6204,这样的程序模块6205包括但不限于:操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。
[0149]
总线630可以为表示几类总线结构中的一种或多种,包括存储单元总线或者存储
单元控制器、外围总线、图形加速端口、处理单元或者使用多种总线结构中的任意总线结构的局域总线。
[0150]
电子设备600也可以与一个或多个外部设备670(例如键盘、指向设备、蓝牙设备等)通信,还可与一个或者多个使得用户能与该电子设备600交互的设备通信,和/或与使得该电子设备600能与一个或多个其它计算设备进行通信的任何设备(例如路由器、调制解调器等等)通信。这种通信可以通过输入/输出(i/o)接口650进行。并且,电子设备600还可以通过网络适配器660与一个或者多个网络(例如局域网(lan),广域网(wan)和/或公共网络,例如因特网)通信。如图所示,网络适配器660通过总线630与电子设备600的其它模块通信。应当明白,尽管图中未示出,可以结合电子设备600使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、raid系统、磁带驱动器以及数据备份存储系统等。
[0151]
通过以上的实施方式的描述,本领域的技术人员易于理解,这里描述的示例实施方式可以通过软件实现,也可以通过软件结合必要的硬件的方式来实现。因此,根据本公开实施方式的技术方案可以以软件产品的形式体现出来,该软件产品可以存储在一个非易失性存储介质(可以是cd-rom,u盘,移动硬盘等)中或网络上,包括若干指令以使得一台计算设备(可以是个人计算机、服务器、终端装置、或者网络设备等)执行根据本公开实施方式的方法。
[0152]
在本公开的示例性实施例中,还提供了一种计算机可读存储介质,其上存储有能够实现本说明书上述方法的程序产品。在一些可能的实施方式中,本发明的各个方面还可以实现为一种程序产品的形式,其包括程序代码,当所述程序产品在终端设备上运行时,所述程序代码用于使所述终端设备执行本说明书上述“示例性方法”部分中描述的根据本发明各种示例性实施方式的步骤。
[0153]
本发明的实施方式的用于实现上述方法的程序产品可以采用便携式紧凑盘只读存储器(cd-rom)并包括程序代码,并可以在终端设备,例如个人电脑上运行。然而,本发明的程序产品不限于此,在本文件中,可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
[0154]
所述程序产品可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以为但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器(ram)、只读存储器(rom)、可擦式可编程只读存储器(eprom或闪存)、光纤、便携式紧凑盘只读存储器(cd-rom)、光存储器件、磁存储器件、或者上述的任意合适的组合。
[0155]
计算机可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了可读程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。可读信号介质还可以是可读存储介质以外的任何可读介质,该可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。
[0156]
可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于无线、有线、光缆、rf等等,或者上述的任意合适的组合。
[0157]
可以以一种或多种程序设计语言的任意组合来编写用于执行本发明操作的程序代码,所述程序设计语言包括面向对象的程序设计语言—诸如java、c++等,还包括常规的过程式程序设计语言—诸如“c”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户计算设备上部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。在涉及远程计算设备的情形中,远程计算设备可以通过任意种类的网络,包括局域网(lan)或广域网(wan),连接到用户计算设备,或者,可以连接到外部计算设备(例如利用因特网服务提供商来通过因特网连接)。
[0158]
此外,上述附图仅是根据本发明示例性实施例的方法所包括的处理的示意性说明,而不是限制目的。易于理解,上述附图所示的处理并不表明或限制这些处理的时间顺序。另外,也易于理解,这些处理可以是例如在多个模块中同步或异步执行的。
[0159]
本领域技术人员在考虑说明书及实践这里公开的内容后,将容易想到本公开的其他实施例。本技术旨在涵盖本公开的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本公开的真正范围和精神由权利要求指出。
[0160]
应当理解的是,本公开并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求来限。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1