一种客群圈选与对比分析的方法及装置与流程

文档序号:33701906发布日期:2023-03-31 19:58阅读:165来源:国知局
一种客群圈选与对比分析的方法及装置与流程

1.本技术涉及数据处理技术领域,尤其是涉及一种客群圈选与对比分析的方法及装置。


背景技术:

2.目前,现有技术中在进行客群圈选与对比分析时,首先开发人员需要预先设置客群圈选的业务规则并编写程序,再通过etl的方式加工出客群名单;之后,开发人员还需要预先设置客群名单的分析规则并编写程序,通过etl的方式加工出各个客群的分析结果,再由bi工具进行对比分析。
3.这样,现有的客群圈选与对比分析的方式需要开发人员进行大量编程工作,导致客群圈选与对比分析所用到的圈选条件和分析条件被固化在程序中不易变更;此外,随着客户数据的扩展,当客户数据量巨大、客群圈选和分析所用到的条件复杂时,客群圈选结果和对比分析结果的生成需要耗费大量时间,导致计算的时效性差。


技术实现要素:

4.有鉴于此,本技术的目的在于提供一种客群圈选与对比分析的方法及装置,通过选择标签可以灵活地圈选出目标客群,以及灵活地对客群在不同标签维度上进行对比分析;同时,使用客户位图的客群圈选与对比分析方式能够提高计算速度和计算效率。
5.本技术实施例提供了一种客群圈选与对比分析的方法,所述方法包括:
6.接收客群圈选请求;
7.根据客户集合对应的客户标签数据集和所述客群圈选请求中包括的圈选标签关联数据,从所述客户集合中圈选出目标客群并得到所述目标客群对应的目标客群标签数据;其中,所述客户标签数据集包括数据时间维度、标签名称维度、标签值维度和客户位图维度;所述客户位图维度下的客户位图由所述数据时间维度下的数据时间、所述标签名称维度下的标签名称和所述标签值维度下的标签值共同确定;
8.接收客群对比分析请求;所述客群对比分析请求包括参考客群标识和对比标签名称;
9.根据所述目标客群标签数据、由所述参考客群标识查询到的参考客群标签数据和所述对比标签名称,确定所述目标客群和参考客群在对比标签维度上的对比分析结果。
10.进一步的,所述圈选标签关联数据包括目标数据时间、至少一个目标标签名称、每个目标标签名称对应的目标标签值以及每个目标标签之间的逻辑计算关系;所述根据客户集合对应的客户标签数据集和所述客群圈选请求中包括的圈选标签关联数据,从所述客户集合中圈选出目标客群,包括:
11.根据目标数据时间、每个目标标签名称和每个目标标签名称对应的目标标签值,从所述客户标签数据集中查找出目标数据时间、每个目标标签名称和每个目标标签值对应的客户位图;其中,所述客户位图中的每一位对应所述客户集合中的一个客户,该位的值用
于表示该客户在目标数据时间是否具有目标标签名称对应的目标标签值;
12.按照所述逻辑运算关系在每个客户位图之间进行逻辑运算,得到所述目标客群对应的目标客户位图;其中,所述逻辑运算关系包括以下各项中的一项或多项的组合:交集和并集;
13.根据所述目标客户位图中每一位的值,确定所述目标客群。
14.进一步的,所述客户标签数据集通过以下方式构建:
15.获取所述客户集合对应的原始客户数据表;其中,所述原始客户数据表中包括所述客户集合中每个客户的客户记录;每个客户的客户记录中包括该客户记录的数据时间、该客户的客户标识、该客户对应的多个标签名称和每个标签名称对应的标签值;
16.将所述原始客户数据表中的每条客户记录拆解为多条客户特征记录,得到客户特征数据表;其中,每条客户特征记录包括该客户特征记录的数据时间、该客户的客户标识、该客户对应的一个标签名称和该标签名称对应的标签值;
17.根据所述客户特征数据表中每条客户特征记录中的数据时间、标签名称和标签值,对所述客户特征数据表中的各客户标识进行聚合运算,得到数据时间、标签名称和标签值共同对应的客户标识;
18.设置客户位图中的每一位与客户标识的映射关系,并根据所述映射关系将数据时间、标签名称和标签值共同对应的客户标识转换为客户位图;
19.根据数据时间、标签名称、标签值和转换得到的客户位图,构建所述客户标签数据集。
20.进一步的,所述根据所述目标客群标签数据、由所述参考客群标识查询到的参考客群标签数据和所述对比标签名称,确定所述目标客群和所述参考客群在所述对比标签维度上的对比分析结果,包括:
21.针对所述对比标签名称对应的每个对比标签值,根据所述目标客群标签数据从所述目标客群中筛选出具有该对比标签值的目标对比客群;以及根据所述参考客群标签数据从所述参考客群中筛选出具有该对比标签值的参考对比客群;
22.基于每个对比标签值对应的目标对比客群和参考对比客群,确定所述目标客群和所述参考客群在所述对比标签维度上的对比分析结果。
23.进一步的,所述基于每个对比标签值对应的目标对比客群和参考对比客群,确定所述目标客群和所述参考客群在所述对比标签维度上的对比分析结果,包括:
24.确定每个对比标签值对应的目标对比客群中的目标客户数量和参考对比客群中的参考客户数量;
25.将所述目标客户数量和所述参考客户数量的比值确定为在所述对比标签维度中该对比标签值下的对比分析结果;其中,所述对比分析结果用于表征所述目标客群和所述参考客群在所述对比标签维度下的相似度。
26.进一步的,在将所述目标客户数量和所述参考客户数量的比值确定为在所述对比标签维度中该对比标签值下的对比分析结果之后,所述方法还包括:
27.若所述对比分析结果表征所述目标客群和所述参考客群在所述对比标签维度下的相似度小于预设阈值,则将所述对比标签确定为所述目标客群和所述参考客群的区别特征。
28.进一步的,所述针对所述对比标签名称对应的每个对比标签值,根据所述目标客群标签数据从所述目标客群中筛选出具有该对比标签值的目标对比客群,包括:
29.从所述客户标签数据集确定出所述对比标签名称和对比标签值对应的对比客户位图;
30.将所述对比客户位图与所述目标客群标签数据中的目标客户位图进行交集运算,得到第一客户位图;
31.根据所述第一客户位图中每一位的值,确定所述目标客群中具有该对比标签值的目标对比客群。
32.本技术实施例还提供了一种客群圈选与对比分析的装置,所述装置包括:
33.第一接收模块,用于接收客群圈选请求;
34.客群圈选模块,用于根据客户集合对应的客户标签数据集和所述客群圈选请求中包括的圈选标签关联数据,从所述客户集合中圈选出目标客群并得到所述目标客群对应的目标客群标签数据;其中,所述客户标签数据集包括数据时间维度、标签名称维度、标签值维度和客户位图维度;所述客户位图维度下的客户位图由所述数据时间维度下的数据时间、所述标签名称维度下的标签名称和所述标签值维度下的标签值共同确定;
35.第二接收模块,用于接收客群对比分析请求;所述客群对比分析请求包括参考客群标识和对比标签名称;
36.对比分析模块,用于根据所述目标客群标签数据、由所述参考客群标识查询到的参考客群标签数据和所述对比标签名称,确定所述目标客群和所述参考客群在对比标签维度上的对比分析结果。
37.本技术实施例还提供一种电子设备,包括:处理器、存储器和总线,所述存储器存储有所述处理器可执行的机器可读指令,当电子设备运行时,所述处理器与所述存储器之间通过总线通信,所述机器可读指令被所述处理器执行时执行如上述的一种客群圈选与对比分析的方法的步骤。
38.本技术实施例还提供一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器运行时执行如上述的一种客群圈选与对比分析的方法的步骤。
39.本技术实施例提供的一种客群圈选与对比分析的方法及装置,包括:接收客群圈选请求;根据客户集合对应的客户标签数据集和所述客群圈选请求中包括的圈选标签关联数据,从所述客户集合中圈选出目标客群并得到所述目标客群对应的目标客群标签数据;其中,所述客户标签数据集包括数据时间维度、标签名称维度、标签值维度和客户位图维度;所述客户位图维度下的客户位图由所述数据时间维度下的数据时间、所述标签名称维度下的标签名称和所述标签值维度下的标签值共同确定;接收客群对比分析请求;所述客群对比分析请求包括参考客群标识和对比标签名称;根据所述目标客群标签数据、由所述参考客群标识查询到的参考客群标签数据和所述对比标签名称,确定所述目标客群和参考客群在对比标签维度上的对比分析结果。
40.这样,通过选择标签可以灵活地圈选出目标客群,以及灵活地对客群在不同标签维度上进行对比分析,形成了处理后的客户位图,客户位图基于金融业务特定场景选择必须选择的字段,并基于特定字段进行位图设置形成后续选择以及分析的重要基础;同时,使
用客户位图的客群圈选与对比分析方式能够提高计算速度和计算效率。
41.为使本技术的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。
附图说明
42.为了更清楚地说明本技术实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本技术的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
43.图1示出了本技术实施例所提供的一种客群圈选与对比分析的方法的流程图;
44.图2示出了本技术实施例所提供的一种客户标签数据集的构建过程示意图;
45.图3示出了本技术实施例所提供的一种客群圈选与对比分析的装置的结构示意图;
46.图4示出了本技术实施例所提供的一种电子设备的结构示意图。
具体实施方式
47.为使本技术实施例的目的、技术方案和优点更加清楚,下面将结合本技术实施例中附图,对本技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本技术一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本技术实施例的组件可以以各种不同的配置来布置和设计。因此,以下对在附图中提供的本技术的实施例的详细描述并非旨在限制要求保护的本技术的范围,而是仅仅表示本技术的选定实施例。基于本技术的实施例,本领域技术人员在没有做出创造性劳动的前提下所获得的每个其他实施例,都属于本技术保护的范围。
48.经研究发现,目前,现有技术中在进行客群圈选与对比分析时,首先开发人员需要预先设置客群圈选的业务规则并编写程序,再通过etl的方式加工出客群名单;之后,开发人员还需要预先设置客群名单的分析规则并编写程序,通过etl的方式加工出各个客群的分析结果,再由bi工具进行对比分析。
49.这样,现有的客群圈选与对比分析的方式需要开发人员进行大量编程工作,导致客群圈选与对比分析所用到的圈选条件和分析条件被固化在程序中不易变更;此外,随着客户数据的扩展,当客户数据量巨大、客群圈选和分析所用到的条件复杂时,客群圈选结果和对比分析结果的生成需要耗费大量时间,导致计算的时效性差。
50.基于此,本技术实施例提供了一种客群圈选与对比分析的方法及装置,以通过选择标签灵活地圈选出目标客群,以及灵活地对客群在不同标签维度上进行对比分析;同时,使用客户位图的客群圈选与对比分析方式提高计算速度和计算效率。
51.请参阅图1,图1为本技术实施例所提供的一种客群圈选与对比分析的方法的流程图。如图1中所示,本技术实施例提供的方法,包括:
52.s101、接收客群圈选请求。
53.其中,所述客群圈选请求包括圈选标签关联数据;所述圈选标签关联数据用于通过标签从客户集合中圈选客群;所述圈选标签关联数据包括目标数据时间、至少一个目标
标签名称、每个目标标签名称对应的目标标签值以及每个目标标签之间的逻辑计算关系。
54.这里,标签可以是对客户属性进行抽象概括得到的特征项;相应地,标签值是特征项对应的具体特征值。示例性的,“性别”就是客户的一种标签的标签名称,而“男”或“女”即为“性别”标签对应的标签值。逻辑运算关系包括以下各项中的一项或多项的组合:交集和并集。
55.该步骤中,用户可根据客群圈选的实际业务需求配置目标数据时间、目标标签名称、目标标签值和各目标标签之间的逻辑运算关系,从而生成圈选标签关联数据并触发客群圈选请求;服务器接收到客群圈选请求,通过解析客群圈选请求可确定出圈选标签关联数据包括的目标数据时间、至少一个目标标签名称、每个目标标签名称对应的目标标签值以及每个目标标签之间的逻辑计算关系。
56.s102、根据客户集合对应的客户标签数据集和所述客群圈选请求中包括的圈选标签关联数据,从所述客户集合中圈选出目标客群,并得到所述目标客群对应的目标客群标签数据。
57.其中,所述客户标签数据集包括数据时间维度、标签名称维度、标签值维度和客户位图维度;所述客户位图维度下的客户位图由所述数据时间维度下的数据时间、所述标签名称维度下的标签名称和所述标签值维度下的标签值共同确定。
58.而客户标签数据集可涵盖多条客户标签数据,相应地,每条客户标签数据在数据时间维度下具有相应的数据时间、在标签名称维度下具有相应的标签名称、在标签值维度下具有相应的标签值和在客户位图维度下具有相应的客户位图;因此,每条客户标签数据的客户位图可表征出所述客户集合中在数据时间具有标签名称对应的标签值的客户群体

具体的,所述客户位图(bitmap)可以理解为一个数组,其中的每一位对应所述客户集合中的一个客户,则客户位图的位数等于所述客户集合中的客户数量;所述客户位图中每一位的值用于表征该位对应的客户在数据时间是否具有标签名称对应的标签值,例如,“1”表征该位对应的客户具有该标签值,“0”表征该位对应的客户不具有该标签值。例如,某一条客户标签数据中包括数据时间a、标签名称“性别”、标签值“男”,以及对应的客户位图【0,0,1,0】,客户位图中每一位依次对应客户编号为001,002,003和004的客户;则该客户位图表示在这四位客户构成的客户集合中,客户位图第三位(即编号003的客户)具有“性别”标签名称对应的“男”标签值,也就说明该客户为男性客户。
59.在一种可能的实施方式中,步骤s102可包括:
60.s1021、根据所述目标数据时间、每个目标标签名称和每个目标标签名称对应的目标标签值,从所述客户标签数据集中查找出目标数据时间、每个目标标签名称和每个目标标签值对应的客户位图。
61.示例性的,圈选标签关联数据包括目标数据时间a、目标标签名称b以及目标标签名称b对应的目标标签值b、目标标签名称c以及目标标签名称c对应的目标标签值c,则在具体实施时,可根据目标数据时间a、目标标签名称b以及目标标签值b查找出对应的客户位图bb;以及根据目标数据时间a、目标标签名称c以及目标标签值c查找出对应的客户位图cc。
62.s1022、按照所述逻辑运算关系在每个客户位图之间进行逻辑运算,得到所述目标客群对应的目标客户位图。
63.其中,所述逻辑运算关系包括以下各项中的一项或多项的组合:交集和并集。因
此,每个客户位图之间进行的逻辑运算可以是求交集、求并集以及求交集和求并集的组合,例如,可先将两个客户位图之间求交集,再与第三个客户位图求并集。在具体实施时,将两个客户位图求交集是将两个客户位图中对应位进行按位与计算,将两个客户位图求并集是将两个客户位图中对应位进行按位或计算。
64.s1023、根据所述目标客户位图中每一位的值,确定所述目标客群。
65.该步骤中,因为所述客户位图中每一位的值用于表征该位对应的客户是否具有该标签值,则可通过统计所述目标客户位图中每一位的值,确定所述目标客群。例如,在“1”表征该位对应的客户具有该标签值,“0”表征该位对应的客户不具有该标签值时,可将目标客户位图中值为“1”的每一位所对应的客户组成目标客群。
66.在另一种可能的实施方式中,客户标签数据集还可以包括标签数据条件维度,相应地,每条客户标签数据还包括数据条件;数据条件可以指该条客户标签数据对应的其他条件,如该条客户标签数据的产生时的地理位置、生成渠道等。相应的,所述圈选标签关联数据中还包括目标条件;则步骤s102还可包括:首先从所述客户标签数据集中筛选出标签数据条件符合所述目标条件的客户标签数据子集,进而在客户标签数据子集中根据目标数据时间、每个目标标签名称和该目标标签名称对应的目标标签值查找相应客户位图。
67.该步骤中,目标条件可以是一个具体的条件值,通过将目标条件与客户标签数据集进行对比匹配,可将标签数据条件符合所述目标条件的条件值的客户标签数据筛选出来,并构成客户标签数据子集;此外,目标条件也可以是具体的条件范围,通过将目标条件与客户标签数据集中的各条客户标签数据进行对比匹配,可将标签数据条件落入所述目标条件的条件范围的客户标签数据筛选出来,并构成客户标签数据子集。
68.这样,根据用户自主配置的目标数据时间、目标标签名称、每个目标标签名称对应的目标标签值以及各目标标签之间的逻辑运算关系对相应客户位图进行逻辑运算,能够灵活地在海量客户数据精确去重以圈选出目标客群,计算过程高效快捷,时效可控制在秒级。
69.在具体实施时,所述客户标签数据集可通过以下方式构建:
70.第一步:获取所述客户集合对应的原始客户数据表。其中,所述原始客户数据表中包括所述客户集合中每个客户对应的客户记录;每个客户的客户记录中包括该客户记录的数据时间、该客户的客户标识、该客户对应的多个标签名称和每个标签名称下符合对应的标签值。
71.第二步:将所述原始客户数据表中的每条客户记录拆解为多条客户特征记录,得到客户特征数据表。其中,每条客户特征记录包括该客户特征记录的数据时间、该客户的客户标识、该客户对应的一个标签名称和该标签名称对应的标签值。
72.第三步:根据所述客户特征数据表中每条客户特征记录中的数据时间、标签名称和标签值,对所述客户特征数据表中的各客户标识进行聚合运算,得到数据时间、标签名称和标签值共同对应的客户标识。
73.第四步:设置客户位图中的每一位与客户标识的映射关系,并根据所述映射关系将数据时间、标签名称和标签值共同对应的客户标识转换为客户位图。
74.第五步:根据数据时间、标签名称、标签值和转换得到的客户位图,构建所述客户标签数据集。
75.请参阅图2,图2为本技术实施例提供的一种客户标签数据集的构建过程示意图。
下面将结合图2详细介绍上述客户标签数据集的构建过程。
76.如图2中所示,表1为“宽表”结构的原始客户数据表,原始客户数据表中包括所述客户集合中每个客户对应的客户记录;示例性的,每个客户对应的客户记录中包括该客户记录的数据时间(报告日期)、该客户的客户标识(客户id)、该客户对应的多个标签名称和每个标签名称对应的标签值。
77.针对所述原始客户数据表中的每条客户记录,将该条客户记录拆解为多条客户特征记录,得到表2“窄表”结构的客户特征数据表;客户特征数据表中包括每个客户对应的多条客户特征记录,每条客户特征记录包括该客户记录的数据时间(报告日期)、该客户的客户标识、该客户对应的一个标签名称和该标签名称对应的标签值。
78.再根据所述客户特征数据表中每条客户特征记录中的数据时间、标签名称和标签值,对所述客户特征数据表中的各个客户标识进行聚合运算,得到数据时间、标签名称和标签值共同对应的客户标识,即表3中的数据表;在具体实施时,可将客户特征数据表中数据时间维度下出现的数据时间、标签名称维度下出现的标签名称以及标签名称对应的标签值进行字段组合,得到【数据时间、标签名称、标签值】的多种字段组合,再基于每种字段组合对各个客户标识进行聚合运算,聚合出符合每种字段组合的客户标识,即聚合出在数据时间具有标签名称对应的标签值的客户标识。
79.进而,设置客户位图中的每一位与客户标识的映射关系,并根据所述映射关系将符合每种字段组合的客户标识转换为对应的客户位图(bitmap结构);最后,可将数据时间、标签名称、标签值和转换得到的客户位图分别填入客户标签数据集的数据模型中各个维度,从而构建出客户标签数据集;这样,使得客户数据所占用的存储空间倍减,客户位图的逻辑运算过程能够加快计算的时间和效率。
80.返回参阅图1,s103、接收客群对比分析请求。
81.其中,所述客群对比分析请求包括参考客群对应的参考客群标识和对比标签名称。
82.该步骤中,示例性的可提供一图形可视化界面,界面中包括各个参考客群的选项以及各个对比标签名称对应的选项;用户可根据客群对比分析的实际业务需求设置需要对比的参考客群和对比标签名称,即选中相应选项并触发客群对比分析请求;服务器接收到客群对比分析请求,通过解析客群对比分析请求可确定出用户所请求对比的参考客群标识和对比标签名称。其中,参考客群可以是数据库中预先配置的、通过校验的成熟客群,也可以是采用与圈选目标客群类似的方式,通过标签圈选出的其它目标客群。而通过参考客群标识可以查询到参考客群标签数据。
83.s104、根据所述目标客群标签数据、由所述参考客群标识查询到的参考客群标签数据,确定所述目标客群和所述参考客群在所述对比标签维度上的对比分析结果。
84.在一种可能的实施方式中,步骤s104可包括:
85.s1041、针对所述对比标签名称对应的每个对比标签值,根据所述目标客群标签数据从所述目标客群中筛选出具有该对比标签值的目标对比客群;以及根据所述参考客群标签数据从所述参考客群中筛选出具有该对比标签值的参考对比客群。
86.该步骤中,针对对比标签名称对应的每个对比标签值,根据目标客群标签数据从目标客群中筛选出具有该对比标签值的目标对比客群,以及根据参考客群标签数据从参考
客群中筛选出具有该对比标签值的参考对比客群。
87.具体的,步骤s1041针对所述对比标签名称对应的每个对比标签值,根据所述目标客群标签数据从所述目标客群中筛选出具有该对比标签值的目标对比客群,可包括:从所述客户标签数据集确定出所述对比标签名称和对比标签值对应的对比客户位图;将所述对比客户位图与所述目标客群标签数据中的目标客户位图进行交集运算,得到第一客户位图;根据所述第一客户位图中每一位的值,确定所述目标客群中符合所述对比标签名称下的该对比标签值的目标对比客群。需要说明的是,因为目标客群对应的数据时间已经确定,因此对于对比客户位图,可基于目标客群对应的数据时间,结合对比标签名称和对比标签值共同确定。
88.s1042、基于每个对比标签值对应的目标对比客群和参考对比客群,确定所述目标客群和所述参考客群在所述对比标签维度上的对比分析结果。
89.这样,通过选择对比标签进行客群对比形成了处理后的客户位图,该过程中客户位图基于金融业务特定场景选择的必要特定字段,并基于特定字段进行位图设置形成后续选择以及分析的重要基础。
90.在一种可能的实施方式中,步骤s1042可包括:确定每个对比标签值对应的目标对比客群中的目标客户数量和参考对比客群中的参考客户数量;将所述目标客户数量和所述参考客户数量的比值确定为在所述对比标签维度中该对比标签值下的对比分析结果。
91.这里,因为客户位图中每一位的值均用于表征该位对应的客户是否具有相应标签值,则可通过统计客户位图中每一位的值,确定目标对比客群中的目标客户数量和参考对比客群中的参考客户数量。例如,目标对比客群对应的第一客户位图中值为“1”的位数即为目标客户数量。
92.其中,所述对比分析结果用于表征所述目标客群和所述参考客群在所述对比标签维度下关于每个对比标签值的相似度。比值越接近于1,说明所述目标客群和所述参考客群在所述对比标签维度下的相似度越高;比值越接近于0,说明所述目标客群和所述参考客群在所述对比标签维度下的相似度越低。
93.在具体实施时,可将目标客户数量、参考客户数量以及对比分析结果以可视化图表的形式展现在页面中,以使用户更加直观便捷地对目标客群和参考客群进行对比分析。在一个示例中,可通过客群圈选请求中包括的圈选标签关联数据从客户集合中圈选出“营销高价值企业客群”作为目标客群,将“高资产企业客群”作为参考客群,选择“经营状态”作为对比标签,对比标签下有“注销”、“撤销”、“停业”等多个对比标签值;通过客群对比分析,可确定出“营销高价值企业客群”在“经营状态”对比标签下的每个对比标签值的分布情况以及“高资产企业客群”在“经营状态”对比标签下的每个对比标签值的分布情况;最终,对于“经营状态”对比标签下的每个对比标签值,通过比对“营销高价值客群”以及“高资产客群”在该对比标签值下的分布情况,确定“营销高价值企业客群”以及“高资产企业客群”在“经营状态”标签维度上的对比分析结果。
94.此外,对于某些数值型标签值的标签(例如,数量类、金额类的标签),在选中这样的标签作为对比标签之后,可将该标签下的对比标签值按照一定的划分规则划分为多个区间,进而确定目标客群和参考客群在对比标签下的每个区间内的分布情况,从而得到目标客群和参考客群在对比标签维度的对比分析结果。例如,对于“年龄”标签,可将该标签下的
对比标签值划分为“18岁以下”、“18-25岁”、“25-40”、“41-60”以及“60岁以上”等多个年龄区间,进而分别确定目标客群和参考客群在每个年龄区间的分布人数,最终得到在“年龄”标签维度上的对比分析结果。
95.进一步的,若所述对比分析结果表征所述目标客群和所述参考客群在所述对比标签维度下的相似度小于预设阈值,则将所述对比标签确定为所述目标客群和所述参考客群的区别特征。
96.这里,若对比分析结果表征所述目标客群和所述参考客群在所述对比标签维度下的相似度小于预设阈值,则说明目标客群和参考客群在这一对比标签维度下的分布差异较大,因此可将对比标签确定为目标客群和参考客群的区别特征,进而可使用区别特征指导客群的运营策略的优化,比如为不同的客群匹配不同的服务和内容,进行个性化运营。
97.本技术实施例提供的一种客群圈选与对比分析的方法,所述方法包括:接收客群圈选请求;根据客户集合对应的客户标签数据集和所述客群圈选请求中包括的圈选标签关联数据,从所述客户集合中圈选出目标客群并得到所述目标客群对应的目标客群标签数据;其中,所述客户标签数据集包括数据时间维度、标签名称维度、标签值维度和客户位图维度;所述客户位图维度下的客户位图由所述数据时间维度下的数据时间、所述标签名称维度下的标签名称和所述标签值维度下的标签值共同确定;接收客群对比分析请求;所述客群对比分析请求包括参考客群标识和对比标签名称;根据所述目标客群标签数据、由所述参考客群标识查询到的参考客群标签数据和所述对比标签名称,确定所述目标客群和参考客群在对比标签维度上的对比分析结果。
98.这样,通过选择标签可以灵活地圈选出目标客群,以及灵活地对客群在不同标签维度上进行对比分析;同时,使用客户位图的客群圈选与对比分析方式能够提高计算速度和计算效率。
99.请参阅图3,图3为本技术实施例所提供的一种客群圈选与对比分析的装置的结构示意图。如图3中所示,所述装置300包括:
100.第一接收模块310,用于接收客群圈选请求;
101.客群圈选模块320,用于根据客户集合对应的客户标签数据集和所述客群圈选请求中包括的圈选标签关联数据,从所述客户集合中圈选出目标客群并得到所述目标客群对应的目标客群标签数据;其中,所述客户标签数据集包括数据时间维度、标签名称维度、标签值维度和客户位图维度;所述客户位图维度下的客户位图由所述数据时间维度下的数据时间、所述标签名称维度下的标签名称和所述标签值维度下的标签值共同确定;
102.第二接收模块330,用于接收客群对比分析请求;所述客群对比分析请求包括参考客群对应的参考客群标签数据和对比标签名称;
103.对比分析模块340,用于根据所述目标客群标签数据、由所述参考客群标识查询到的参考客群标签数据和所述对比标签名称,确定所述目标客群和所述参考客群在对比标签维度上的对比分析结果。
104.进一步的,所述圈选标签关联数据包括目标数据时间、至少一个目标标签名称、每个目标标签名称对应的目标标签值以及每个目标标签之间的逻辑计算关系;所述客群圈选模块320在用于根据客户集合对应的客户标签数据集和所述客群圈选请求中包括的圈选标签关联数据,从所述客户集合中圈选出目标客群时,所述客群圈选模块320用于:
105.根据目标数据时间、每个目标标签名称和每个目标标签名称对应的目标标签值,从所述客户标签数据集中查找出目标数据时间、每个目标标签名称和每个目标标签值对应的客户位图;其中,所述客户位图中的每一位对应所述客户集合中的一个客户,该位的值用于表示该客户在目标数据时间是否具有目标标签名称对应的目标标签值;
106.按照所述逻辑运算关系在每个客户位图之间进行逻辑运算,得到所述目标客群对应的目标客户位图;其中,所述逻辑运算关系包括以下各项中的一项或多项的组合:交集和并集;
107.根据所述目标客户位图中每一位的值,确定所述目标客群。
108.进一步的,所述装置还包括构建模块;所述构建模块用于通过以下方式构建所述客户标签数据集:
109.获取所述客户集合对应的原始客户数据表;其中,所述原始客户数据表中包括所述客户集合中每个客户的客户记录;每个客户的客户记录中包括该客户记录的数据时间、该客户的客户标识、该客户对应的多个标签名称和每个标签名称对应的标签值;
110.将所述原始客户数据表中的每条客户记录拆解为多条客户特征记录,得到客户特征数据表;其中,每条客户特征记录包括该客户特征记录的数据时间、该客户的客户标识、该客户对应的一个标签名称和该标签名称对应的标签值;
111.根据所述客户特征数据表中每条客户特征记录中的数据时间、标签名称和标签值,对所述客户特征数据表中的各客户标识进行聚合运算,得到数据时间、标签名称和标签值共同对应的客户标识;
112.设置客户位图中的每一位与客户标识的映射关系,并根据所述映射关系将数据时间、标签名称和标签值共同对应的客户标识转换为客户位图;
113.根据数据时间、标签名称、标签值和转换得到的客户位图,构建所述客户标签数据集。
114.进一步的,所述对比分析模块340在用于根据所述目标客群标签数据、由所述参考客群标识查询到的参考客群标签数据和所述对比标签名称,确定所述目标客群和所述参考客群在所述对比标签维度上的对比分析结果时,所述对比分析模块340用于:
115.针对所述对比标签名称对应的每个对比标签值,根据所述目标客群标签数据从所述目标客群中筛选出具有该对比标签值的目标对比客群;以及根据所述参考客群标签数据从所述参考客群中筛选出具有该对比标签值的参考对比客群;
116.基于每个对比标签值对应的目标对比客群和参考对比客群,确定所述目标客群和所述参考客群在所述对比标签维度上的对比分析结果。
117.进一步的,所述对比分析模块340在用于基于每个对比标签值对应的目标对比客群和参考对比客群,确定所述目标客群和所述参考客群在所述对比标签维度上的对比分析结果时,所述对比分析模块340还用于:
118.确定每个对比标签值对应的目标对比客群中的目标客户数量和参考对比客群中的参考客户数量;
119.将所述目标客户数量和所述参考客户数量的比值确定为在所述对比标签维度中该对比标签值下的对比分析结果;其中,所述对比分析结果用于表征所述目标客群和所述参考客群在所述对比标签维度下的相似度。
120.进一步的,在将所述目标客户数量和所述参考客户数量的比值确定为在所述对比标签维度中该对比标签值下的对比分析结果之后,所述对比分析模块340还用于:
121.若所述对比分析结果表征所述目标客群和所述参考客群在所述对比标签维度下的相似度小于预设阈值,则将所述对比标签确定为所述目标客群和所述参考客群的区别特征。
122.进一步的,所述对比分析模块340在用于针对所述对比标签名称对应的每个对比标签值,根据所述目标客群标签数据从所述目标客群中筛选出具有该对比标签值的目标对比客群时,所述对比分析模块340用于:
123.从所述客户标签数据集确定出所述对比标签名称和对比标签值对应的对比客户位图;
124.将所述对比客户位图与所述目标客群标签数据中的目标客户位图进行交集运算,得到第一客户位图;
125.根据所述第一客户位图中每一位的值,确定所述目标客群中具有该对比标签值的目标对比客群。
126.请参阅图4,图4为本技术实施例所提供的一种电子设备的结构示意图。如图4中所示,所述电子设备400包括处理器410、存储器420和总线430。
127.所述存储器420存储有所述处理器410可执行的机器可读指令,当电子设备400运行时,所述处理器410与所述存储器420之间通过总线430通信,所述机器可读指令被所述处理器410执行时,可以执行如上述图1以及图2所示方法实施例中的一种客群圈选与对比分析的方法的步骤,具体实现方式可参见方法实施例,在此不再赘述。
128.本技术实施例还提供一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器运行时可以执行如上述图1以及图2所示方法实施例中的一种客群圈选与对比分析的方法的步骤,具体实现方式可参见方法实施例,在此不再赘述。
129.所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统、装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
130.在本技术所提供的几个实施例中,应该理解到,所揭露的系统、装置和方法,可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,又例如,多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些通信接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
131.所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
132.另外,在本技术各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。
133.所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以
存储在一个处理器可执行的非易失的计算机可读取存储介质中。基于这样的理解,本技术的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本技术各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:u盘、移动硬盘、只读存储器(read-only memory,rom)、随机存取存储器(random access memory,ram)、磁碟或者光盘等各种可以存储程序代码的介质。
134.最后应说明的是:以上所述实施例,仅为本技术的具体实施方式,用以说明本技术的技术方案,而非对其限制,本技术的保护范围并不局限于此,尽管参照前述实施例对本技术进行了详细的说明,本领域的普通技术人员应当理解:任何熟悉本技术领域的技术人员在本技术揭露的技术范围内,其依然可以对前述实施例所记载的技术方案进行修改或可轻易想到变化,或者对其中部分技术特征进行等同替换;而这些修改、变化或者替换,并不使相应技术方案的本质脱离本技术实施例技术方案的精神和范围,都应涵盖在本技术的保护范围之内。因此,本技术的保护范围应以权利要求的保护范围为准。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1