基于主体对象标签变化的目标群体筛选方法、系统及计算机设备与流程

文档序号:18464683发布日期:2019-08-17 02:20阅读:234来源:国知局
本发明涉及大数据及数据分析领域,尤其涉及基于主体对象标签变化的群体筛选方法、系统及计算机设备。
背景技术
::随着大数据技术的迅速发展与企业对数据资产意识的提升,各企业内部积累了海量的数据,如何深入挖掘数据的价值以支撑企业业务发展,成为大数据应用的关键。其中客户营销领域是对客户数据应用最为广泛和深入的领域,基于企业内部海量的客户数据,通过构建客户画像,实现精准的客户分群,向客户提供精准的、个性化的服务已经成为企业提升核心竞争力的有效手段。互联网行业是数据应用技术领先的行业,其中广告是互联网企业的主要收入。广告精准投放的关键点在于识别和选择目标用户群体,而基于客户标签划分客户群体是最为通用的技术手段,目标用户群体选择的精准与否直接影响到广告投放的效果。在目前的群体筛选技术中,主要是基于客户当前拥有的标签进行交并补组合操作,实现相应的群体筛选,即只能基于某个时间切面的客户特征进行选择。此外,大部分的群体筛选技术只支持客户主体进行群体筛选,而不支持依据其它标签进行主体群体的筛选,如:不支持将设备作为标签主体,构建设备画像,对目标设备群体进行筛选。技术实现要素:本发明的目的在于克服现有技术的缺点与不足,提供基于主体对象标签变化的目标群体筛选方法、系统及计算机设备,通过主体对象标签变化的选择快速实现对发生特征变化的目标群体的筛选,解决了现有技术无法通过历史数据特征有效筛选相应的目标群体的技术问题。根据本发明的基于主体对象标签变化的目标群体筛选方法,包括以下步骤:s1、构建具有时间维度的标签存储结构,设计形成标签明细记录表;s2、对标签数据进行更新,将主体对象标签变化轨迹存储到标签明细记录表中;s3、获取目标群体筛选条件,包括主体对象标签变化条件、标签类型、标签组合规则,基于主体对象标签变化条件与标签组合规则对目标群体进行筛选;s4、判断目标群体筛选条件是否包含主体对象标签变化条件,若是执行步骤s5,否则执行步骤s7;s5、输入相应的主体对象标签变化条件,包括开始时间的标签状态与结束时间的标签状态,按照主体对象标签变化轨迹对目标群体进行筛选;对主体对象标签变化条件进行解释与转换,将主体对象标签变化处于开始状态的时间和主体对象标签变化处于结束状态的时间,转换为标签的有效时间信息,按照标签与相应的有效时间信息筛选出所处理标签相应的群体集合,再执行步骤s6;s6、判断目标群体筛选条件是否包含非主体对象标签变化条件,若是执行步骤s7,否则执行步骤s8;s7、对非主体对象标签变化条件的标签过滤条件进行解释与转换,将当前查询的时间作为标签的有效时间信息,筛选出所处理标签相应的群体集合;s8、依次对标签筛选出来的群体集合,按照标签组合规则进行交集、并集或补集操作,筛选出相应的目标群体集合。在优选的实施例中,步骤s2在对标签数据进行更新时,将最新标签数据与历史标签数据进行对比,生成相应的临时结果表,临时结果表更新完成后再同步至标签明细记录表中。在优选的实施例中,步骤s2包括:s21、进行指定标签的更新调度操作,生成最新时间节点的拥有该指定标签的对象集合set1;s22、从标签明细记录表中获取对应的标签记录信息,形成标签数据对象数据集合set2;s23、创建临时记录表,集合set1、集合set2及临时记录表的内容均包括主体对象id、标签生效时间、标签失效时间;s24、将集合set2中的主体对象id与集合set1中的主体对象id进行比较;s25、筛选集合set2及集合set1中都存在的主体对象id的记录信息,并对标签失效时间进行更新,更新为永久或下一次更新时间,将筛选出来的结果与更新后的信息,插入到临时记录表中;s26、筛选集合set2中存在而集合set1中不存在的主体对象id的记录信息,将标签失效时间信息更新为当前更新时间,将筛选出来的结果与更新后的信息,插入到临时记录表中;s27、筛选集合set1中存在而集合set2中不存在的主体对象id的记录信息,生成相应的标签生效时间与标签失效时间信息,其中标签生效时间为当前更新时间,标签失效时间更新为永久或下一次更新执行时间;将筛选出来的结果与更新后的信息,插入到临时记录表中;s28、对原有标签明细记录表中对应的标签数据进行清空,将临时记录表的数据进行批量插入。根据本发明的基于主体对象标签变化的目标群体筛选系统,包括:标签存储结构的构建模块,用于构建具有时间维度的标签存储结构,设计形成标签明细记录表;标签数据更新模块,用于对标签数据进行更新,将标签的变化轨迹存储到标签明细记录表中;目标群体筛选条件的获取模块,用于获取目标群体筛选条件,包括主体对象标签变化条件、标签类型、标签组合规则;目标群体筛选模块,判断目标群体筛选条件是否包含主体对象标签变化条件:若包含主体对象标签变化条件,则输入相应的主体对象标签变化条件,包括开始时间的标签状态与结束时间的标签状态,按照主体对象标签变化轨迹对目标群体进行筛选;对主体对象标签变化条件进行解释与转换,将主体对象标签变化处于开始状态的时间和主体对象标签变化处于结束状态的时间,转换为标签的有效时间信息,按照标签与相应的有效时间信息筛选出所处理标签相应的群体集合;再判断目标群体筛选条件是否包含非主体对象标签变化条件:若包括非主体对象标签变化条件,则对非主体对象标签变化条件的标签过滤条件进行解释与转换,将当前查询的时间作为标签的有效时间信息,筛选出所处理标签相应的群体集合;若不包含主体对象标签变化条件,则对非主体对象标签变化条件的标签过滤条件进行解释与转换,将当前查询的时间作为标签的有效时间信息,筛选出所处理标签相应的群体集合;交并补操作模块,用于依次对各标签筛选出来的群体集合,按照标签组合规则进行交集、并集或补集操作,筛选出相应的目标群体集合。根据本发明的计算机设备,包括存储器、处理器以及存储在存储器上并可在处理器上运行的计算机程序,所述处理器运行所述计算机程序时,执行上述本发明目标群体筛选方法的步骤。本发明创新性地提出将主体对象标签变化轨迹进行存储,并支持基于主体对象标签变化进行目标群体进行筛选,在普通的群体筛选中加入了从时间变化维度进行筛选的功能,实现按照对象特征变化对目标群体进行筛选。本发明与现有技术相比具有以下的有益效果:(1)本发明实现了基于主体对象标签变化对目标群体进行筛选,能快速按照用户需求将在指定时间段内特征发生变化的目标群体筛选出来。(2)本发明实现了一种能够支撑基于主体对象标签变化对目标群体筛选的标签存储架构与更新流程,提升群体筛选的查询效率,保证筛选功能的稳定高效。(3)本发明在支持用户目标群体筛选的基础上,实现所有标签主体的群体筛选,包括设备、企业、数据记录、工单等主体的群体筛选;即并不仅限于用户群体筛选,可应用于所有构建了标签主体的群体筛选,如设备群体筛选、企业群体筛选、工单群体筛选、数据记录筛选等。附图说明图1为本发明基于主体对象标签变化的目标群体筛选流程图;图2为本发明的标签更新流程图。具体实施方式下面结合实施例及附图对本发明作进一步详细的描述,但本发明的实施方式不限于此。在本发明中,标签主体指标签所标识的人或事物,可以是客户、设备、员工、工单、数据等;标签主体对象指标签所标识的事物实例,即具体的主体对象,如具体的客户张三、员工小李,也简称为标签对象;而主体对象标签变化指的是标签主体对象具有的标签发生某些变化。参见图1,本发明基于主体对象标签变化的目标群体筛选方法,包括如下步骤:s1、构建具有时间维度的标签存储结构,设计形成标签明细记录表,标签存储结构的属性包括标签id、主体对象id、标签生效时间、标签失效时间等。其中标签生效时间和标签失效时间可构成标签有效时间区间。所构建的具有时间维度的标签存储结构,可以对标签的生效时间与失效时间进行记录。且标签存储结构中所存储的是主体对象id,而不限于客户id,因此本发明的目标群体主体包括客户、设备、员工、工单等具体的主体对象集合,也包括数据。s2、采用预先设计好的标签数据更新流程,对标签数据进行更新,保证标签数据更新的性能与更新中标签数据的可靠性,最终将主体对象标签变化轨迹存储到标签明细记录表中。在对标签数据进行更新时,将最新标签数据与历史标签数据进行对比,生成相应的临时结果表,临时结果表更新完成后再同步至标签明细记录表中,保证标签数据表的可靠性,不会因为更新而影响相应的查询操作。本实施例设计了一种标签数据更新流程,以保证标签数据更新的性能与更新中标签数据的可靠性。具体的标签数据更新流程可以查看图2,包括如下步骤:s21、进行指定标签的更新调度操作,生成最新时间节点的拥有该指定标签的对象集合set1。集合set1的内容包括主体对象id、标签生效时间、标签失效时间。例如:需要对“高价值客户标签”进行更新调度,即判断更新时间节点下,拥有“高价值客户标签”的客户群体形成相应的对象集合set1。s22、从标签明细记录表中获取对应的标签记录信息,形成标签数据对象数据集合set2,集合set2的内容包括主体对象id、标签生效时间、标签失效时间等信息。例如:从标签明细记录表中将拥有“高价值客户标签”的记录取出并放到数据集合set2中,同时集合set2中还包括了拥有“高价值客户标签”的主体对象id、标签生效时间、标签失效时间等信息。s23、创建临时记录表table_tmp,临时记录表的信息包括主体对象id、标签生效时间、标签失效时间等信息。s24、将集合set2中的主体对象id与集合set1中的主体对象id进行比较,再执行下面步骤。s25、将集合set2与集合set1同时存在的主体对象,基于集合set2的数据信息更新标签失效时间到永久或下一个更新时间,将结果数据插入临时记录表table_tmp。具体为,对集合set2与集合set1中的主体对象id进行比较,在集合set2中筛选出集合set1也拥有的主体对象id的记录信息,并对标签失效时间进行更新,更新为永久或下一次更新时间,将筛选出来的结果与更新后的信息,插入到临时记录表table_tmp中。本实施例中,将表示相应的主体对象拥有“高价值客户标签”直至下一次更新,如果下一次更新时间不确定,即为永久有效。s26、将集合set2存在并且集合set1不存在的主体对象,基于集合set2的数据信息更新标签失效时间至更新时间,将结果数据插入临时记录表table_tmp。具体为,对集合set2与集合set1中的主体对象id进行比较,在集合set2中筛选出在集合set1没有相应主体对象id的记录信息,将标签失效时间信息更新为当前更新时间,即表示相应的主体对象在更新时间后已经不再拥有“高价值客户标签”;将筛选出来的结果与更新后的信息,插入到临时记录表table_tmp中。s27、将集合set2不存在并且集合set1存在的主体对象,生成相应的主体对象id集合,将标签生效时间设置为当前更新时间,标签失效时间设置为永久或下一个更新时间,最后将结果数据插入临时记录表table_tmp。具体为,对集合set2与集合set1中的主体对象id进行比较,将集合set1中存在而集合set2中不存在的主体对象id的记录信息获取出来,并生成相应的标签生效时间与标签失效时间信息,其中标签生效时间为当前更新时间,标签失效时间更新为永久或下一次更新执行时间;将筛选出来的结果与更新后的信息,插入到临时记录表table_tmp中。优选的,s25、s26、s27可以并行执行以提高更新速度;当然也可以串行执行,即依次执行。s28、对原有标签明细记录表中对应的标签数据进行清空,将临时记录表table_tmp的数据进行批量插入,完成操作后删除临时记录表table_tmp。需说明的是,上面所提到的“高价值客户标签”只是一个示例,任何一个标签都可以按照上面的流程进行更新。s3、获取目标群体筛选条件,包括主体对象标签变化条件、标签类型、标签组合规则,基于主体对象标签变化条件与标签组合规则对目标群体进行筛选。主体对象标签变化条件从时间的角度反映了主体对象标签变化轨迹。主体对象标签变化条件可定义为:选择一个开始时间并指定在该开始时间含有或不含有某一标签,同时选择一个结束时间并指定在该结束时间含有或不含有某一标签。例如:2019年1月含有“中价值客户标签”,2019年3月含有“高价值客户标签”,这样组合起来的条件就是主体对象标签变化条件。所述目标群体包括人、事物、数据等能进行标签标识的实体对象集合,具体可以是客户、设备、员工、工单或数据等实体对象集合。例如,需要筛选在上个月具有“高价值客户标签”,而本月变成“低价值客户标签”,同时具有“流失倾向标签”的客户群体;即获取到的主体对象标签变化条件为:开始时间为上月指定时间具有“高价值客户标签”,结束时间为当前查询时间具有“低价值客户标签”的客户;标签组合规则为:并且具有“流失倾向标签”。s4、判断步骤s3所获取的目标群体筛选条件是否包含主体对象标签变化条件,若是执行步骤s5,否则执行步骤s7。s5、输入相应的主体对象标签变化条件,包括开始时间的标签状态与结束时间的标签状态,按照主体对象标签变化轨迹对目标群体进行筛选。对主体对象标签变化条件进行解释与转换,将主体对象标签变化处于开始状态的时间和主体对象标签变化处于结束状态的时间,转换为标签的有效时间信息,按照标签与相应的有效时间信息筛选出所处理标签相应的群体集合,再执行步骤s6。本实施例中,对输入的主体对象标签变化条件:开始时间为上月指定时间具有“高价值客户标签”,结束时间为当前查询时间具有“低价值客户标签”的客户群体,进行解释与转换,即筛选出标签明细记录表中“高价值客户标签”相应的记录并且上月指定时间在生效时间与失效时间区间内的客户数据集合,同时筛选出标签明细记录表中“低价值客户标签”相应的记录并且当前查询时间在生效时间与失效时间区间内的客户数据集合,将两个数据集合进行交集操作,即筛选出同时在两个数据集合的数据记录集合,然后再执行步骤s6。s6、判断步骤s3所获取的目标群体筛选条件是否包含非主体对象标签变化条件,若是执行步骤s7,否则执行步骤s8。s7、对非主体对象标签变化条件的标签过滤条件进行解释与转换,将当前查询的时间作为标签的有效时间信息,筛选出所处理标签相应的群体集合。本发明中,非主体对象标签变化条件指的是普通标签条件,即不包含主体对象标签变化条件的标签条件。例如:当客户输入的标签条件为客户具有“中价值客户标签”,则不带有主体对象标签变化条件,为非主体对象标签变化条件。具有“流失倾向标签”为非主体对象标签变化条件,将当前查询的时间作为标签有效时间信息,筛选出标签明细记录表中“流失倾向标签”相应的记录并且当前查询时间在生效时间与失效时间区间内的客户数据集合。s8、依次对各标签筛选出来的群体集合,按照标签组合规则进行交集、并集或补集操作,筛选出相应的目标群体集合。本实施例中,按照步骤s3输入的标签组合规则为且,即将步骤s5-s7筛选出来的客户数据集合进行交集操作,形成最终筛选的客户数据集合。s9、将筛选的目标群体结果,输出到前端,进行展示。即将最终的客户数据集合输出到前端,进行展示。群体筛选的目标群体结果数据可以加载到缓存中,便于多次调用时,快速响应。本发明基于主体对象标签变化的目标群体筛选系统,包括:标签存储结构的构建模块,用于构建具有时间维度的标签存储结构,设计形成标签明细记录表;标签数据更新模块,用于对标签数据进行更新,将标签的变化轨迹存储到标签明细记录表中;目标群体筛选条件的获取模块,用于获取目标群体筛选条件,包括主体对象标签变化条件、标签类型、标签组合规则;目标群体筛选模块,判断目标群体筛选条件是否包含主体对象标签变化条件:若包含主体对象标签变化条件,则输入相应的主体对象标签变化条件,包括开始时间的标签状态与结束时间的标签状态,按照主体对象标签变化轨迹对目标群体进行筛选;对主体对象标签变化条件进行解释与转换,将主体对象标签变化处于开始状态的时间和主体对象标签变化处于结束状态的时间,转换为标签的有效时间信息,按照标签与相应的有效时间信息筛选出所处理标签相应的群体集合;同时判断目标群体筛选条件是否包含非主体对象标签变化条件:若包括非主体对象标签变化条件,则对非主体对象标签变化条件的标签过滤条件进行解释与转换,将当前查询的时间作为标签的有效时间信息,筛选出所处理标签相应的群体集合;若不包含主体对象标签变化条件,则对非主体对象标签变化条件的标签过滤条件进行解释与转换,将当前查询的时间作为标签的有效时间信息,筛选出所处理标签相应的群体集合;交并补操作模块,用于依次对各标签筛选出来的群体集合,按照标签组合规则进行交集、并集或补集操作,筛选出相应的目标群体集合。本发明还提出一种计算机设备,包括存储器、处理器以及存储在存储器上并可在处理器上运行的计算机程序,当处理器运行所述计算机程序时,执行本发明目标群体筛选方法的各步骤。上述为本发明较佳的实施方式,但本发明的实施方式并不受上述内容的限制,其他的任何未背离本发明的精神实质与原理下所作的改变、修饰、替代、组合、简化,均应为等效的置换方式,都包含在本发明的保护范围之内。当前第1页12当前第1页12
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1