1.本发明涉及互联网云端系统技术领域,特别是一种具有合力绘制与共享的精细化运营服务平台的实现方法。
背景技术:2.大数据分析处理需要一定的技术和硬件支持,小型业务部门通常不具备这样的条件。此外,小型业务部门的业务数据通常也不足以满足大数据分析处理所需的数据量要求。
3.大型企业旗下子公司或业务部门的总体业务数据量足够大,但因为业务隔离或业务保密等原因不可能直接将原始数据集中。若企业想要整合数据用于大数据用户画像,则需要与各个子公司或业务部门单独根据业务制定数据采集协议。业务部门想要使用企业的用户画像数据也得根据自身需求不断要求调整协议,这个过程非常冗长,很难实现,平台及各个部门投入的工作量也十分巨大,而且随着时间推移,还会因为协议的不便调整而阻碍业务的灵活变化;只能不断的增加协议内容,不断调整清洗标签的程序来适配。
4.如此一来,对于子公司或小业务部门就浪费了本可以集中的数据资源。
技术实现要素:5.为解决现有技术中存在的问题,本发明的目的是提供一种具有合力绘制与共享的精细化运营服务平台的实现方法,本发明基于简单且固定的协议和使用固定规则增加标签词库,从而实现业务部门间共享企业数据的标签管理平台,充分利用企业各业务部门或子公司业务数据,使业务部门或子公司脱离算力和技术等限制条件,实现精准运营。
6.为实现上述目的,本发明采用的技术方案是:一种具有合力绘制与共享的精细化运营服务平台的实现方法,包括以下步骤:
7.步骤1、制定标签词库;
8.步骤2、制定标签输入协议:作为数据源的子公司或者业务部门根据协议输入自身处理过后的标签信息;
9.步骤3、公司或业务部门清洗标签:根据协议及标签规则清洗出标签词库中符合条件的标签并输入至精细化运营服务平台;
10.步骤4、精细化运营服务平台对标签数据进行整合;
11.步骤5、精细化运营服务平台对用户画像进行分析:当精细化运营服务平台收集到足够的标签数据后,利用硬件资源进行二次分析处理,得到更准确的用户画像;
12.步骤6、标签数据的输出:业务部门根据用户身份标识id通过接口在精细化运营服务平台查询到该用户身份标识id带有哪些标签,或者通过标签id去精细化运营服务平台查询具有该标签的用户有哪些,然后精准推送业务内容。
13.作为本发明的进一步改进,在步骤1中,标签的值包括字符串类型、数值类型和枚举类型。
14.作为本发明的进一步改进,在步骤2中,所述协议中规定了输入数据的数据格式,
以及数据内容,其中,数据内容包括用户身份标识id或与用户身份标识id能一对一转换的判别条件、标签在标签词库中的id、标签的类型、标签的值、标签值的附带属性、标签触发的时间、标签所属业务系统的id以及提交数据的业务部门在平台的注册id。
15.作为本发明的进一步改进,步骤4具体如下:
16.首先根据用户身份标识id查询平台存储的该id是否已经存储了该标签,如果没有,则增加;
17.如果有则:1)标签值为枚举类型时,新输入标签b覆盖原有标签a,原有标签a作为备份存储,若之后又有相同情况发生,则把最新的标签与标签a和标签b作对比,取重复次数最多的版本,无法取出重复版本,则使用最新输入;2)标签为数值类型时,取平均值;3)标签为字符串类型时,新输入标签覆盖原有标签。
18.作为本发明的进一步改进,还包括自定义标签和组合标签:子公司或业务部门根据协议规则,自定义标签并提交给精细化运营服务平台,精细化运营服务平台审核通过后录入标签词库供数据源输入方查询,数据源输入方根据自定义的标签规则生成对应数据并输入到精细化运营服务平台;子公司或业务部门使用已有标签进行组合形成组合标签。
19.本发明的有益效果是:
20.1、企业子公司或业务部门通过协议贡献用户标签到数据服务平台,并共享数据服务平台计算分析后的用户标签,实现了业务部门充分利用整个企业业务数据;
21.2、本发明通过建立一套具有合力绘制与共享大数据用户画像的精细化运营服务平台,企业不具备大数据处理能力的子公司或业务部门,能够将数据通过标签的形式集中起来,然后共享通过平台整合分析管理得到的精准用户画像实现各自的精细化运营;这种方式,即不会增加业务部门的工作量,又不会暴露业务部门业务内容,同时又能解决业务部门的硬件和技术限制;企业也能够得到单个业务部门或子公司数据无法得到的用户画像,得到1+1》2的数据福利;另外只要能遵守协议标准,即便不是子公司或业务部门,外部公司也同样能够作为数据源接入。
附图说明
22.图1为本发明实施例1的流程图;
具体实施方式
23.下面结合附图对本发明的实施例进行详细说明。
24.实施例1
25.如图1所示,一种具有合力绘制与共享的精细化运营服务平台的实现方法,包括:
26.1、制定标签词库:
27.初期需要制定一批常用标签词库,如:“点击”“删除”、“停留”、“小孩儿”、“成年人”、“性别”等等和企业业务相关的属性名词。随着各子系统运行,平台词库会逐步扩充,循环使用。标签的值只能是三种类型之一:一是字符串类型(限制长度);二是数值,数值还对应一个附带属性:大于、小于或等于;三是枚举,如“高,矮”、“胖,瘦”、“男,女”等。
28.2、制定标签输入协议:
29.作为数据源的子公司或者业务部门根据协议输入自身处理过后的标签信息协议
中规定了输入数据的数据格式,以及数据内容;数据必须包括:用户身份标识或与标识能一对一转换的判别条件(子公司或者业务部门通常是使用同一套用户标识系统,也就是说用户标识id在整个企业中是唯一的)、标签在标签词库中的id、标签的类型、标签的值、标签值的附带属性(如数值类型)、标签触发的时间、标签所属业务系统的id以及提交数据的业务部门在平台的注册id。
30.3、子公司或业务部门清洗标签:
31.子公司或业务部门从标签词库拉取的标签列表包含了每个标签判别规则。如“用户群”标签,在词库中规定了以“年龄,age”等作为关键词(中英文对照,以便日志过滤查询),小于10属于小孩儿,大于18属于成年人作为判别规则。子公司或业务部门在自身业务数据或日志中,过滤到关键词,以及关键词的值则可生成该用户的“用户群”标签。
32.由于协议及其词库中的标签在设定的时候规定了只能是字符串,或数值,且做了对应限制。子公司或业务部门只需要使用脚本根据词库中标签的定义在自己业务系统产生的日志中筛选过滤即可。这个操作简单而且不需要较高的硬件提供算力,脚本的开发或调整成本也极低。词库中标签的含义与企业的业务类型越正相关越容易被匹配到,在创建标签词库时也不可能定义出跟业务毫不相关的标签,如果定义了,那也没意义,匹配不出也不影响业务。另外,如果子公司或业务部门具有大数据分析处理能力,也可以根据自身条件依照协议输入处理过后的标签,这样的标签更为准确。也就是说,只要遵照协议输入,子公司或业务部门如何得出得标签并不重要。又因为固定了提交格式和内容,子公司或业务部门不需要根据平台不断调整清洗标签的程序,几乎是只需要一次低成本开发。此外,因为清洗的内容是由子公司或业务部门在标签词库创建的,也就解决了不能灵活适配自身业务这一问题。
33.4、平台的数据整合:
34.标签数据的汇集中心,所有接入平台的子公司或业务部门甚至是外部企业的输入数据汇集于此。平台在接收到标签数据后,首先根据用户标识id查询平台存储的该id是否已经存储了该标签,如果没有,则增加。如果有则分情况处理:1)标签值为枚举类型,新输入标签(b)覆盖原有标签(a),原有标签(a)作为备份存储,若之后又有相同情况发生,则把最新的标签与(a)和(b)做对比,取重复次数最多的版本,无法取出重复版本,则使用最新输入。2)标签为数值时,取平均值。3)标签为字符串时,新输入标签覆盖原有标签。
35.5、平台的用户画像分析:
36.当平台收集到足够的标签数据后,可以利用平台的硬件资源进行二次分析处理,得到更准确的用户画像.如分析出整个企业的用户的哪些行为在一天中哪个时间段会出现高峰等这类子公司或业务部门自己的小部分数据无法得到的用户画像标签。平台分析得到的标签更新到标签词库和用户标签库供子公司或业务部门使用。
37.6、标签数据的输出:
38.业务部门可以根据用户身份标识通过接口在平台查询到该身份标识id带有哪些标签,也可以通过标签id去平台查询具有该标签的用户有哪些,然后精准推送业务内容。
39.7、自定义标签:
40.业务部门可以根据协议规则,自定义标签并提交给平台,平台审核通过后录入标签词库供数据源输入方查询。数据源输入方根据自定义的标签规则生成对应数据并输入到
平台。
41.此外,业务部门还可以使用已有标签进行组合,如“四川”标签+“云南”标签+“贵州”标签,生成“云贵川”标签等。组合标签平台过滤查询即可得到。
42.实施例2
43.一种具有合力绘制与共享的精细化运营服务平台的实现方法,包括:
44.1、业务部门(不管内部还是外部)获取标签词库,根据协议及标签规则清洗出符合条件的标签并贡献输入到平台;
45.2、平台以用户身份标识id为坐标,整合来自所有业务部门的标签;
46.3、平台利用自身硬件和技术条件,对整合后的大批量标签进行用户画像分析,得到比原始标签更准确范围更广的代表用户画像信息的新标签;
47.4、业务部门根据协议创建标签,并更新到标签词库。其余业务部门根据更新后的标签词库在自身业务数据中清洗标签并贡献输入到平台;
48.5、业务部门拉取标签词库,自定义标签或组合标签输入到平台,平台计算后输入到用户画像标签集合;
49.6、业务部门使用用户身份标识id,通过平台查询该用户包含的标签;
50.7、业务部门拉取标签词库,根据业务需求选用标签,查询带有该标签的用户集;
51.8、业务部门根据查询结果运营目标用户。
52.以上所述实施例仅表达了本发明的具体实施方式,其描述较为具体和详细,但并不能因此而理解为对本发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。