一种用户主数据的生成方法及系统的制作方法
【技术领域】
[0001] 本发明涉及计算机领域,特别涉及一种用户主数据的生成方法及系统。
【背景技术】
[0002] 随着计算机技术的发展,在计算机网络侧存在多个业务平台,为用户提供不同类 型的业务服务,在多个业务平台为用户提供不同类型的业务服务过程中,需要获取用户相 关的数据。因此,同一用户的数据可能在多个不同的业务平台上存在,且各个业务平台上存 储的同一用户的数据,也存在新旧及有效无效差异,在计算机网络对同一用户的数据进行 管理时,造成困难,计算机网络侧中的各种业务平台无法识别自身存储的用户数据是否准 确,无法基于自身存储的用户数据进行用户数据分析、评级和根据用户数据分析结果制定 对应的营销策略等,给各个业务平台的管理维护造成困难。
[0003] 因此,为了克服上述困难,需要统一对同一用户的有效数据进行删选,得到用户主 数据,作为后续进行用户数据分析、评级和根据用户数据分析结果制定营销策略的唯一基 础。
[0004] 图1为现有技术提供的用户主数据的生成方法流程图,其具体步骤为:
[0005] 步骤101、计算机网络侧的各个业务平台将用户数据采集后,上报给计算机网络侧 中处理用户数据的服务器;
[0006] 在这里,用户数据为多个用户的不同数据;
[0007] 步骤102、所述服务器将接收到的来自不同业务平台上的用户数据进行用户识别 要素范围划分;
[0008] 在这里,用户识别要素划分是对每一个用户的用户数据的内容进行分类,比如分 为:用户姓名、证据类型、证据号码和手机号码等;
[0009] 步骤103、所述服务器探查识别要素范围内的用户数据质量及用户数据分布;
[0010] 步骤104、所述服务器根据探查结果,选择用户数据识别算法;
[0011] 在本步骤中,用户数据识别算法有多种,比如根据用户识别要素范围内的身份证 号码和用户姓名进行用户数据识别,在这里,是根据探查结果,选择用户数据识别算法的, 比如探查出的用户的用户数据多分布在身份证号码和用户姓名等用户数据中,则采用的 用户数据识别算法为根据用户识别要素范围内的身份证号码和用户姓名进行用户数据识 别;
[0012] 步骤105、所述服务器进行用户数据的逻辑归并,得到用户主数据;
[0013] 在本步骤中,对用户数据进行识别后,就可以根据设定的信息逻辑归并方法或所 设定的其他物理归并方法,对用户数据进行逻辑归并,得到需要的用户主数据;
[0014] 在本步骤中,得到的用户主数据就是按照身份证号码和用户姓名对用户数据进行 逻辑归并,得到对应身份证号码和用户姓名的用户主数据;
[0015] 步骤106、所述服务器对用户主数据设置统一的用户标识后,结束。
[0016] 从图1可以看出,目前用户主数据的生成方法存在以下缺点:
[0017] 第一,在对用户数据识别过程中,没有完善的用户数据清洗控制和实现方法,使得 不准确的用户数据也一并被进行了用户主数据的生成;
[0018] 第二,采用基于识别要素范围划分的用户数据识别算法固化和死板,会造成无法 实现真正意义上的用户数据归并;
[0019] 第三,逻辑归并并没有实现真正意义上的用户主数据,也就是没有将同一用户在 不同业务平台的用户数据合并为一条用户主数据;
[0020] 第四,如果采用固定的逻辑归并方法,则会存在将其他业务平台上的有效的和最 新用户数据给屏蔽的情况;
[0021] 第五,在生成统一的用户标识后之后,由于在用户数据归并和用户数据覆盖过程 中造成的有效用户数据丢失,会造成用户数据失真的情况;
[0022] 第六,在增量的用户数据再次合并方面支持不足。
[0023] 因此,基于图1所生成的用户主数据作为后续进行用户数据分析、评级和根据 用户数据分析结果制定营销策略的基础,存在着很多问题,由于按照图1所述的过程得 到用户主数据不准确且固化,所以最终造成以用户分析为目标的计算机网络侧的客户关 系管理(CRM,Customer Relationship Management)和企业级用户信息整合系统(ECIF, Enterprise Customer Information Facility)在进行用户数据分析时,达不到用户价值 最大化的预期目标。
【发明内容】
[0024] 有鉴于此,本发明实施例提供一种用户主数据的生成方法,该方法能够根据需要 生成灵活的用户主数据,且保证生成的用户主数据准确。
[0025] 本发明实施例还提供一种用户主数据的生成系统,该系统能够根据需要生成灵活 的用户主数据,且保证生成的用户主数据准确。
[0026] 根据上述目的,本发明是这样实现的:
[0027] 一种用户主数据的生成方法,包括:
[0028] 接收各个业务平台所采集的用户数据;
[0029] 对所采集的用户数据进行清洗;
[0030] 根据清洗后的用户数据质量分析结果,生成树结构的多个用户识别算法,从生成 的多个用户识别算法中选择一个以上的用户识别算法对清洗后的用户数据进行归并;
[0031] 对归并后的用户数据按照设置的数据覆盖算法针对同一用户的重复用户数据覆 盖后,得到用户主数据。
[0032] 一种用户主数据的生成系统,包括:采集模块、清洗模块、数据质量分析模块、选择 模块、归并模块及覆盖模块,其中,
[0033] 采集模块,用于采集各个业务平台上的用户数据;
[0034] 清洗模块,用于将所采集的用户数据进行清洗;
[0035] 数据质量分析模块,用于对清洗后的用户数据进行数据质量分析后,得到数据分 析结果,根据数据分析结果,生成树结构的多个用户识别算法;
[0036] 选择模块,用于从生成的多个用户识别算法中选择一个以上的用户识别算法;
[0037] 归并模块,用于采用所选择的一个以上的用户识别算法对清洗后的用户数据进行 归并;
[0038] 覆盖模块,用于对归并后的用户数据按照设置的数据覆盖算法针对同一用户的重 复用户数据覆盖后,得到用户主数据。
[0039] 由上述方案可以看出,本发明实施例将从各个业务平台采集用户数据后后,首先 对所采用的用户数据清洗;其次,根据用户数据质量分析结果,生成树结构的多个用户识别 算法,从生成的多个用户识别算法中选择一个以上的用户识别算法对清洗后的用户数据进 行归并;最后,对归并后的用户数据按照设置的数据覆盖算法针对同一用户的重复用户数 据覆盖后,得到用户主数据。由于本发明在对用户数据进行归并前进行清洗,将其中的无用 数据丢弃;并在后续对归并后的用户数据进行同一用户的重复用户数据覆盖,所以保证了 所生产的用户主数据准确;本发明实施例还可以根据用户数据质量分析结果生成树结构的 多个用户识别算法,并从中选择选择一个以上的用户识别算法进行组合计算,对用户数据 进行合并,这样可以确定最优的归并方法,从而根据需要生成灵活的用户主数据。
【附图说明】
[0040] 图1为现有技术提供的用户主数据的生成方法流程图;
[0041] 图2为本发明实施例提供的用户主数据的生成方法流程图;
[0042] 图3为本发明实施例提供的采用java进行用户主数据的生成方法框架示意图;
[0043] 图4为本发明实施例提供的用户主数据的生成系统结构示意图;
[0044]图5为本发明实施例提供的多个用户识别算法的树结构示意图;
【具体实施方式】
[0045] 为使本发明的目的、技术方案及优点更加清楚明白,以下参照附图并举实施例,