本申请涉及大数据,尤其涉及一种标签专题生成方法、装置、电子设备及存储介质。
背景技术:
1、在金融业务中,通常会有很多标签专题用来区分不同的业务群体,当前处理标签专题的常用方式包括但不限于以下几种方式。方式1:通过构建标签专题管理服务,引用专家规则维护标签市场下每个专题与标签之间的关系;方式2:通过构建标签分类模型对不同的标签进行分类,然后基于模型输出的分类建立不同的标签专题;方式3:结合专家规则和标签分类模型对标签进行分类,基于分类结果建立不同的标签专题;
2、当前处理方式,存在以下问题点:当前处理方式输出的分类结果的准确性和时效性,依赖于专家规则或模型参数的及时调整/纠正,容易因人为因素导致分类结果未及时调整,从而影响业务决策。
技术实现思路
1、有鉴于此,本申请实施例提供了一种标签专题生成方法、装置、电子设备及存储介质,能够及时根据数据的变化,动态调整数据与业务的关系,更好的保障数据关系质量,进而保障了标签专题划分结果的准确性和时效性。
2、本申请实施例的技术方案是这样实现的:
3、第一方面,本申请实施例提供一种标签专题生成方法,包括以下步骤:
4、从至少一个数据源处实时获取源数据,并对所述源数据进行数据编织处理,得到所述源数据与业务的相关关系;
5、根据所述源数据与业务的相关关系,构建标签元数据图谱,其中,所述标签元数据图谱中包括至少一个标签元数据,所述至少一个标签元数据中每个标签元数据为与同一类型的所述业务具有所述相关关系的所述源数据;
6、基于所述标签元数据图谱,对所述至少一个标签元数据进行目录划分,得到标签分类结果,其中,所述标签分类结果包括至少一个子标签;
7、对所述标签分类结果按照预设的调整规则进行调整处理,得到标签专题。
8、在一种可能的实施方式中,所述至少一个数据源中包括至少一种类型的数据源,所述从至少一个数据源处实时获取源数据,包括:
9、构建用于收集所述源数据的跨数据源连接数据层;
10、将所述至少一种类型的所述至少一个数据源与所述跨数据源连接数据层建立数据传输通道;
11、通过所述数据传输通道从所述至少一个数据源处实时获取所述源数据,并将所述源数据存储在数据湖中。
12、在一种可能的实施方式中,所述对所述源数据进行数据编织处理,得到所述源数据与业务的相关关系,包括:
13、对所述源数据进行数据清洗处理,得到去除冗余信息的第一目标源数据;
14、对所述第一目标源数据进行识别处理,得到所述第一目标源数据与业务的相关关系。
15、在一种可能的实施方式中,所述根据所述源数据与业务的相关关系,构建标签元数据图谱,包括:
16、获取所述业务中的业务类型;
17、将与同一类型的所述业务具有所述相关关系的所述源数据确定为所述标签元数据;
18、基于所述标签元数据构建所述标签元数据图谱。
19、在一种可能的实施方式中,所述基于所述标签元数据图谱,对所述至少一个标签元数据进行目录划分,得到标签分类结果,包括:
20、获取预设的划分目录,其中,所述划分目录中包括至少一个子目录,所述至少一个子目录中每个子目录包括至少一个类型的所述业务;
21、根据所述至少一个子目录中每个子目录指定类型的所述业务,将所述至少一个标签元数据划分至对应的子目录下,得到标签分类结果,或者,
22、将所述至少一个标签元数据中每个标签元数据作为一个子目录,得到标签分类结果。
23、在一种可能的实施方式中,所述方法还包括:
24、构建业务专题管理服务,通过所述业务专题管理服务对所述标签专题进行划分,得到至少一个子专题;
25、通过人机交互界面显示所述至少一个子专题。
26、在一种可能的实施方式中,所述方法还包括:
27、构建业务专题管理服务,通过所述业务专题管理服务对所述标签专题添加定义信息;以及,
28、通过所述业务专题管理服务对所述标签专题的所述对能够以信息进行修改。
29、第二方面,本申请实施例还提供一种标签专题生成装置,所述装置包括:
30、获取模块,用于从至少一个数据源处实时获取源数据,并对所述源数据进行数据编织处理,得到所述源数据与业务的相关关系;
31、构建模块,用于根据所述源数据与业务的相关关系,构建标签元数据图谱,其中,所述标签元数据图谱中包括至少一个标签元数据,所述至少一个标签元数据中每个标签元数据为与同一类型的所述业务具有所述相关关系的所述源数据;
32、划分模块,用于基于所述标签元数据图谱,对所述至少一个标签元数据进行目录划分,得到标签分类结果,其中,所述标签分类结果包括至少一个子标签;
33、调整模块,用于对所述标签分类结果按照预设的调整规则进行调整处理,得到标签专题。
34、第三方面,本申请实施例还提供一种电子设备,包括:处理器、存储介质和总线,所述存储介质存储有所述处理器可执行的机器可读指令,当电子设备运行时,所述处理器与所述存储介质之间通过总线通信,所述处理器执行所述机器可读指令,以执行第一方面任一项所述的标签专题生成方法。
35、第四方面,本申请实施例还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器运行时执行第一方面任一项所述的标签专题生成方法。
36、本申请实施例具有以下有益效果:
37、通过从至少一个数据源处实时获取源数据,并对源数据进行数据编织处理,得到所述源数据与业务的相关关系,然后根据源数据与业务的相关关系,构建标签元数据图谱,在这个过程中,可以基于数据编织的自动编排、动态集成、语义知识图和持续洞察能力,能够及时根据数据的变化,动态调整数据与业务的关系,更好的保障数据关系质量,接着基于标签元数据图谱,对至少一个标签元数据进行目录划分,得到标签分类结果,其中,所述标签分类结果包括至少一个子标签,最后对标签分类结果按照预设的调整规则进行调整处理,得到标签专题,保障了标签专题划分结果的准确性和时效性,从而避免了对于专家规则的依赖以及人为因素导致分类结果的调整不及时。
1.一种标签专题生成方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的方法,其特征在于,所述至少一个数据源中包括至少一种类型的数据源,所述从至少一个数据源处实时获取源数据,包括:
3.根据权利要求1所述的方法,其特征在于,所述对所述源数据进行数据编织处理,得到所述源数据与业务的相关关系,包括:
4.根据权利要求1所述的方法,其特征在于,所述根据所述源数据与业务的相关关系,构建标签元数据图谱,包括:
5.根据权利要求1所述的方法,其特征在于,所述基于所述标签元数据图谱,对所述至少一个标签元数据进行目录划分,得到标签分类结果,包括:
6.根据权利要求1所述的方法,其特征在于,所述方法还包括:
7.根据权利要求1所述的方法,其特征在于,所述方法还包括:
8.一种标签专题生成装置,其特征在于,所述装置包括:
9.一种电子设备,其特征在于,包括:处理器、存储介质和总线,所述存储介质存储有所述处理器可执行的机器可读指令,当电子设备运行时,所述处理器与所述存储介质之间通过总线通信,所述处理器执行所述机器可读指令,以执行如权利要求1至7任一项所述的标签专题生成方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器运行时执行如权利要求1至7任一项所述的标签专题生成方法。