标签生成方法及相关装置与流程

文档序号:32786175发布日期:2023-01-03 18:58阅读:44来源:国知局
标签生成方法及相关装置与流程

1.本发明涉及大数据领域以及金融领域,特别涉及一种标签生成方法及相关装置。


背景技术:

2.近几年,对于涉疫人员的行程精准摸排对防疫至关重要。目前防疫工作中,主要通过运营商根据网络数据获取位置数据。
3.上述机制存在:目前通过运营商获取的位置数据,主要依赖手机的sim 卡,如果出行人在出行时不携带手机或者使用的手机卡与个人身份信息不符,这种方式比较片面,进而导致运营商无法获取到准确的位置信息,不够可靠。


技术实现要素:

4.鉴于上述问题,本发明提供一种克服上述问题或者至少部分地解决上述问题的一种标签生成方法及相关装置。
5.第一方面,一种标签生成方法,包括:
6.从银行数据库获得用户办理etc的签约数据和所述用户的通行数据;
7.从第三方平台获得当前的疫情地区信息;
8.根据预设的指标,对所述签约数据、所述通行数据和所述疫情地区信息进行统计分析,得到所述用户的涉疫标签。
9.结合第一方面,在某些可选的实施方式中,所述从银行数据库获得用户办理etc的签约数据和所述用户的通行数据,包括:
10.获得kafka-connect-oracle工具的kafka消息队列推送的所述签约数据和所述通行数据,其中,所述签约数据和所述通行数据为所述 kafka-connect-oracle工具从所述银行数据库中抽取并放入所述kafka消息队列的。
11.结合上一个实施方式,在某些可选的实施方式中,所述从第三方平台获得当前的疫情地区信息,包括:
12.获得kafka-connect-oracle工具的kafka消息队列推送的所述疫情地区信息,其中,所述疫情地区信息为所述kafka-connect-oracle工具从所述第三方平台获取并放入所述kafka消息队列的。
13.结合上一个实施方式,在某些可选的实施方式中,所述根据预设的指标,对所述签约数据、所述通行数据和所述疫情地区信息进行统计分析,得到所述用户的涉疫标签,包括:
14.根据预设的风险划分指标和预设的地域辖区划分指标,对所述kafka 消息队列推送的所述签约数据、所述通行数据和所述疫情地区信息进行统计分析,得到所述用户的涉疫标签。
15.结合上一个实施方式,在某些可选的实施方式中,所述根据预设的风险划分指标和预设的地域辖区划分指标,对所述kafka消息队列推送的所述签约数据、所述通行数据和
所述疫情地区信息进行统计分析,得到所述用户的涉疫标签,包括:
16.根据所述签约数据,确定相应用户的身份信息;
17.根据所述通行数据和所述地域辖区划分指标,确定所述用户经过的地区的行程信息;
18.根据所述风险划分指标、所述疫情地区信息和所述行程信息,确定所述用户的涉疫风险信息;
19.根据所述身份信息、所述行程信息和所述涉疫风险信息,分别对应提取得到所述用户的身份标签、行程标签和涉疫风险标签。
20.结合第一方面,在某些可选的实施方式中,在所述根据预设的指标,对所述签约数据、所述通行数据和所述疫情地区信息进行统计分析,得到所述用户的涉疫标签之后,所述方法还包括:
21.通过离线数据同步工具,将所述涉疫标签存储至分布式数据库。
22.第二方面,一种标签生成装置,包括:银行数据获得子单元、疫区信息获得单元和数据加工单元;
23.所述银行数据获得单元,用于从银行数据库获得用户办理etc的签约数据和所述用户的通行数据;
24.所述疫区信息获得单元,用于从第三方平台获得当前的疫情地区信息;
25.所述数据加工单元,用于根据预设的指标,对所述签约数据、所述通行数据和所述疫情地区信息进行统计分析,得到所述用户的涉疫标签。
26.结合第二方面,在某些可选的实施方式中,所述银行数据获得单元,包括:银行数据获得子单元;
27.所述银行数据获得子单元,用于获得kafka-connect-oracle工具的kafka 消息队列推送的所述签约数据和所述通行数据,其中,所述签约数据和所述通行数据为所述kafka-connect-oracle工具从所述银行数据库中抽取并放入所述kafka消息队列的。
28.第三方面,一种计算机可读存储介质,其上存储有程序,所述程序被处理器执行时实现上述任一项所述的标签生成方法。
29.第四方面,一种电子设备,所述电子设备包括至少一个处理器、以及与所述处理器连接的至少一个存储器、总线;其中,所述处理器、所述存储器通过所述总线完成相互间的通信;所述处理器用于调用所述存储器中的程序指令,以执行上述任一项所述的标签生成方法。
30.借由上述技术方案,本发明提供的标签生成方法及相关装置,通过从银行数据库获得用户办理etc的签约数据和所述用户的通行数据;从第三方平台获得当前的疫情地区信息;根据预设的指标,对所述签约数据、所述通行数据和所述疫情地区信息进行统计分析,得到所述用户的涉疫标签。由此可以看出,本发明可以基于etc的签约数据确定用户,然后结合用户的通行数据和疫情地区信息,形成用户的涉疫标签,从多方面摸排用户的涉疫情况,比较准确可靠。
31.上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂,以下特举本发明的具体实施方式。
附图说明
32.通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本发明的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:
33.图1示出了本发明提供的第一种标签生成方法的流程图;
34.图2示出了本发明提供的第二种标签生成方法的流程图;
35.图3示出了本发明提供的第三种标签生成方法的流程图;
36.图4示出了本发明提供的第四种标签生成方法的流程图;
37.图5示出了本发明提供的第五种标签生成方法的流程图;
38.图6示出了本发明提供的第六种标签生成方法的流程图;
39.图7示出了本发明提供的一种标签生成装置的结构示意图;
40.图8示出了本发明提供的一种电子设备的结构示意图。
具体实施方式
41.需要说明的是,本发明提供的标签生成方法及相关装置可用于大数据领域以及金融领域。上述仅为示例,并不对本发明提供的标签生成方法及相关装置的应用领域进行限定。
42.本发明提供的标签生成方法及相关装置可用于金融领域或其他领域,例如,可用于金融领域中的大数据应用场景。其他领域为除金融领域之外的任意领域,例如,大数据领域。上述仅为示例,并不对本发明提供的标签生成方法及相关装置的应用领域进行限定。
43.下面将参照附图更详细地描述本发明的示例性实施例。虽然附图中显示了本发明的示例性实施例,然而应当理解,可以以各种形式实现本发明而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本发明,并且能够将本发明的范围完整的传达给本领域的技术人员。
44.如图1所述,本发明提供了一种标签生成方法,包括:s100、s200和 s300;
45.s100、从银行数据库获得用户办理etc的签约数据和所述用户的通行数据;
46.可选的,本发明所说的签约数据可以包括办理etc(中文名:电子不停车收费系统,英文名:electronictollcollection)的用户的基本信息,例如,姓名、身份证号、驾驶证编号和行车证编号等。
47.可选的,用户的通行信息可以是办理相应etc的用户的出行信息,本发明可以从多个渠道获得,包括从车载智能终端和用户的手机终端等获得通行数据。
48.可选的,本发明对于获得签约数据和通行数据的过程不做具体限制。例如,如图2所示,结合图1所示的实施方式,在某些可选的实施方式中,所述s100,包括:s110;
49.s110、获得kafka-connect-oracle工具的kafka消息队列推送的所述签约数据和所述通行数据,其中,所述签约数据和所述通行数据为所述 kafka-connect-oracle工具从所述银行数据库中抽取并放入所述kafka消息队列的。
50.可选的,kafka-connect-oracle和kafka消息队列等概念属于本领域的公知概念,本发明对此不做过多描述,具体请参见本领域的相关说明。
51.可选的,本发明可以采用全量数据采集的方式,使用 kafka-connect-oracle工具
从银行的oracle数据库采集获得签约数据和通行数据,可以是存量用户的数据,也可以是新增用户的数据。
52.s200、从第三方平台获得当前的疫情地区信息;
53.可选的,本发明所说的第三方平台可以是官方发布权威疫情信息的第三方平台。疫情地区信息中可以包括有疫情的地区的信息和没有疫情的地区的信息,本发明对此不做限制。
54.可选的,本发明所说的s100和s200之间没有必然的先后执行顺序,可以先执行s100,也可以先执行s200,还可以并行执行s100和s200。
55.可选的,本发明对于获得疫情地区信息的方式不做具体限制,任何可行的方式均属于本发明的保护范围。例如,如图3所示,结合图2所示的实施方式,在某些可选的实施方式中,所述s200,包括:s210;
56.s210、获得kafka-connect-oracle工具的kafka消息队列推送的所述疫情地区信息,其中,所述疫情地区信息为所述kafka-connect-oracle工具从所述第三方平台获取并放入所述kafka消息队列的。
57.可选的,本发明可以采用流式数据采集的方式,使用 kafka-connect-oracle工具从第三方平台的数据库中获得疫情地区信息,本发明对此不做限制。
58.s300、根据预设的指标,对所述签约数据、所述通行数据和所述疫情地区信息进行统计分析,得到所述用户的涉疫标签。
59.可选的,本发明所说的指标可以理解为提取涉疫标签所依据的条件,例如,本发明可以根据地域辖区划分指标,判断用户所途径的道路和小区等属于哪个地区。又例如,本发明可以依据高风险、中风险和低风险等风险划分指标,判断用户所经过的地区符合哪个指标。
60.即,如图4所示,结合图3所示的实施方式,在某些可选的实施方式中,所述s300,包括:s310;
61.s310、根据预设的风险划分指标和预设的地域辖区划分指标,对所述 kafka消息队列推送的所述签约数据、所述通行数据和所述疫情地区信息进行统计分析,得到所述用户的涉疫标签。
62.可选的,本发明所说的涉疫标签可以理解为是一个标签体系,包括多个标签,通过该标签体系可以反映出用户的一些涉疫情况。
63.可选的,本发明对于统计分析得到涉疫标签的过程不做具体限制,任何可行的方式均属于本发明的保护范围。例如,如图5所示,结合图4所示的实施方式,在某些可选的实施方式中,所述s310,包括:s311、s312、 s313和s314;
64.s311、根据所述签约数据,确定相应用户的身份信息;
65.可选的,如前所述,签约数据中可以包括用户的基本信息,从而可以准确确定用户的身份信息。
66.s312、根据所述通行数据和所述地域辖区划分指标,确定所述用户经过的地区的行程信息;
67.可选的,如前所述,地域辖区划分指标表征不同道路和小区等所属的地区,行程通行数据中记录了用户走过的道路和经过的小区等信息,因此,基于地域辖区划分指标和通
行数据,可以确定用户的行程信息。
68.s313、根据所述风险划分指标、所述疫情地区信息和所述行程信息,确定所述用户的涉疫风险信息;
69.可选的,如前所述,风险划分指标中可以设置了高风险、中风险和低风险等指标,因此,本发明可以根据疫情地区信息和行程信息,确定用户的涉疫风险信息。例如,确定用户为涉疫高风险、涉疫中风险或者涉疫低风险。
70.s314、根据所述身份信息、所述行程信息和所述涉疫风险信息,分别对应提取得到所述用户的身份标签、行程标签和涉疫风险标签。
71.可选的,如前所述,前述得到的是各个信息,本发明可以对标签进一步提取,得到相应的标签,以便于在前端展示用户的标签。例如,本发明可以基于bfe框架开发相应的前端,用以展示标签。其中,bfe框架基于统一前端技术框架开源的七层流量接入系统框架。
72.可选的,本发明所说的s311、s312和s313之间没有必然的先后执行顺序,可以按任何顺序串行执行,也可以并行执行。
73.可选的,如图6所示,结合图1所示的实施方式,在某些可选的实施方式中,在所述s300之后,所述方法还包括:s400;
74.s400、通过离线数据同步工具,将所述涉疫标签存储至分布式数据库。
75.可选的,本发明对于离线数据同步工具和分布式数据库不做具体限制,例如,本发明可以使用datax组件将涉疫标签同步存储至tdsql。其中,tdsql是一款分布式数据库产品,具备强一致高可用、全球部署架构、分布式水平扩展、高性能、企业级安全等特性,同时提供智能dba、自动化运营、监控告警等配套设施,为客户提供完整的分布式数据库解决方案。 datax组件是被广泛使用的离线数据同步工具/平台,实现包括mysql、 sqlserver、oracle、postgresql、hdfs、hive、hbase、ots、odps等各种异构数据源之间高效的数据同步功能。
76.可选的,本发明还可以开放存储涉疫标签的分布式数据库的接口,以便于其他系统调用涉疫标签。当然,本发明也可以将涉疫标签推送给相关部门的平台,本发明对此不做限制。
77.如图7所示,本发明提供了一种标签生成装置,包括:银行数据获得子单元100、疫区信息获得单元200和数据加工单元300;
78.所述银行数据获得单元100,用于从银行数据库获得用户办理etc的签约数据和所述用户的通行数据;
79.所述疫区信息获得单元200,用于从第三方平台获得当前的疫情地区信息;
80.所述数据加工单元300,用于根据预设的指标,对所述签约数据、所述通行数据和所述疫情地区信息进行统计分析,得到所述用户的涉疫标签。
81.结合图7所示的实施方式,在某些可选的实施方式中,所述银行数据获得单元100,包括:银行数据获得子单元;
82.所述银行数据获得子单元,用于获得kafka-connect-oracle工具的kafka 消息队列推送的所述签约数据和所述通行数据,其中,所述签约数据和所述通行数据为所述kafka-connect-oracle工具从所述银行数据库中抽取并放入所述kafka消息队列的。
83.结合上一个实施方式,在某些可选的实施方式中,所述疫区信息获得单元200,包
括:疫区信息获得子单元;
84.所述疫区信息获得子单元,用于获得kafka-connect-oracle工具的kafka 消息队列推送的所述疫情地区信息,其中,所述疫情地区信息为所述 kafka-connect-oracle工具从所述第三方平台获取并放入所述kafka消息队列的。
85.结合上一个实施方式,在某些可选的实施方式中,所述数据加工单元 300,包括:数据加工子单元;
86.所述数据加工子单元,用于根据预设的风险划分指标和预设的地域辖区划分指标,对所述kafka消息队列推送的所述签约数据、所述通行数据和所述疫情地区信息进行统计分析,得到所述用户的涉疫标签。
87.结合上一个实施方式,在某些可选的实施方式中,所述数据加工子单元,包括:身份信息确定子单元、行程信息确定子单元、风险信息确定子单元和标签提取子单元;
88.所述身份信息确定子单元,用于根据所述签约数据,确定相应用户的身份信息;
89.所述行程信息确定子单元,用于根据所述通行数据和所述地域辖区划分指标,确定所述用户经过的地区的行程信息;
90.所述风险信息确定子单元,用于根据所述风险划分指标、所述疫情地区信息和所述行程信息,确定所述用户的涉疫风险信息;
91.所述标签提取子单元,用于根据所述身份信息、所述行程信息和所述涉疫风险信息,分别对应提取得到所述用户的身份标签、行程标签和涉疫风险标签。
92.结合图7所示的实施方式,在某些可选的实施方式中,所述装置还包括:标签存储单元;
93.所述标签存储单元,用于在所述根据预设的指标,对所述签约数据、所述通行数据和所述疫情地区信息进行统计分析,得到所述用户的涉疫标签之后,通过离线数据同步工具,将所述涉疫标签存储至分布式数据库。
94.本发明提供了一种计算机可读存储介质,其上存储有程序,所述程序被处理器执行时实现上述任一项所述的标签生成方法。
95.如图8所示,本发明提供了一种电子设备70,所述电子设备70包括至少一个处理器701、以及与所述处理器701连接的至少一个存储器702、总线703;其中,所述处理器701、所述存储器702通过所述总线703完成相互间的通信;所述处理器701用于调用所述存储器702中的程序指令,以执行上述任一项所述的标签生成方法。
96.在本发明中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个
……”
限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
97.本说明书中的各个实施例均采用相关的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于系统实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例
的部分说明即可。
98.对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本发明中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本发明所示的这些实施例,而是要符合与本发明所公开的原理和新颖特点相一致的最宽的范围。
99.以上所述仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围。凡在本发明的精神和原则之内所作的任何修改、等同替换、改进等,均包含在本发明的保护范围内。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1