业务场景数据提取方法、装置、计算机设备及存储介质与流程

文档序号:29700931发布日期:2022-04-16 14:26阅读:144来源:国知局
业务场景数据提取方法、装置、计算机设备及存储介质与流程

1.本发明涉及数据处理方法,更具体地说是指业务场景数据提取方法、装置、计算机设备及存储介质。


背景技术:

2.在银行金融领域存在大量的业务场景,无论对于互联网营销、还是电话外呼,或者是对于业务经理人工跟进,都需要根据相关业务场景规则进行相关数据提取。但是目前的数据提取平台更多偏向于数据库之间的自动化关联计算,而脱离银行业务场景实际,不能满足银行对于不同业务场景需求的数据提取需求。
3.因此,有必要设计一种新的方法,实现依据银行的不同业务场景需求进行对应的数据提取,以满足不同业务场景需求的数据提取需求。


技术实现要素:

4.本发明的目的在于克服现有技术的缺陷,提供业务场景数据提取方法、装置、计算机设备及存储介质。
5.为实现上述目的,本发明采用以下技术方案:业务场景数据提取方法,包括:
6.确定银行的用户标签体系,并拉取银行用户的数据库表内容数据;
7.对银行用户的数据库表内容数据按照银行的用户标签体系的不同特性进行标签归类,以得到用户标签;
8.根据所述用户标签以及银行用户的数据库表内容数据按照不同的业务场景提取业务内容数据,以得到提取结果;
9.输出所述提取结果。
10.其进一步技术方案为:所述对银行用户的数据库表内容数据按照银行的用户标签体系的不同特性进行标签归类,以得到用户标签,包括:
11.按照银行的用户标签体系对银行用户的数据库表内容数据中基础数据进行标签映射,以得到映射结果;
12.按照银行的用户标签体系对银行用户的数据库表内容数据中的相关数值进行统计,以得到统计结果;
13.按照银行的用户标签体系对银行用户的数据库表内容数据进行文本挖掘,以得到挖掘结果;
14.整合所述映射结果、所述统计结果以及所述挖掘结果,以得到用户标签。
15.其进一步技术方案为:所述根据所述用户标签以及银行用户的数据库表内容数据按照不同的业务场景提取业务内容数据,以得到提取结果,包括:
16.根据所述用户标签构建筛选规则模板;
17.构建用户信息关联数据库表的字段的输出模板;
18.定义sql预约提取数据的功能;
19.采用筛选规则模板、输出模板以及sql预约提取数据的功能按照不同的业务场景提取业务内容数据,以得到提取结果。
20.其进一步技术方案为:所述筛选规则模板是采用以所述用户标签进行特征信息筛选的模板。
21.其进一步技术方案为:所述采用筛选规则模板、输出模板以及sql预约提取数据的功能按照不同的业务场景提取业务内容数据,以得到提取结果,包括:
22.采用所述筛选规则模板以所述用户标签进行不同的业务场景的特征信息筛选,以得到用户信息;
23.采用输出模板根据所述用户信息与具体内容数据库表进行关联表格查询,并任务流有向图的方式输出关联的内容数据库表;
24.采用sql预约提取数据的功能提取符合用户设定条件的数据,以得到sql数据;
25.整合所述用户信息、关联的内容数据库表以及sql数据,以得到提取结果。
26.其进一步技术方案为:所述输出所述提取结果,包括:
27.采用api主动推送方式或api被动拉取方式输出所述提取结果。
28.本发明还提供了业务场景数据提取装置,包括:
29.确定单元,用于确定银行的用户标签体系,并拉取银行用户的数据库表内容数据;
30.标签生成单元,用于对银行用户的数据库表内容数据按照银行的用户标签体系的不同特性进行标签归类,以得到用户标签;
31.提取单元,用于根据所述用户标签以及银行用户的数据库表内容数据按照不同的业务场景提取业务内容数据,以得到提取结果;
32.输出单元,用于输出所述提取结果。
33.其进一步技术方案为:所述标签生成单元包括:
34.映射子单元,用于按照银行的用户标签体系对银行用户的数据库表内容数据中基础数据进行标签映射,以得到映射结果;
35.统计子单元,用于按照银行的用户标签体系对银行用户的数据库表内容数据中的相关数值进行统计,以得到统计结果;
36.挖掘子单元,用于按照银行的用户标签体系对银行用户的数据库表内容数据进行文本挖掘,以得到挖掘结果;
37.结果整合子单元,用于整合所述映射结果、所述统计结果以及所述挖掘结果,以得到用户标签。
38.本发明还提供了一种计算机设备,所述计算机设备包括存储器及处理器,所述存储器上存储有计算机程序,所述处理器执行所述计算机程序时实现上述的方法。
39.本发明还提供了一种存储介质,所述存储介质存储有计算机程序,所述计算机程序被处理器执行时可实现上述的方法。
40.本发明与现有技术相比的有益效果是:本发明通过确定银行的用户标签体系,结合银行用户的数据库表内容数据进行标签归类,以形成用户标签,将所述用户标签以及银行用户的数据库表内容数据按照不同的业务场景提取业务内容数据,以形成提取结果,并按照不同需求输出提取结果,实现依据银行的不同业务场景需求进行对应的数据提取,以满足不同业务场景需求的数据提取需求。
41.下面结合附图和具体实施例对本发明作进一步描述。
附图说明
42.为了更清楚地说明本发明实施例技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
43.图1为本发明实施例提供的业务场景数据提取方法的应用场景示意图;
44.图2为本发明实施例提供的业务场景数据提取方法的流程示意图;
45.图3为本发明实施例提供的业务场景数据提取方法的子流程示意图;
46.图4为本发明实施例提供的业务场景数据提取方法的子流程示意图;
47.图5为本发明实施例提供的业务场景数据提取方法的子流程示意图;
48.图6为本发明实施例提供的业务场景数据提取装置的示意性框图;
49.图7为本发明实施例提供的业务场景数据提取装置的标签生成单元的示意性框图;
50.图8为本发明实施例提供的业务场景数据提取装置的提取单元的示意性框图;
51.图9为本发明实施例提供的业务场景数据提取装置的数据提取子单元的示意性框图;
52.图10为本发明实施例提供的计算机设备的示意性框图。
具体实施方式
53.下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
54.应当理解,当在本说明书和所附权利要求书中使用时,术语“包括”和“包含”指示所描述特征、整体、步骤、操作、元素和/或组件的存在,但并不排除一个或多个其它特征、整体、步骤、操作、元素、组件和/或其集合的存在或添加。
55.还应当理解,在此本发明说明书中所使用的术语仅仅是出于描述特定实施例的目的而并不意在限制本发明。如在本发明说明书和所附权利要求书中所使用的那样,除非上下文清楚地指明其它情况,否则单数形式的“一”、“一个”及“该”意在包括复数形式。
56.还应当进一步理解,在本发明说明书和所附权利要求书中使用的术语“和/或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合,并且包括这些组合。
57.请参阅图1和图2,图1为本发明实施例提供的业务场景数据提取方法的应用场景示意图。图2为本发明实施例提供的业务场景数据提取方法的示意性流程图。该业务场景数据提取方法应用于服务器中。该服务器与终端进行数据交互,服务器确定银行的用户标签体系后,从终端拉取银行用户的数据库表内容数据,并挖掘对应的用户标签,利用用户标签进行业务内容数据的提取,依据不同的需求采用不同方式输出提取结果,结合实际的业务场景,解决银行各业务场景中的用户圈层和用户数据提取的需求,提升银行数字化能力,实现依据银行的不同业务场景需求进行对应的数据提取,以满足不同业务场景需求的数据提
取需求。
58.图2是本发明实施例提供的业务场景数据提取方法的流程示意图。如图2所示,该方法包括以下步骤s110至s140。
59.s110、确定银行的用户标签体系,并拉取银行用户的数据库表内容数据。
60.在本实施例中,银行的用户标签体系是指人员基本信息标签、产品标签、指标标签、行为消费标签。
61.银行系统用户量巨大,但是由于用户的基本信息、经济状况、消费能力、产品关联度等都差异巨大,同时银行的产品体系庞大,无论在人工客服、智能外呼、或者互联网营销,都需要做到对特定场景进行高质量地适当圈定人群圈定。因此,需要建立全方位的人群标签体系,以确保业务场景数据提取的顺利执行。
62.人员基本信息包括性别标签:男、女;年龄:60后、70后、80后、90后、00后;住址标签:豪宅住户、高档小区住户、中档小区住户、无自住房用户等;教育背景标签:博士、硕士学历、本科学历、大专学历等;所在城市标签:一线城市、二线城市等;职业标签:企业高管、公务员、学生、自由职业、退休人员、头部科技公司员工、高校教师、国企等;产品标签主要是根据用户在银行购买的理财产品等标签信息,包括:证券用户、理财(乾元)用户、基金用户、国债用户;ldy、hdy、信用卡用户、etc用户、房贷用户、微信绑卡用户、支付宝绑卡用户。用户资产指标标签可以按照存款、股票等进行细分,包括:高aum、中aum、低aum、理财高aum、理财中aum、理财低aum、证券高aum、证券中aum、证券低aum、存款高aum、存款中aum、存款低aum等。行为消费标签可以分为:高信用额度、高消费、高消费频次、高酒店消费、高旅行消费、高ktv消费、高教育消费、高服饰消费、高餐厅消费、高美容消费等。
63.在进行了上述银行的用户标签体系建立之后,拉取银行用户的数据库表内容数据用于人群标签体系分类体系的抽取、挖掘及模型训练,此外这些数据也是具体业务化场景可能需要输出的内容数据。数据库表包括:用户基本信息表、用户银行卡开卡信息记录表、用户转账信息记录表、信用卡数据信息表、贷款信息记录表、还款信息记录等大约20几关键数据库表。由于相关库表中数据字段过多,数据量很大,一般需要拟定核心库表字段,采用datax等数据库开源工具将相关数据同步到银行内部中。
64.s120、对银行用户的数据库表内容数据按照银行的用户标签体系的不同特性进行标签归类,以得到用户标签。
65.在本实施例中,用户标签是指对银行用户的数据库表内容数据进行标签归类后形成的结果。
66.建立的用户标签系统,有些是基于用户基础信息直接进行分类的,例如用户的性别、教育背景等大部分基础信息,都是基本信息表中有专门字段进行记录的,知识需要进一步归类;有些是基于历史数据进行统计计算而得到的,例如aum值、月均收入、月均转账次数等数据信息;有些是基于其他数据信息进行挖掘而得到的,例如消费行为数据:高档酒店、ktv消费等数据信息,一般是从消费转账的备注文本信息或店家名、商品名等信息进行抽取,并需要结合外部知识数据进行归类。因此,根据上述基于用户基础信息直接进行分类、基于历史数据进行统计、基于其他数据信息进行挖掘这三大类标签的不同特性分别进行具体的用户标签的挖掘。
67.在一实施例中,请参阅图3,上述的步骤s120可包括步骤s121~s124。
68.s121、按照银行的用户标签体系对银行用户的数据库表内容数据中基础数据进行标签映射,以得到映射结果。
69.在本实施例中,映射结果是指银行用户的数据库表内容数据中基础数据按照银行的用户标签体系进行标签归类后形成的结果。
70.大多数的基础性标签即人员基本信息标签是直接从用户基础信息表中进行抽取识别。在用户基础信息表中一般含有用户性别、出生年月、教育背景等字段信息,采用规则分类的方式直接用户标签体系的分类方式,直接进行标签映射,在映射过程中一般可能需要进行简单的基于数字/日期计算或正则模板规则的方式进行计算,由此对银行用户的数据库表内的基础数据进行标签归类。
71.s122、按照银行的用户标签体系对银行用户的数据库表内容数据中的相关数值进行统计,以得到统计结果。
72.在本实施例中,统计结果是指对银行用户的数据库表内容数据中的相关数值进行统计后实现标签归类。
73.多数的标签是需要根据用户数据库表中的多条记录信息进行一系列流程的统计计算,例如对于aum值、平均收入等。对于aum值、平均收入等而言,对每个用户数据按相关日、月、季、年等时间周期进行相关平均数或总数等计算;对于贷款次数、月均转账次数等指标标签,一般需要按照记录总数及日期平均进行统计计算;对于高消费等客户标签信息,采用数据统计计算的方式,主要统计单次消费的平均额度、平均月均消费总额等数值信息;由此实现对银行用户的数据库表内容数据中的相关数值的统计,达到对应数据的标签归类。
74.s123、按照银行的用户标签体系对银行用户的数据库表内容数据进行文本挖掘,以得到挖掘结果。
75.在本实施例中,挖掘结果是指银行用户的数据库表内容数据进行文本挖掘,以实现对应数据的标签归类。
76.在对数据进行标签归类时,有些标签是需要从银行卡消费行为等记录信息进行挖掘的,包括从第三方或快捷支付收录记下来的商家名称、场所、服务等备注信息。由于需要从这些信息中抽取小区、咖啡厅、酒店、旅居、餐厅、服饰等信息,因此需要事先整理相关商家品牌信息,并对品牌信息按照价格区段进行档次划分。由于重点关注小区、咖啡厅、酒店等几类特定标签信息,因此,主要从相关行业网站上采用智能爬虫方式进行定向抓取,并采用正则模板对相关实体词语和价格等信息进行抽取,从而获得具体小区、酒店等实体信息,以及相关价格数据信息,进一步按照价格信息对相关实体数据进行档次划分,例如将平均价格大于10万的定位豪华小区、大于6万的定位高档小区、在3万以上定位中档小区等。而对于银行中某一用户具体消费信息,对文本备注信息采用上述抽取出来的实体信息进行实体识别,从而获取用户消费行为的场所标签信息,并结合相关消费额度、月均频次等信息,采用相关阈值规则确定高消费、高消费频次、高酒店消费、高旅行消费、高ktv消费、高教育消费、高服饰消费等标签信息。
77.由于有些标签是相对固定的,变化周期相对较长,例如:教育标签、年龄标签等;而有些信息变动周期相对较短,需要对其按照标签特性进行周期性的迭代更新。从而经过上述处理之后,就获取得到了银行系统中每个用户较为实时更新的标签信息,并对这些标签信息,并新建专门的库表进行存储,从而与银行用户的数据库表内容数据一起共同构成了
整个数据提取的数据源。
78.s124、整合所述映射结果、所述统计结果以及所述挖掘结果,以得到用户标签。
79.s130、根据所述用户标签以及银行用户的数据库表内容数据按照不同的业务场景提取业务内容数据,以得到提取结果。
80.在本实施例中,提取结果是指根据所述用户标签按照不同的业务场景提取的业务内容数据。
81.由于银行业务场景很多,需按照不同业务场景设计专门数据提取模板进行数据提取,设计目标是通过各种数据提取模板的配置,实现对营销人员、研发人员或者第三方平台进行高效率的取数需求。根据这些模板从所述用户标签以及银行用户的数据库表内容数据整合形成的数据源中提取对应的业务内容数据,实现根据业务场景提取相关数据。
82.在一实施例中,请参阅图4,上述的步骤s130可包括步骤s131~s134。
83.s131、根据所述用户标签构建筛选规则模板。
84.在本实施例中,所述筛选规则模板是采用以所述用户标签进行特征信息筛选的模板。
85.对于业务场景,都是对一定圈层的用户标签进行过滤提取,即采用以用户标签特征进行特征信息筛选,一般采用布尔表达式进行表征。例如,要面向大额存款进行推广营销,一般是选择aum高标签值进行,而一些场景推广,可能会选择部分进行试点,则需要进行地点或者银行分支机构等标签信息进行细化限制。采用用户标签筛选,主要可以快速确定精确的用户圈层,并将精确的用户信息与其他具体内容性质库表例如信用卡还款记录表,包含还款日期、金额等具体内容信息进行快速筛选过滤。
86.s132、构建用户信息关联数据库表的字段的输出模板。
87.在本实施例中,输出模板是指根据用户信息关联数据库表的字段,并将相关字段输出的模板。
88.由于在实际场景中,通过用户标签筛选,能够获得一些基本的用户信息,例如:年龄、性别、机构等标签化信息。但是在实际业务中,除了这类标签化的数据信息,还需要一些内容性质的数据,例如:具体大笔消费额度、取款额度等。这些数据不是在用户标签中,而是需要根据筛选出来的用户信息与具体内容数据库表进行关联表格查询,因此,数据提取方法需提供库表条件过滤、关联合并、输出字段选择及字段重命名等相关套件。由于在输出阶段,可能会涉及多数据库表或多阶段sql处理流程,可采用任务流有向图的方式进行输出数据逻辑流程定义,一个多数据库表节点经过筛选、过滤或统计等计算操作,可以产生新的衍生库表字段、衍生数据库表与原始数据库表、或衍生数据库表之间,或与原始数据库表之间;又可以通过表链接关联逻辑产生新的联合衍生数据库表等。将一个数据库表节点到另一个数据库表节点之间的处理操作,视为一个数据计算处理操作流程,经过多个库表处理逻辑便可以得到最终满足条件的数据信息。举个例子:一个数据库表多阶段关联输出时,原始数据库表1:字段11、字段12
……
,通过筛选过滤或统计等计算,形成衍生数据库表3:字段31、字段32
……
,该衍生数据库表3与原始数据库表2:字段21、字段22
……
进行数据库表关联及过滤:字段3x=字段2y,以得到联合数据库表4:字段31、字段21
……
,最后输出联合数据库表4。
89.原始数据库表经过输出阶段的多阶段筛选、过滤、统计、关联等操作,能够加工得
到包含原始数据信息及新产生衍生数据信息的临时缓存库表字段信息;这些数据库表关联逻辑任务,按照计算有向图进行转化并最终得到相关输出。
90.s133、定义sql预约提取数据的功能。
91.在实际业务中,为了面向具有一定sql能力和业务能力的it支撑人员,为方便这类人员采用自定义方式进行sql取数多阶段取数,本实施例提供方便灵活的自定义sql功能配置;其主要将每一条sql查询语句视为一个中间查询视图节点,就上述例子的衍生数据即衍生数据库表3这一节点,只是其产生方式不是采用数据界面画图关联产生,而是通过人工编撰sql的方式进行产生。
92.s134、采用筛选规则模板、输出模板以及sql预约提取数据的功能按照不同的业务场景提取业务内容数据,以得到提取结果。
93.在一实施例中,请参阅图5,上述的步骤s134可包括步骤s1341~s1344。
94.s1341、采用所述筛选规则模板以所述用户标签进行不同的业务场景的特征信息筛选,以得到用户信息。
95.在本实施例中,用户信息是指采用所述筛选规则模板以所述用户标签进行不同的业务场景的特征信息筛选,具体是针对用户的基础信息等进行筛选。
96.s1342、采用输出模板根据所述用户信息与具体内容数据库表进行关联表格查询,并任务流有向图的方式输出关联的内容数据库表;
97.s1343、采用sql预约提取数据的功能提取符合用户设定条件的数据,以得到sql数据。
98.在本实施例中,sql数据是指采用sql预约提取数据的功能提取符合用户设定条件的数据。
99.s1344、整合所述用户信息、关联的内容数据库表以及sql数据,以得到提取结果。
100.s140、输出所述提取结果。
101.具体地,采用api主动推送方式或api被动拉取方式输出所述提取结果。
102.对具体银行业务场景中的用户进行标签圈层,并进行业务内容数据提取。在面对业务人员、第三方平台上进行最终业务对接输出方式,具体包括表格形式的输出、api接口形式的输出等多种方式。对于表格形式的数据输出相对简单,主要是将根据节点有向图进行sql流程自动化计算后产生的衍生库表,导出产生excel等表格文件,具体可以采用sql自有相关数据接口进行自动转化。而对于api接口形式,主要有两种方式,分别是主动推送方式或被动拉取方式。
103.api主动推送方式主要是通过将满足条件的库表数据,通过定时任务等方式推送到银行相关业务平台的数据接口服务中。每次对未成功推送数据,按照上次推送时间倒叙方式进行小批量数据封装进行推送,例如每次500条进行推送,每个用户用相关id信息进行标志,为了标记某条用户数据是否推送成功,相关接受服务接口需要将接受状态返回给推送服务,推送服务在完成推送后并根据接受状态对相关用户进行标记,将成功推送用户标记完成,失败用户标记为未完成,并记录失败次数以便下次推送。
104.api被动拉取方式是在准备好数据时,不进行主动推送,而是提供两个查询接口,一是用户id列表接口,其将满足某个业务场景条件的用户id提供出来,以便相关数据需求方进行id列表获取,但不包含具体内容信息;二是场景及用户id信用查询接口,主要是根据
业务场景及用户id信息进行读取,然后返回给相应查询方该id的具体内容信息。具体过程是,数据使用方如银行智能营销平台根据营销场景获取该场景下的全部潜在用户列表信息,然后再根据用户列表信息依次进行遍历请求,获取得到最终详尽内容信息。与api主动推送方式最大的区别在于相关数据推送传输失败状态不用智能提数平台记录和处理,而是完全由第三方业务平台进行保证。
105.基于银行用户的数据库表内容数据进行用户标签挖掘、业务场景内容数据处理计算以及业务场景数据输出传输,实现依据银行的不同业务场景需求进行对应的数据提取,以满足不同业务场景需求的数据提取需求。
106.上述的业务场景数据提取方法,通过确定银行的用户标签体系,结合银行用户的数据库表内容数据进行标签归类,以形成用户标签,将所述用户标签以及银行用户的数据库表内容数据按照不同的业务场景提取业务内容数据,以形成提取结果,并按照不同需求输出提取结果,实现依据银行的不同业务场景需求进行对应的数据提取,以满足不同业务场景需求的数据提取需求。
107.图6是本发明实施例提供的一种业务场景数据提取装置300的示意性框图。如图6所示,对应于以上业务场景数据提取方法,本发明还提供一种业务场景数据提取装置300。该业务场景数据提取装置300包括用于执行上述业务场景数据提取方法的单元,该装置可以被配置于服务器中。具体地,请参阅图6,该业务场景数据提取装置300包括确定单元301、标签生成单元302、提取单元303以及输出单元304。
108.确定单元301,用于确定银行的用户标签体系,并拉取银行用户的数据库表内容数据;标签生成单元302,用于对银行用户的数据库表内容数据按照银行的用户标签体系的不同特性进行标签归类,以得到用户标签;提取单元303,用于根据所述用户标签以及银行用户的数据库表内容数据按照不同的业务场景提取业务内容数据,以得到提取结果;输出单元304,用于输出所述提取结果。
109.在一实施例中,如图7所示,所述标签生成单元302包括映射子单元3021、统计子单元3022、挖掘子单元3023以及结果整合子单元3024。
110.映射子单元3021,用于按照银行的用户标签体系对银行用户的数据库表内容数据中基础数据进行标签映射,以得到映射结果;统计子单元3022,用于按照银行的用户标签体系对银行用户的数据库表内容数据中的相关数值进行统计,以得到统计结果;挖掘子单元3023,用于按照银行的用户标签体系对银行用户的数据库表内容数据进行文本挖掘,以得到挖掘结果;结果整合子单元3024,用于整合所述映射结果、所述统计结果以及所述挖掘结果,以得到用户标签。
111.在一实施例中,如图8所示,所述提取单元303包括规则模板构建子单元3031、输出模板构建子单元3032、功能定义子单元3033以及数据提取子单元3034。
112.规则模板构建子单元3031,用于根据所述用户标签构建筛选规则模板;输出模板构建子单元3032,用于构建用户信息关联数据库表的字段的输出模板;功能定义子单元3033,用于定义sql预约提取数据的功能;数据提取子单元3034,用于采用筛选规则模板、输出模板以及sql预约提取数据的功能按照不同的业务场景提取业务内容数据,以得到提取结果。
113.在一实施例中,如图9所示,所述数据提取子单元3034包括信息筛选模块30341、关
联表格查询模块30342、sql查询模块30343以及结果整合模块30344。
114.信息筛选模块30341,用于采用所述筛选规则模板以所述用户标签进行不同的业务场景的特征信息筛选,以得到用户信息;关联表格查询模块30342,用于采用输出模板根据所述用户信息与具体内容数据库表进行关联表格查询,并任务流有向图的方式输出关联的内容数据库表;sql查询模块30343,用于采用sql预约提取数据的功能提取符合用户设定条件的数据,以得到sql数据;结果整合模块30344,用于整合所述用户信息、关联的内容数据库表以及sql数据,以得到提取结果。
115.在一实施例中,输出单元304,用于采用api主动推送方式或api被动拉取方式输出所述提取结果。
116.需要说明的是,所属领域的技术人员可以清楚地了解到,上述业务场景数据提取装置300和各单元的具体实现过程,可以参考前述方法实施例中的相应描述,为了描述的方便和简洁,在此不再赘述。
117.上述业务场景数据提取装置300可以实现为一种计算机程序的形式,该计算机程序可以在如图10所示的计算机设备上运行。
118.请参阅图10,图10是本技术实施例提供的一种计算机设备的示意性框图。该计算机设备500可以是服务器,其中,服务器可以是独立的服务器,也可以是多个服务器组成的服务器集群。
119.参阅图10,该计算机设备500包括通过系统总线501连接的处理器502、存储器和网络接口505,其中,存储器可以包括非易失性存储介质503和内存储器504。
120.该非易失性存储介质503可存储操作系统5031和计算机程序5032。该计算机程序5032包括程序指令,该程序指令被执行时,可使得处理器502执行一种业务场景数据提取方法。
121.该处理器502用于提供计算和控制能力,以支撑整个计算机设备500的运行。
122.该内存储器504为非易失性存储介质503中的计算机程序5032的运行提供环境,该计算机程序5032被处理器502执行时,可使得处理器502执行一种业务场景数据提取方法。
123.该网络接口505用于与其它设备进行网络通信。本领域技术人员可以理解,图10中示出的结构,仅仅是与本技术方案相关的部分结构的框图,并不构成对本技术方案所应用于其上的计算机设备500的限定,具体的计算机设备500可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
124.其中,所述处理器502用于运行存储在存储器中的计算机程序5032,以实现如下步骤:
125.确定银行的用户标签体系,并拉取银行用户的数据库表内容数据;对银行用户的数据库表内容数据按照银行的用户标签体系的不同特性进行标签归类,以得到用户标签;根据所述用户标签以及银行用户的数据库表内容数据按照不同的业务场景提取业务内容数据,以得到提取结果;输出所述提取结果。
126.在一实施例中,处理器502在实现所述对银行用户的数据库表内容数据按照银行的用户标签体系的不同特性进行标签归类,以得到用户标签步骤时,具体实现如下步骤:
127.按照银行的用户标签体系对银行用户的数据库表内容数据中基础数据进行标签映射,以得到映射结果;按照银行的用户标签体系对银行用户的数据库表内容数据中的相
关数值进行统计,以得到统计结果;按照银行的用户标签体系对银行用户的数据库表内容数据进行文本挖掘,以得到挖掘结果;整合所述映射结果、所述统计结果以及所述挖掘结果,以得到用户标签。
128.在一实施例中,处理器502在实现所述根据所述用户标签以及银行用户的数据库表内容数据按照不同的业务场景提取业务内容数据,以得到提取结果步骤时,具体实现如下步骤:
129.根据所述用户标签构建筛选规则模板;构建用户信息关联数据库表的字段的输出模板;定义sql预约提取数据的功能;采用筛选规则模板、输出模板以及sql预约提取数据的功能按照不同的业务场景提取业务内容数据,以得到提取结果。
130.其中,所述筛选规则模板是采用以所述用户标签进行特征信息筛选的模板。
131.在一实施例中,处理器502在实现所述采用筛选规则模板、输出模板以及sql预约提取数据的功能按照不同的业务场景提取业务内容数据,以得到提取结果步骤时,具体实现如下步骤:
132.采用所述筛选规则模板以所述用户标签进行不同的业务场景的特征信息筛选,以得到用户信息;采用输出模板根据所述用户信息与具体内容数据库表进行关联表格查询,并任务流有向图的方式输出关联的内容数据库表;采用sql预约提取数据的功能提取符合用户设定条件的数据,以得到sql数据;整合所述用户信息、关联的内容数据库表以及sql数据,以得到提取结果。
133.在一实施例中,处理器502在实现所述输出所述提取结果步骤时,具体实现如下步骤:
134.采用api主动推送方式或api被动拉取方式输出所述提取结果。
135.应当理解,在本技术实施例中,处理器502可以是中央处理单元(central processing unit,cpu),该处理器502还可以是其他通用处理器、数字信号处理器(digital signal processor,dsp)、专用集成电路(application specific integrated circuit,asic)、现成可编程门阵列(field-programmable gate array,fpga)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。其中,通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
136.本领域普通技术人员可以理解的是实现上述实施例的方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成。该计算机程序包括程序指令,计算机程序可存储于一存储介质中,该存储介质为计算机可读存储介质。该程序指令被该计算机系统中的至少一个处理器执行,以实现上述方法的实施例的流程步骤。
137.因此,本发明还提供一种存储介质。该存储介质可以为计算机可读存储介质。该存储介质存储有计算机程序,其中该计算机程序被处理器执行时使处理器执行如下步骤:确定银行的用户标签体系,并拉取银行用户的数据库表内容数据;
138.对银行用户的数据库表内容数据按照银行的用户标签体系的不同特性进行标签归类,以得到用户标签;根据所述用户标签以及银行用户的数据库表内容数据按照不同的业务场景提取业务内容数据,以得到提取结果;输出所述提取结果。
139.在一实施例中,所述处理器在执行所述计算机程序而实现所述对银行用户的数据库表内容数据按照银行的用户标签体系的不同特性进行标签归类,以得到用户标签步骤
时,具体实现如下步骤:
140.按照银行的用户标签体系对银行用户的数据库表内容数据中基础数据进行标签映射,以得到映射结果;按照银行的用户标签体系对银行用户的数据库表内容数据中的相关数值进行统计,以得到统计结果;按照银行的用户标签体系对银行用户的数据库表内容数据进行文本挖掘,以得到挖掘结果;整合所述映射结果、所述统计结果以及所述挖掘结果,以得到用户标签。
141.在一实施例中,所述处理器在执行所述计算机程序而实现所述根据所述用户标签以及银行用户的数据库表内容数据按照不同的业务场景提取业务内容数据,以得到提取结果步骤时,具体实现如下步骤:
142.根据所述用户标签构建筛选规则模板;构建用户信息关联数据库表的字段的输出模板;定义sql预约提取数据的功能;采用筛选规则模板、输出模板以及sql预约提取数据的功能按照不同的业务场景提取业务内容数据,以得到提取结果。
143.其中,所述筛选规则模板是采用以所述用户标签进行特征信息筛选的模板。
144.在一实施例中,所述处理器在执行所述计算机程序而实现所述采用筛选规则模板、输出模板以及sql预约提取数据的功能按照不同的业务场景提取业务内容数据,以得到提取结果步骤时,具体实现如下步骤:
145.采用所述筛选规则模板以所述用户标签进行不同的业务场景的特征信息筛选,以得到用户信息;采用输出模板根据所述用户信息与具体内容数据库表进行关联表格查询,并任务流有向图的方式输出关联的内容数据库表;采用sql预约提取数据的功能提取符合用户设定条件的数据,以得到sql数据;整合所述用户信息、关联的内容数据库表以及sql数据,以得到提取结果。
146.在一实施例中,所述处理器在执行所述计算机程序而实现所述输出所述提取结果步骤时,具体实现如下步骤:
147.采用api主动推送方式或api被动拉取方式输出所述提取结果。
148.所述存储介质可以是u盘、移动硬盘、只读存储器(read-only memory,rom)、磁碟或者光盘等各种可以存储程序代码的计算机可读存储介质。
149.本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
150.在本发明所提供的几个实施例中,应该理解到,所揭露的装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的。例如,各个单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式。例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。
151.本发明实施例方法中的步骤可以根据实际需要进行顺序调整、合并和删减。本发明实施例装置中的单元可以根据实际需要进行合并、划分和删减。另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以
是两个或两个以上单元集成在一个单元中。
152.该集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分,或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,终端,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。
153.以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到各种等效的修改或替换,这些修改或替换都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以权利要求的保护范围为准。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1