一种金额字符串的识别方法及装置与流程

文档序号:32695930发布日期:2022-12-27 21:01阅读:53来源:国知局
一种金额字符串的识别方法及装置与流程

1.本发明涉及模式识别技术领域,尤其涉及一种金额字符串的识别方法及装置。
2.需要说明的是,本发明金额字符串的识别方法及装置可用于金融领域的金额字符串的识别,也可用于除金融领域之外的任意领域的金额字符串的识别,本发明金额字符串的识别方法及装置的应用领域不做限定。


背景技术:

3.本部分旨在为权利要求书中陈述的本发明实施例提供背景或上下文。此处的描述不因为包括在本部分中就承认是现有技术。
4.在金融业务场景中,需要对用户输入的金额字符串进行数值识别,但是,用户输入的金额字符串通常具有多种格式,例如:数字格式、数字与量词组合格式、科学记数法格式等等。针对多种格式的金额字符串识别,需要做重复开发和多次测试,这种方法效率低下,不便于程序的迁移和扩展。
5.针对上述技术问题,目前尚未提出有效的解决方案。


技术实现要素:

6.本发明实施例提供一种金额字符串的识别方法,用以准确识别金额字符串代表的数值,该方法包括:
7.获取待识别的目标金额字符串;
8.确定出目标金额字符串中的各个字符;
9.根据目标金额字符串中的各个字符,进行识别规则匹配,得到对应的目标匹配结果;
10.根据目标匹配结果,对目标金额字符串进行相应的金额数值识别。
11.进一步地,所述方法的另一个实施例中,所述确定出目标金额字符中的各个字符,包括:
12.利用预设的字符表对目标金额字符串中的各个字符图形进行比对,根据比对结果,确定出目标金额字符串中的各个字符。
13.进一步地,所述方法的另一个实施例中,所述根据目标金额字符串中的各个字符,进行识别规则匹配,得到对应的目标匹配结果,包括:
14.获取各个字符的附加状态;
15.根据目标金额字符串中的各个字符,以及各个字符的附加状态,从预设的规则库中确定出相匹配的目标识别规则,以得到对应的目标匹配结果;其中,所述预设的规则库包括针对目标业务场景的多个识别规则。
16.进一步地,所述方法的另一个实施例中,所述预设的规则库按照以下方式构建:
17.获取目标业务场景下的历史金额字符串;
18.根据历史金额字符串,确定目标业务场景下的金额字符串的格式类型;
19.根据目标业务场景下的金额字符串的格式类型,构建针对目标业务场景的多个识别规则,以建立预设的规则库。
20.进一步地,所述方法的另一个实施例中,所述格式类型包括以下至少之一:百分位/千分位间隔型、数字与量词组合型、科学计数型。
21.进一步地,所述方法的另一个实施例中,根据目标匹配结果,对目标金额字符串进行相应的金额数值识别,包括:在目标匹配结果包括一个目标识别规则的情况下,利用目标识别规则对目标金额字符进行金额数值识别,得到金额数值识别结果,作为目标金额字符串所表征的目标金额数值。
22.进一步地,所述方法的另一个实施例中,根据目标匹配结果,对目标金额字符串进行相应的金额数值识别,还包括:
23.在目标匹配结果包括多个目标识别规则的情况下,利用多个目标识别规则分别对目标金额字符串进行金额数值识别,得到多个金额数值识别结果;
24.根据多个金额数值识别结果,确定出目标金额字符串的目标金额数值。
25.进一步地,所述方法的另一个实施例中,根据目标匹配结果,对目标金额字符串进行相应的金额数值识别,还包括:
26.在目标匹配结果为空的情况下,生成报错提示。
27.本发明实施例还提供一种金额字符串的识别装置,用以准确识别金额字符串代表的数值,该方法包括:
28.获取模块,用于获取待识别的目标金额字符串;
29.比对模块,用于确定出目标金额字符串中的各个字符;
30.匹配模块,用于根据目标金额字符串中的各个字符,进行识别规则匹配,得到对应的目标匹配结果;
31.识别模块,用于根据目标匹配结果,对目标金额字符串进行相应的金额数值识别。
32.本发明实施例还提供一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述金额字符串的识别方法。
33.本发明实施例还提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述金额字符串的识别方法。
34.本发明实施例还提供一种计算机程序产品,所述计算机程序产品包括计算机程序,所述计算机程序被处理器执行时实现上述金额字符串的识别方法。
35.本发明实施例通过构建识别规则,并将识别规则进行封装后保存,有利于将识别规则迁移至其他模块或者系统中反复使用,避免多次开发,可以提升程序开发的工作效率;利用封装后的识别规则可以实现对目标业务场景下的多种类型的金额字符串的准确识别,提升了业务处理的速度和效率,与现有技术中针对每种类型的金额字符串均开发一套程序相比,本发明实施例通过构建可迁移的识别规则,可以将识别规则移植至其他模块或者系统中反复使用,避免多次开发,从而提升程序开发的工作效率。
附图说明
36.为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现
有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。在附图中:
37.图1为本发明实施例中一种金额字符串的识别方法的流程示意图;
38.图2为本发明实施例中对目标金额字符串进行相应的金额数值识别的流程示意图;
39.图3为本发明一个具体实施场景中对金额字符串进行识别的示意图;
40.图4为本发明实施例中一种金额字符串的识别装置的一种结构框图;
41.图5为本发明实施例中一种计算机设备的硬件结构示意图。
具体实施方式
42.为了使本技术领域的人员更好地理解本说明书中的技术方案,下面将结合本说明书实施例中的附图,对本说明书实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本说明书一部分实施例,而不是全部的实施例。基于本说明书中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都应当属于本说明书保护的范围。
43.考虑到在金融业务场景中,需要对用户输入的金额字符串进行数值识别,但是,用户输入的金额字符串通常具有多种格式,例如:数字格式、数字与量词组合格式、科学记数法格式等等。针对多种格式的金额字符串识别,需要做重复开发和多次测试,这种方法效率低下,不便于程序的迁移和扩展。
44.进一步,还考虑到现有技术中通常使用正则化表达式对金额字符串进行识别,但是正则表达式无法知道金额字符串中每个部分的含义,因此正则表达式不能实现最终换算出目标金额的任务。
45.针对现有方法存在的上述问题以及产生上述问题的具体原因,本技术考虑引入基于规则匹配的金额字符串的识别方法,以实现准确识别不同类型的金额字符串。
46.基于上述思路,本说明书提出一种金额字符串的识别方法。首先,获取待识别的目标金额字符串;确定出目标金额字符串中的各个字符;然后,根据目标金额字符串中的各个字符,进行识别规则匹配,得到对应的目标匹配结果;最后,根据目标匹配结果,对目标金额字符串进行相应的金额数值识别。
47.图1是本技术提供的一种金额字符串的识别方法一种实施例的方法流程图。虽然本技术提供了如下述实施例或附图所示的方法操作步骤或装置结构,但基于常规或者无需创造性的劳动在所述方法或装置中可以包括更多或者更少的操作步骤或模块单元。在逻辑性上不存在必要因果关系的步骤或结构中,这些步骤的执行顺序或装置的模块结构不限于本技术实施例描述及附图所示的执行顺序或模块结构。所述的方法或模块结构的在实际中的装置或终端产品应用时,可以按照实施例或者附图所示的方法或模块结构连接进行顺序执行或者并行执行(例如并行处理器或者多线程处理的环境,甚至分布式处理环境)。
48.具体的,参阅图1所示,上述金额字符串的识别方法,具体实施时,可以包括以下内容。
49.s101:获取待识别的目标金额字符串。
50.需要说明的是,本技术所获取和使用的与用户相关的数据均为在用户知晓且同意的前提下获取和使用的。并且本技术技术方案中对上述数据的获取、存储、使用、处理等均符合国家法律法规的相关规定。
51.在一些实施例中,用户通常在客户端显示页面的金额栏位进行输入操作。
52.在一些实施例中,上述获取待识别的目标金额字符串,具体实施时,可以包括:
53.s1:检测用户是否发起针对金额栏位的输入操作;
54.s2:在检测到用户发起针对金额栏位的输入操作的情况下,采集用户输入的字符串作为所述目标金额字符串。
55.s102:确定出目标金额字符串中的各个字符。
56.在一些实施例中,上述确定出目标金额字符串中的各个字符,具体实施时,可以包括:利用预设的字符表对目标金额字符串中的各个字符图形进行比对,根据比对结果,确定出目标金额字符串中的各个字符。
57.在一些实施例中,上述预设的字符表中,预先存储有数字、字母、符号等类型的字符图形;上述符号具体可以是单引号(’)、乘号(
×
和*)等。
58.s103:根据目标金额字符串中的各个字符,进行识别规则匹配,得到对应的目标匹配结果。
59.在一些实施例中,上述根据目标金额字符串中的各个字符,进行识别规则匹配,得到对应的目标匹配结果,具体实施时,可以包括:
60.s1:获取各个字符的附加状态;
61.s2:根据目标金额字符串中的各个字符,以及各个字符的附加状态,从预设的规则库中确定出相匹配的目标识别规则,以得到对应的目标匹配结果;其中,所述预设的规则库包括针对目标业务场景的多个识别规则。
62.在一些实施例中,上述预设的规则库按照以下方式构建:
63.s1:获取目标业务场景下的历史金额字符串;
64.s2:根据历史金额字符串,确定目标业务场景下的金额字符串的格式类型;
65.s3:根据目标业务场景下的金额字符串的格式类型,构建针对目标业务场景的多个识别规则,以建立预设的规则库。
66.在一些实施例中,上述格式类型包括以下至少之一:百分位/千分位间隔型、数字与量词组合型、科学计数型。
67.在一些实施例中,百分位间隔型的金额字符串表示每间隔两位数字就加入单引号进行分割的字符串,例如:10’00’00;千分位间隔型的金额字符串表示每间隔三位数字就加入单引号进行分割的字符串,例如:100’000’000;科学计数型的金额字符串表示是采用科学记数法进行表示的字符串,例如5
×
103;数字与量词组合型的字符串是用英文字母表示数字位数的字符串,例如:5m(million,百万)、10k(kilo,千)。
68.在一些实施例中,格式类型还可以包括汉字型等,本说明书对此不做限定。
69.在一些实施例中,每个识别规则,都对应其规则标识。例如,识别百分位间隔型的金额字符串的识别规则,它的规则标识为“百分位间隔型识别规则”。
70.在一些实施例中,在目标业务场景下的金额字符串的格式类型,构建针对目标业务场景的多个识别规则之后,所述方法还包括:
71.s1:根据校验规则对所述多个识别规则进行校验;
72.s2:将校验通过的识别规则保存于预设的规则库中。
73.在一些实施例中,上述根据校验规则对所述多个识别规则进行校验,具体实施时,可以包括:构建校验数据集;其中,校验数据集包括第一数据集和第二数据集,第一数据集包括目标业务场景下的金额字符串的格式类型所对应的金额字符串,第二数据集包括该金额字符串经过识别后得到的第二识别结果;使用识别规则对第一数据集中和识别规则对应的金额字符串进行识别,得到第一识别结果;将第一识别结果和第二识别结果进行比对,在比对结果一致的情况下,认为识别规则通过校验;相应的,在比对结果不一致的情况下,认为识别规则没有通过校验。
74.在一些实施例中,在识别规则没有通过校验的情况下,可以对该识别规则进行编辑与修改,得到修改后的识别规则,并对修改后的识别规则再次进行校验,直至校验通过。
75.在一些实施例中,也可以对预设的规则库中的识别规则进行增加、删除等操作。
76.通过上述实施例,构建识别规则并将识别规则存储于预设的规则库,将识别规则进行封装后保存,有利于将识别规则迁移至其他模块或者系统中反复使用,可以提升程序开发的工作效率。
77.s104:根据目标匹配结果,对目标金额字符串进行相应的金额数值识别。
78.参阅图2所示,在一些实施例中,上述根据目标匹配结果,对目标金额字符串进行相应的金额数值识别,具体实施时,可以包括:
79.s1041:在目标匹配结果包括一个目标识别规则的情况下,利用目标识别规则对目标金额字符进行金额数值识别,得到金额数值识别结果,作为目标金额字符串所表征的目标金额数值。
80.参阅图2所示,在一些实施例中,上述根据目标匹配结果,对目标金额字符串进行相应的金额数值识别,具体实施时,还可以包括:
81.s1042:在目标匹配结果包括多个目标识别规则的情况下,利用多个目标识别规则分别对目标金额字符串进行金额数值识别,得到多个金额数值识别结果;根据多个金额数值识别结果,确定出目标金额字符串的目标金额数值。
82.在一些实施例中,上述根据多个金额数值识别结果,确定出目标金额字符串的目标金额数值,具体实施时,可以包括:比对多个金额数值识别结果,在确定多个金额数值识别结果相同的情况下,将金额数值识别结果确定为目标金额字符串的目标金额数值。
83.在一些实施例中,上述根据多个金额数值识别结果,确定出目标金额字符串的目标金额数值,具体实施时,还可以包括:比对多个金额数值识别结果,在确定多个金额数值识别结果不同的情况下,将不同的金额识别结果,以及所分别对应的识别规则的规则标识进行组合,以生对应的提示信息;并向用户展示该提示信息。
84.参阅图2所示,在一些实施例中,上述根据目标匹配结果,对目标金额字符串进行相应的金额数值识别,具体实施时,还可以包括:
85.s1043:在目标匹配结果为空的情况下,生成报错提示。
86.在一些实施例中,上述在目标匹配结果为空的情况下,生成报错提示,具体实施时,可以包括:
87.s1:依次执行预设的规则库中的多个识别规则,获得无法匹配的原因以及违反规
则的字符在待识别的目标金额字符串中的位置;
88.s2:组合无法匹配的原因以及违反规则的字符在待识别的目标金额字符串中的位置,获得报错提示。
89.在一些实施例中,在获得报错提示后,还可以向用户展示该报错提示,以提醒用户重新输入字符串。
90.在一些实施例中,在确定出目标金额字符串的目标金额数值之后,所述方法还包括:向用户展示目标金额数值,以等待用户确认。
91.在一些实施例中,在确定出目标金额字符串的目标金额数值之后,所述方法还包括:根据目标金额数值进行相应的交易数据处理。交易数据处理包括:根据目标金额数值,进行相关资源数据的转账处理。其中,资源数据可以包括资金数据。
92.通过上述实施例,可以实现对多种格式类型的金额字符串的准确识别,并且,在无法得到识别结果的情况下,生成报错提示,以帮助用户发现输入字符串中的错误位置,提高输入效率。
93.在一个具体的场景示例中,可以根据本技术提供的金额字符串的识别方法对金额字符串进行识别。参阅图3所示,具体实施前,需要构建规则库,规则库中包括多个识别规则;具体实施时,匹配单元从规则库中得到对应的目标匹配结果,执行引擎单元根据目标匹配结果,对目标金额字符串进行相应的金额数值识别,得到识别结果;图中的虚线箭头代表可选操作,可选的,规则管理单元可以对规则库中的识别规则进行校验、编辑、修改、增加、删除等操作,规则管理单元也可以将通过校验的识别规则直接发送给匹配单元以进行识别规则匹配。
94.基于同一发明构思,本技术实施例中还提供了一种金额字符串的识别装置,如下面的实施例所述。由于一种金额字符串的识别装置解决问题的原理与一种金额字符串的识别方法相似,因此一种金额字符串的识别装置的实施可以参见一种金额字符串的识别方法的实施,重复之处不再赘述。以下所使用的,术语“单元”或者“模块”可以实现预定功能的软件和/或硬件的组合。尽管以下实施例所描述的装置较佳地以软件来实现,但是硬件,或者软件和硬件的组合的实现也是可能并被构想的。图4是本技术实施例的一种金额字符串的识别装置的一种结构框图,参阅图4所示,包括:获取模块401,比对模块402,匹配模块403、识别模块404,下面对该结构进行说明。
95.获取模块401,用于获取待识别的目标金额字符串;
96.比对模块402,用于确定出目标金额字符串中的各个字符;
97.匹配模块403,用于根据目标金额字符串中的各个字符,进行识别规则匹配,得到对应的目标匹配结果;
98.识别模块404,用于根据目标匹配结果,对目标金额字符串进行相应的金额数值识别。
99.在一些实施例中,上述获取模块401,具体可以用于检测用户是否发起针对金额栏位的输入操作;在检测到用户发起针对金额栏位的输入操作的情况下,采集用户输入的字符串作为所述目标金额字符串。
100.在一些实施例中,上述比对模块402,具体可以用于利用预设的字符表对目标金额字符串中的各个字符图形进行比对,根据比对结果,确定出目标金额字符串中的各个字符。
101.在一些实施例中,上述匹配模块403,具体可以用于获取各个字符的附加状态;根据目标金额字符串中的各个字符,以及各个字符的附加状态,从预设的规则库中确定出相匹配的目标识别规则,以得到对应的目标匹配结果;其中,所述预设的规则库包括针对目标业务场景的多个识别规则。
102.在一些实施例中,上述匹配模块403,具体还可以用于按照以下方式构建预设的规则库获取目标业务场景下的历史金额字符串;根据历史金额字符串,确定目标业务场景下的金额字符串的格式类型;根据目标业务场景下的金额字符串的格式类型,构建针对目标业务场景的多个识别规则,以建立预设的规则库;其中,上述格式类型包括以下至少之一:百分位/千分位间隔型、数字与量词组合型、科学计数型。
103.在一些实施例中,上述识别模块404,具体可以用于在目标匹配结果包括一个目标识别规则的情况下,利用目标识别规则对目标金额字符进行金额数值识别,得到金额数值识别结果,作为目标金额字符串所表征的目标金额数值。
104.在一些实施例中,上述识别模块404,具体还可以用于在目标匹配结果包括多个目标识别规则的情况下,利用多个目标识别规则分别对目标金额字符串进行金额数值识别,得到多个金额数值识别结果;根据多个金额数值识别结果,确定出目标金额字符串的目标金额数值。
105.在一些实施例中,上述识别模块404,具体还可以用于在目标匹配结果包括多个目标识别规则的情况下,利用多个目标识别规则分别对目标金额字符串进行金额数值识别,得到多个金额数值识别结果;根据多个金额数值识别结果,确定出目标金额字符串的目标金额数值。
106.在一些实施例中,上述识别模块404,具体还可以用于在目标匹配结果为空的情况下,生成报错提示。
107.本发明实施例还提供一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述金额字符串的识别方法。
108.为了能够更加准确地完成上述指令,参阅图5所示,本说明书实施例还提供了另一种具体的计算机设备,所述计算机设备可以为一种服务器,其中,所述服务器包括网络通信端口501、处理器502以及存储器503,上述结构通过内部线缆相连,以便各个结构可以进行具体的数据交互。
109.其中,所述网络通信端口501,具体可以用于获取待识别的目标金额字符串。
110.所述处理器502,具体可以用于确定出目标金额字符串中的各个字符;根据目标金额字符串中的各个字符,进行识别规则匹配,得到对应的目标匹配结果;根据目标匹配结果,对目标金额字符串进行相应的金额数值识别。
111.所述存储器503,具体可以用于存储相应的指令程序。
112.本发明实施例还提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述金额字符串的识别方法。
113.本发明实施例还提供一种计算机程序产品,所述计算机程序产品包括计算机程序,所述计算机程序被处理器执行时实现上述金额字符串的识别方法。
114.本发明实施例中通过构建识别规则,并将识别规则进行封装后保存,有利于将识
别规则迁移至其他模块或者系统中反复使用,避免多次开发,可以提升程序开发的工作效率;利用封装后的识别规则可以实现对目标业务场景下的多种类型的金额字符串的准确识别,提升了业务处理的速度和效率。
115.本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、cd-rom、光学存储器等)上实施的计算机程序产品的形式。
116.本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
117.这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
118.这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
119.以上所述的具体实施例,对本发明的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上所述仅为本发明的具体实施例而已,并不用于限定本发明的保护范围,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1