一种企业名片信息查询方法、装置、设备和介质与流程

文档序号:30508307发布日期:2022-06-25 01:03阅读:141来源:国知局
一种企业名片信息查询方法、装置、设备和介质与流程

1.本发明涉及计算机人工智能数据处理技术领域,尤其涉及一种企业名片信息查询方法、装置、设备和介质。


背景技术:

2.随着信息化的普及和电子发票的全面应用,传统的企业名片信息录入方式呈现的弊端越来越明显,在手工开票时消费者需要手动输入六项企业名片信息,该企业名片信息包括纳税人识别号、纳税人名称、电话、地址、开户银行、开户账号,每一项信息都需要输入全称,因此传统手工开票时会涉及到信息变动、信息过长不易记住、企业名片信息复杂输入易错、开票速度慢等问题。
3.现有的一种快速开票方法中包括三个步骤,第一步是商家下载客户端,注册账户,将企业的二维码打印,展示给顾客;第二步是消费者扫描二维码,填写企业名片信息,填写完毕,点击发送,将企业名片信息发送给商家,消费者可以选择保存企业名片信息,下次开票时不用重新录入企业名片信息;第三步是商家收到企业名片信息,确认无误后,按照企业名片信息开具发票。
4.然而在现有技术中,将历史数据中客户的企业名片信息保存在关系数据库中,再次查询客户的企业名片信息时会使用结构化查询语言(structured query language,sql)进行完全匹配查询,或者使用sql中的查询语句(like)进行模糊匹配查询,这种企业名片信息查询方式是根据待查询企业名称信息,对关系数据库中保存的所有企业名片信息进行全局搜索,确定该待查询企业名称信息与每个企业名片信息对应的企业名称信息的匹配度,从而确定出包括该企业名称信息的企业名片信息,导致企业名片信息查询时的速度较慢,花费的时间较长。


技术实现要素:

5.本发明实施例提供了一种企业名片信息查询方法、装置、设备和介质,用以解决现有技术中企业名片信息查询时的速度较慢,花费的时间较长的问题。
6.本发明实施例提供了一种企业名片信息查询方法,所述方法包括:
7.根据获取的待查询企业名称信息的每个第一目标关键词、预先保存的关键词与企业名片信息集合的对应关系,确定每个第一目标关键词对应的每个目标企业名片信息集合的交集;
8.根据所述待查询企业名称信息以及所述交集中的企业名片信息对应的企业名称信息,确定与所述待查询企业名称信息匹配的设定数量的目标企业名称信息对应的每个目标企业名片信息并显示。
9.进一步地,确定关键词与企业名片信息集合的对应关系包括:
10.根据预先保存的企业名片信息的每个历史信息,确定每个企业的企业名片信息;
11.针对每个企业名片信息中的企业名称信息,根据该企业名称信息、以及预先保存
的关键词库,确定该企业名称信息中包含的每个关键词;对应保存该企业名称信息对应的企业名片信息与所述每个关键词。
12.进一步地,所述根据预先保存的企业名片信息的每个历史信息,确定每个企业的企业名片信息包括:
13.根据预先保存的企业名片信息的每个历史信息中纳税人识别号对应的标识信息,确定每个标识信息标识企业的历史信息组;
14.针对每个历史信息组,根据该历史信息组中所述每个历史信息的日期信息,确定日期最新的每个第一历史信息;针对企业名片信息的每个元素,根据所述每个第一历史信息中该元素对应的每个子信息的出现频次,确定该元素对应的目标子信息;根据每个元素对应的目标子信息,确定该历史信息组对应企业的企业名片信息。
15.进一步地,所述根据所述每个第一历史信息中该元素对应的每个子信息的出现频次,确定该元素对应的目标子信息包括:
16.根据所述每个第一历史信息中该元素对应的每个子信息的出现频次,确定出现频次最高的子信息;
17.根据所述出现频次最高的子信息,确定该元素对应的目标子信息。
18.进一步地,所述根据所述出现频次最高的子信息,确定该元素对应的目标子信息包括:
19.若出现频次最高的子信息只有一个,则将该出现频次最高的子信息确定为该元素对应的目标子信息;
20.若出现频次最高的子信息至少有两个,则将出现频次最高且包含字数最多的子信息确定为该元素对应的目标子信息。
21.进一步地,所述方法还包括:
22.若接收到对输出的任一目标企业名片信息的更正指示;
23.接收所述目标企业名片信息的任一元素修改后的子信息,并对应保存所述目标企业名称信息包含的所述每个第一目标关键词和修改后的目标企业名片信息。
24.进一步地,若未确定出与所述待查询企业名称信息匹配的目标企业名称信息对应的目标企业名片信息,所述方法还包括:
25.接收待添加企业名片信息;
26.确定所述待添加企业名片信息的待添加企业名称信息的每个第二目标关键词;
27.根据所述每个第二目标关键词与所述待添加企业名片信息的对应关系,对预先保存的关键词与企业名片信息集合的所述对应关系进行更新。
28.相应地,本发明实施例提供了一种企业名片信息查询装置,所述装置包括:
29.确定模块,用于根据获取的待查询企业名称信息的每个第一目标关键词、预先保存的关键词与企业名片信息集合的对应关系,确定每个第一目标关键词对应的每个目标企业名片信息集合的交集;
30.查询模块,用于根据所述待查询企业名称信息以及所述交集中的企业名片信息对应的企业名称信息,确定与所述待查询企业名称信息匹配的设定数量的目标企业名称信息对应的每个目标企业名片信息并显示。
31.进一步地,所述确定模块,还用于根据预先保存的企业名片信息的每个历史信息,
确定每个企业的企业名片信息;针对每个企业名片信息中的企业名称信息,根据该企业名称信息、以及预先保存的关键词库,确定该企业名称信息中包含的每个关键词;对应保存该企业名称信息对应的企业名片信息与所述每个关键词。
32.进一步地,所述确定模块,还用于根据预先保存的企业名片信息的每个历史信息中纳税人识别号对应的标识信息,确定每个标识信息标识企业的历史信息组;针对每个历史信息组,根据该历史信息组中所述每个历史信息的日期信息,确定日期最新的每个第一历史信息;针对企业名片信息的每个元素,根据所述每个第一历史信息中该元素对应的每个子信息的出现频次,确定该元素对应的目标子信息;根据每个元素对应的目标子信息,确定该历史信息组对应企业的企业名片信息。
33.进一步地,所述确定模块,具体还用于根据所述每个第一历史信息中该元素对应的每个子信息的出现频次,确定出现频次最高的子信息;根据所述出现频次最高的子信息,确定该元素对应的目标子信息。
34.进一步地,所述确定模块,具体还用于若出现频次最高的子信息只有一个,则将该出现频次最高的子信息确定为该元素对应的目标子信息;若出现频次最高的子信息至少有两个,则将出现频次最高且包含字数最多的子信息确定为该元素对应的目标子信息。
35.进一步地,所述装置还包括:
36.更新模块,用于若接收到对输出的任一目标企业名片信息的更正指示;接收所述目标企业名片信息的任一元素修改后的子信息,并对应保存所述目标企业名称信息包含的所述每个第一目标关键词和修改后的目标企业名片信息。
37.进一步地,所述装置还包括:
38.更新模块,用于接收待添加企业名片信息;确定所述待添加企业名片信息的待添加企业名称信息的每个第二目标关键词;根据所述每个第二目标关键词与所述待添加企业名片信息的对应关系,对预先保存的关键词与企业名片信息集合的所述对应关系进行更新。
39.相应地,本发明实施例提供了一种电子设备,所述电子设备包括处理器和存储器,所述存储器用于存储程序指令,所述处理器用于执行存储器中存储的计算机程序时实现上述企业名片信息查询方法中任一所述方法的步骤。
40.相应地,本发明实施例提供了一种计算机可读存储介质,其存储有计算机程序,所述计算机程序被处理器执行时实现上述企业名片信息查询方法中任一所述方法的步骤。
41.本发明实施例提供了一种企业名片信息查询方法、装置、设备和介质,由于该方法中根据获取的待查询企业名称信息的每个第一目标关键词、预先保存的关键词与企业名片信息集合的对应关系,确定每个第一目标关键词对应的每个目标企业名片信息集合的交集,每个第一目标关键词对应的每个目标企业名片信息集合均包括该待查询企业名称信息对应的企业名片信息,根据该交集中的企业名片信息对应的企业名称信息,确定与待查询企业名称信息匹配的设定数量的目标企业名称信息对应的每个目标企业名片信息时,由于在与待查询企业名称信息进行匹配时需要匹配的企业名称信息的数量较少,从而提高了企业名片信息查询时的速度,减少了查询所花费的时间。
附图说明
42.为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简要介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域的普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
43.图1为本发明实施例提供的一种企业名片信息查询方法的过程示意图;
44.图2为本发明实施例提供的一种确定每个企业的企业名片信息的过程示意图;
45.图3为本发明实施例提供的一种企业名片信息查询装置的结构示意图;
46.图4为本发明实施例提供的一种企业名片信息查询装置的结构示意图;
47.图5为本发明实施例提供的一种电子设备的结构示意图。
具体实施方式
48.为了使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明作进一步地详细描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
49.为了提高企业名片信息查询的速度,本发明实施例提供了一种企业名片信息查询方法、装置、设备和介质。
50.实施例1:
51.图1为本发明实施例提供的一种企业名片信息查询方法的过程示意图,该过程包括以下步骤:
52.s101:根据获取的待查询企业名称信息的每个第一目标关键词、预先保存的关键词与企业名片信息集合的对应关系,确定每个第一目标关键词对应的每个目标企业名片信息集合的交集。
53.本发明实施例提供的企业名片信息查询方法应用于电子设备,该电子设备可以是智能手机、平板电脑、pc等智能终端设备;也可以是本地服务器、云端服务器等设备,具体的本发明实施例对此不做限制。
54.为了查询待查询企业名称信息对应的企业名片信息,在本发明实施例中,该电子设备获取待查询企业名称信息的每个第一目标关键词。其中该第一目标关键词是指对该待查询企业名称信息中的字符进行分组后确定的词组。
55.该电子设备获取到的每个第一目标关键词可以是待查询企业名称信息的所有词组,也可以是该待查询企业名称信息的部分词组。
56.该第一关键词中包括的字符数量至少有2个,该第一关键词中包括的字符数量可以是2、3、4、5、6
……
等,本发明实施例对此不做限制。例如待查询企业名称信息“航天信息企业股份有限公司”进行分组后,确定的第一目标关键词可以是“航天”、“信息”、“企业股份有限公司”,也可以是“航天信息”、“企业股份有限公司”。
57.具体的,获取的该待查询企业名称信息的每个第一目标关键词可以是预先根据该待查询企业名称信息以及预先保存的关键词库,采用现有的分词器确定的每个第一目标关键词。
58.获取到待查询企业名称信息的每个第一目标关键词后,为了确定待查询的企业名片信息的集合,该电子设备还预先保存有关键词与企业名片信息的对应关系,其中由于一个企业名片信息的企业名称信息包括的关键词不止一个,因此该企业名片信息与关键词的对应关系是一对多的对应关系,即一个企业名片信息可以存在于多个关键词对应的企业名片信息的集合中。
59.根据获取到的每个第一目标关键词、以及预先保存的关键词与企业名片信息集合的对应关系,在该对应关系中确定出每个第一目标关键词,并将每个第一目标关键词对应的企业名片信息集合确定为待查询的目标企业名片信息集合,根据每个目标企业名片信息集合确定每个目标企业名片信息集合的交集。
60.s102:根据所述待查询企业名称信息以及所述交集中的企业名片信息对应的企业名称信息,确定与所述待查询企业名称信息匹配的设定数量的目标企业名称信息对应的每个目标企业名片信息并显示。
61.该电子设备获取到待查询企业名称信息后,根据确定的企业名片信息的集合的交集,根据该交集中包括的企业名片信息对应的企业名称信息,确定该待查询企业名称信息与该交集中的企业名称信息的相似度。
62.根据该待查询企业名称信息与该交集中的企业名称信息的相似度,按照相似度的大小进行排序,确定出相似度大于设定阈值的目标相似度对应的企业名称信息,并将其作为与该待查询企业名称信息匹配的目标企业名称信息,并从目标企业名称信息选择出设定数量的目标企业名称信息,将该设定数量的目标企业名称信息对应的每个目标企业名片信息进行显示。
63.其中从目标企业名称信息选择出设定数量的目标企业名称信息可以是按照相似度从大到小的排序,确定排序在前的设定数量的目标企业名称信息,也可以是从目标企业名称信息中选择出设定数量的目标企业名称信息。
64.由于本发明实施例中该方法中根据获取的待查询企业名称信息的每个第一目标关键词、预先保存的关键词与企业名片信息集合的对应关系,确定每个第一目标关键词对应的每个目标企业名片信息集合的交集,每个第一目标关键词对应的每个目标企业名片信息集合均包括该待查询企业名称信息对应的企业名片信息,并且每个目标企业名片信息集合的交集相比于现有技术中的所有企业名片信息的数量较少,根据该交集中的企业名片信息对应的企业名称信息,确定与待查询企业名称信息匹配的设定数量的目标企业名称信息对应的每个目标企业名片信息时,由于在与待查询企业名称信息进行匹配时需要匹配的企业名称信息的数量较少,从而提高了企业名片信息查询时的速度,减少了查询所花费的时间。
65.实施例2:
66.为了确定关键词与企业名片信息集合的对应关系,在上述实施例的基础上,在本发明实施例中,所述确定关键词与企业名片信息集合的对应关系包括:
67.根据预先保存的企业名片信息的每个历史信息,确定每个企业的企业名片信息;
68.针对每个企业名片信息中的企业名称信息,根据该企业名称信息、以及预先保存的关键词库,确定该企业名称信息中包含的每个关键词;对应保存该企业名称信息对应的企业名片信息与所述每个关键词。
69.为了确定出关键词与企业名片信息集合的对应关系,在本发明实施例中,首先确定出每个企业的企业名片信息。
70.电子设备预先保存有企业名片信息的每个历史信息,由于数据更新、输入错误等原因,每个企业的企业名片信息会发生改变,导致同一企业的每个历史信息会不相同。例如企业名片信息中的企业名称信息、地址信息、以及电话信息等均有可能会发生变化,导致可能存在同一税号对应多个不同企业名称、同一企业名称对应多个不同税号,同一企业地址电话不一致等问题。因此该电子设备根据预先保存的企业名片信息的每个历史信息,确定每个企业的企业名片信息,其中该历史信息是在进行开票之前保存的企业名片信息。
71.具体的,确定每个企业的企业名片信息可以是根据每个企业的企业名片信息的历史信息,确定出历史信息中日期最新的信息作为每个企业的企业名片信息;也可以是根据每个企业的企业名片信息的历史信息,确定出历史信息中包括的企业名片信息的每种元素对应的子信息的字数,确定出每种元素的字数最长的子信息,并将每种元素的字数最长的子信息的组合作为每个企业的企业名片信息。具体的,本发明实施例对此不做限制。
72.其中该企业名片信息的每种元素包括纳税人识别号、企业名称、电话、地址、开户银行、开户账号等。
73.确定出每个企业名片信息后,由于每个企业名片信息中都包括企业名称这种元素,因此可以确定出每个企业名片信息中的企业名称信息。为了确定出每个企业名片信息对应的关键词,针对每个企业名片信息中的企业名称信息,确定出该企业名称信息中包括的关键词。
74.确定该企业名称信息中包括的关键词是根据该企业名称信息、以及预先保存的关键词库,确定该企业名称信息中包含的每个关键词;并对应保存该企业名称信息对应的企业名片信息与确定出的该企业名称信息中包含的每个关键词。
75.针对每个企业名片信息中的企业名称信息,均对应保存该企业名称信息对应的企业名片信息与确定出的该企业名称信息中包含的每个关键词,从而对应保存了每个关键词对应的每个企业名片信息,确定出关键词与企业名片信息集合的对应关系。
76.具体的,在本发明实施例中,该电子设备中包括开源分布式搜索引擎(elasticsearch),根据该电子设备的硬件资源条件,设置好分片数量,以映射的方式将数据库中保存的每个企业名片信息上传至elasticsearch中并确定关键词与企业名片信息集合的对应关系。
77.例如该电子设备为三台服务器,分别在三台服务器上面安装中文分词组件(ik),并在elasticsearch的配置文件中设置分词器为ik智能分词,配置完成后,重启elasticsearch,将分布式数据库(hive)中保存的每个企业的企业名片信息上传至elasticsearch中,根据该elasticsearch中的分词器以及预先保存的关键词库,确定出关键词与企业名片信息集合的对应关系。
78.实施例3:
79.为了提高确定的每个企业的企业名片信息的准确性,在上述各实施例的基础上,在本发明实施例中,所述根据预先保存的企业名片信息的每个历史信息,确定每个企业的企业名片信息包括:
80.根据预先保存的企业名片信息的每个历史信息中纳税人识别号对应的标识信息,
确定每个标识信息标识企业的历史信息组;
81.针对每个历史信息组,根据该历史信息组中所述每个历史信息的日期信息,确定日期最新的每个第一历史信息;针对企业名片信息的每个元素,根据所述每个第一历史信息中该元素对应的每个子信息的出现频次,确定该元素对应的目标子信息;根据每个元素对应的目标子信息,确定该历史信息组对应企业的企业名片信息。
82.电子设备预先保存有企业名片信息的每个历史信息,为了确定出每个历史信息中每个企业的企业名片信息的历史信息组,首先确定每个历史信息中纳税人识别号对应的标识信息。其中同一个企业的纳税人识别号会存在新旧两种格式,同一企业的新旧两种格式的纳税人识别号并不是完全相同,但是同一企业的纳税人识别号均表示同一家企业并且均包括相同的唯一id,因此同一企业存在相同的纳税人识别号的唯一id,将每个历史信息中纳税人识别号的排序最后的设定数量的数字作为纳税人识别号的唯一id,并将唯一id作为纳税人识别号对应的标识信息。
83.根据每个历史信息中纳税人识别号的唯一id,确定出包括相同唯一id的纳税人识别号的历史信息,并将其组成为该唯一id标识企业的历史信息组。
84.例如,表1为本发明实施例提供的一个企业标识信息标识企业的历史信息组,如表1所示:
85.表1
[0086][0087]
该表1中的历史信息组的中的纳税人识别号包括12345、12345、9212345、9212345、9212345五种,该12345为旧格式的纳税人识别号,该9212345为新格式的纳税人识别号,但是该旧格式的纳税人识别号12345和该新格式的纳税人识别号9212345均包括唯一id12345,因此该唯一id12345即为纳税人识别号的标识信息,根据该标识信息12345,从预先保存的每个历史信息中确定出该标识信息12345标识企业的历史信息组。
[0088]
该标识信息12345标识企业的历史信息组共包括五组历史信息,其中第一组历史信息的日期为2020-6-1、企业名称为aaa、地址为aaa、电话为aaa、开户行为aaaa、银行账号为aaaa;第二组历史信息的日期为2020-6-1、企业名称为bbb、地址为aaa、电话为aaa、开户行为aaa、银行账号为aaa;第三组历史信息的日期为2020-6-2、企业名称为bbbb、地址为bbb、电话为bbb、开户行为aaa、银行账号为bbb;第四组历史信息的日期为2020-6-2、企业名称为aaa、地址为bbb、电话为aaa、开户行为bbb、银行账号为aaa;第五组历史信息的日期为2020-6-2、企业名称为aaa、地址为aaa、电话为aaa、开户行为aaa、银行账号为aaa。
[0089]
确定出每个标识信息标识企业的历史信息组后,针对每个历史信息组,为了确定出该标识信息标识企业的企业名片信息,由于时间日期最新的历史信息准确性最高,因此确定出该历史信息组中所述每个历史信息的日期信息,根据该历史信息组中每个历史信息的日期信息,由于日期最新的历史信息可能不止一个,因此确定日期最新的每个第一历史信息。
[0090]
为了从日期最新的每个第一历史信息融合确定出该标识信息标识企业的企业名片信息,针对企业名片信息的每个元素,根据每个第一历史信息中该元素对应的每个子信息的出现频次,确定该元素对应的目标子信息。
[0091]
具体的根据纳税人识别号对应的每个子信息的出现频次,确定纳税人识别号对应的目标子信息;根据企业名称对应的每个子信息的出现频次,确定企业名称对应的目标子信息;根据地址对应的每个子信息的出现频次,确定地址对应的目标子信息;根据电话对应的每个子信息的出现频次,确定电话对应的目标子信息;根据开户行对应的每个子信息的出现频次,确定开户行对应的目标子信息;根据银行账号对应的每个子信息的出现频次,确定银行账号对应的目标子信息。
[0092]
具体的,根据每个第一历史信息中该元素对应的每个子信息的出现频次,确定该元素对应的目标子信息时,可以是将出现频次最高的子信息确定为该元素对应的目标子信息;也可以是将出现频次中间值对应的子信息确定为该元素对应的目标子信息。
[0093]
根据每个元素对应的目标子信息,将每个目标子信息形成的组合确定为该历史信息组对应企业的企业名片信息。
[0094]
为了更准确地确定元素对应的目标子信息,在本发明实施例中,所述根据所述每个第一历史信息中该元素对应的每个子信息的出现频次,确定该元素对应的目标子信息包括:
[0095]
根据所述每个第一历史信息中该元素对应的每个子信息的出现频次,确定出现频次最高的子信息;
[0096]
根据所述出现频次最高的子信息,确定该元素对应的目标子信息。
[0097]
为了更准确地确定元素对应的目标子信息,由于出现频次越高的子信息为该元素对应的目标子信息的准确性就越高,因此根据每个第一历史信息中该元素对应的每个子信息的出现频次,确定出现频次最高的子信息;根据出现频次最高的子信息,将该出现频次最高的子信息确定为该元素对应的目标子信息。
[0098]
例如,该历史信息组为该表1中的历史信息组,由于第一组历史信息和第二组历史信息的日期均为2020-6-1,而第三组历史信息、第四组历史信息、和第五组历史信息的日期均为2020-6-2,因此确定日期最新的每个第一历史信息包括第三组历史信息、第四组历史信息、和第五组历史信息。
[0099]
该第三组历史信息、第四组历史信息、和第五组历史信息中纳税人识别号对应的子信息9212345的出现频次为三次,因此纳税人识别号对应的目标子信息9212345;企业名称对应的子信息aaa的出现频次为两次,子信息bbbb的出现频次为一次,因此企业名称对应的目标子信息aaa;因此确定出纳税人识别号和企业名称的一对一对照表,该表2为纳税人识别号和企业名称的一对一对照表,如表2所示:
[0100]
表2
[0101]
纳税人识别号企业名称唯一id9212345aaa12345
[0102]
该表2中的纳税人识别号为9212345,企业名称为aaa,唯一id为12345。
[0103]
该第三组历史信息、第四组历史信息、和第五组历史信息中地址对应的子信息bbb的出现频次为两次,子信息aaa的出现频次为一次,因此地址对应的目标子信息bbb;电话对应的子信息aaa的出现频次为两次,子信息bbb的出现频次为一次,因此电话对应的目标子信息aaa;开户行对应的子信息aaa的出现频次为两次,子信息bbb的出现频次为一次,因此开户行对应的目标子信息aaa;银行账号对应的子信息aaa的出现频次为两次,子信息bbb的出现频次为一次,因此银行账号对应的目标子信息aaa;因此确定出唯一标识id表,该表3为唯一标识id表,如表3所示:
[0104]
表3
[0105]
唯一标识id地址电话开户行银行账号日期12345aaaaaaaaaaaa2020-6-2
[0106]
该表3中的地址为aaa,电话为aaa,开户行为aaa,银行账号为aaa,日期为2020-6-2,唯一id为12345。
[0107]
根据该表2和表3中的每个元素对应的目标子信息,将每个目标子信息形成的组合确定为该历史信息组对应企业的企业名片信息,即该唯一标识id标识企业的企业名片信息中的纳税人识别号为9212345,企业名称为aaa,地址为aaa,电话为aaa,开户行为aaa,银行账号为aaa。
[0108]
为了更准确地确定企业名片信息的每个元素的目标子信息,在本发明实施例中,所述根据所述出现频次最高的子信息,确定该元素对应的目标子信息包括:
[0109]
若出现频次最高的子信息只有一个,则将该出现频次最高的子信息确定为该元素对应的目标子信息;
[0110]
若出现频次最高的子信息至少有两个,则将出现频次最高且包含字数最多的子信息确定为该元素对应的目标子信息。
[0111]
在本发明实施例中,针对每个元素的出现频次最高的子信息可能是一个,也可能是两个,因此在出现频次最高的子信息只有一个时,将该出现频次最高的子信息确定为该元素对应的目标子信息;在出现频次最高的子信息至少有两个时,为了提高确定的每个元素的目标子信息的准确性,由于子信息包含的字数越多,该子信息为该元素对应的完整子信息的可能性越高,因此将出现频次最高且包含字数最多的子信息确定为该元素对应的目标子信息。
[0112]
下面通过一个完整的实施例对本发明实施例的确定每个企业的企业名片信息的过程进行说明,图2为本发明实施例提供的一种确定每个企业的企业名片信息的过程示意图,如图2所示,该过程包括以下步骤:
[0113]
s201:根据预先保存的企业名片信息的每个历史信息中纳税人识别号对应的唯一标识id,确定每个唯一标识id标识企业的历史信息组。
[0114]
s202:针对每个历史信息组,根据该历史信息组中每个历史信息的日期信息,确定日期最新的每个第一历史信息,分别进入s203和s204。
[0115]
s203:针对企业名片信息的纳税人识别号和企业名称,根据每个第一历史信息中
纳税人识别号和企业名称分别对应的每个子信息的出现频次,确定纳税人识别和企业名称分别对应的目标子信息,并确定出纳税人识别号和企业名称的一对一对照表,进入s205。
[0116]
s204:针对企业名片信息的地址、电话、开户行和银行账号,根据每个第一历史信息中地址、电话、开户行和银行账号分别对应的每个子信息的出现频次,确定地址、电话、开户行和银行账号分别对应的目标子信息,并确定出唯一标识id表。
[0117]
s205:根据唯一标识id表和纳税人识别号和企业名称的一对一对照表,确定唯一标识id相同的两个表,并形成最终的唯一标识id标识企业的企业名片信息。
[0118]
实施例4:
[0119]
为了实现对企业名片信息的更正,在上述各实施例的基础上,在本发明实施例中,所述方法还包括:
[0120]
若接收到对输出的任一目标企业名片信息的更正指示;
[0121]
接收所述目标企业名片信息的任一元素修改后的子信息,并对应保存所述目标企业名称信息包含的所述每个第一目标关键词和修改后的目标企业名片信息。
[0122]
在本发明实施例中,在该电子设备输出显示每个目标企业名片信息后,如果任一目标企业名片信息出现过时未更新、或企业名片信息错误等问题,还可能会接收到对任一目标企业名片信息的更正指示。
[0123]
若该电子设备接收到用户对任一目标企业名片信息的更正指示时,其中,该更正指示可以是通过电子设备的显示屏接收到的,也可以是通过该电子设备的声音采集装置接收到用户的更正指示。
[0124]
该电子设备通过显示屏接收到用户输入的目标企业名片信息的任一元素修改后的子信息,将该修改后的目标企业名片信息保存在该目标企业名称信息包含的每个第一目标关键词与企业名片信息的对应关系中。
[0125]
实施例5:
[0126]
为了添加新的企业名片信息,在上述各实施例的基础上,在本发明实施例中,若未确定出与所述待查询企业名称信息匹配的目标企业名称信息对应的目标企业名片信息,所述方法还包括:
[0127]
接收待添加企业名片信息;
[0128]
确定所述待添加企业名片信息的待添加企业名称信息的每个第二目标关键词;
[0129]
根据所述每个第二目标关键词与所述待添加企业名片信息的对应关系,对预先保存的关键词与企业名片信息集合的所述对应关系进行更新。
[0130]
在本发明实施例中,由于在待查询企业名称信息的企业名片信息不存在时,该电子设备未确定出与该待查询企业名称信息匹配的目标企业名称信息对应的目标企业名片信息,还会接收待添加企业名片信息。其中,该待添加企业名片信息可以是通过电子设备的显示屏接收到的,也可以是通过该电子设备的声音采集装置接收到的。
[0131]
接收到该待添加企业名片信息后,为了在该对应关系中添加新的企业名片信息,确定该待添加企业名片信息的待添加企业名称信息的每个第二目标关键词。具体的,根据接收到的该待添加企业名称信息、该elasticsearch中的分词器以及预先保存的关键词库,确定出该待添加企业名称信息中的每个第二目标关键词。
[0132]
根据每个第二目标关键词与待添加企业名片信息的对应关系,对预先保存的关键
词与企业名片信息集合的所述对应关系进行更新,即确定出该对应关系中的该第二目标关键词,将该第二目标关键词对应的待添加企业名片信息添加到该第二目标关键词对应的企业名片信息集合中。
[0133]
实施例6:
[0134]
在上述各实施例的基础上,图3为本发明实施例提供的一种企业名片信息查询装置的结构示意图,所述装置包括:
[0135]
确定模块301,用于根据获取的待查询企业名称信息的每个第一目标关键词、预先保存的关键词与企业名片信息集合的对应关系,确定每个第一目标关键词对应的每个目标企业名片信息集合的交集;
[0136]
查询模块302,用于根据所述待查询企业名称信息以及所述交集中的企业名片信息对应的企业名称信息,确定与所述待查询企业名称信息匹配的设定数量的目标企业名称信息对应的每个目标企业名片信息并显示。
[0137]
进一步地,所述确定模块,还用于根据预先保存的企业名片信息的每个历史信息,确定每个企业的企业名片信息;针对每个企业名片信息中的企业名称信息,根据该企业名称信息、以及预先保存的关键词库,确定该企业名称信息中包含的每个关键词;对应保存该企业名称信息对应的企业名片信息与所述每个关键词。
[0138]
进一步地,所述确定模块,还用于根据预先保存的企业名片信息的每个历史信息中纳税人识别号对应的标识信息,确定每个标识信息标识企业的历史信息组;针对每个历史信息组,根据该历史信息组中所述每个历史信息的日期信息,确定日期最新的每个第一历史信息;针对企业名片信息的每个元素,根据所述每个第一历史信息中该元素对应的每个子信息的出现频次,确定该元素对应的目标子信息;根据每个元素对应的目标子信息,确定该历史信息组对应企业的企业名片信息。
[0139]
进一步地,所述确定模块,具体还用于根据所述每个第一历史信息中该元素对应的每个子信息的出现频次,确定出现频次最高的子信息;根据所述出现频次最高的子信息,确定该元素对应的目标子信息。
[0140]
进一步地,所述确定模块,具体还用于若出现频次最高的子信息只有一个,则将该出现频次最高的子信息确定为该元素对应的目标子信息;若出现频次最高的子信息至少有两个,则将出现频次最高且包含字数最多的子信息确定为该元素对应的目标子信息。
[0141]
进一步地,所述装置还包括:
[0142]
更新模块,用于若接收到对输出的任一目标企业名片信息的更正指示;接收所述目标企业名片信息的任一元素修改后的子信息,并对应保存所述目标企业名称信息包含的所述每个第一目标关键词和修改后的目标企业名片信息。
[0143]
进一步地,所述装置还包括:
[0144]
更新模块,用于接收待添加企业名片信息;确定所述待添加企业名片信息的待添加企业名称信息的每个第二目标关键词;根据所述每个第二目标关键词与所述待添加企业名片信息的对应关系,对预先保存的关键词与企业名片信息集合的所述对应关系进行更新。
[0145]
下面通过一个具体的实施例对本发明实施例的企业名片信息查询装置的结构进行说明,图4为本发明实施例提供的一种企业名片信息查询装置的结构示意图,如图4所示,
该企业名片信息查询装置中包括计算引擎(spark)401、分布式数据库(hive)402、搜索引擎(elasticsearch)403、关系型数据库404、企业名片信息查询接口405、企业名片信息更新接口406。
[0146]
计算引擎(spark)401与分布式数据库(hive)402以及关系型数据库404相连,用于根据预先保存的企业名片信息的每个历史信息,预先确定每个企业的企业名片信息并发送给分布式数据库(hive)403,相当于本发明实施例中的确定模块301。
[0147]
分布式数据库(hive)402分别与计算引擎(spark)401和搜索引擎(elasticsearch)403相连,用于保存每个企业的企业名片信息,并将每个企业的企业名片信息上传至搜索引擎(elasticsearch)403。
[0148]
搜索引擎(elasticsearch)403分别与分布式数据库(hive)402以及企业名片信息查询接口405相连,用于根据每个企业的企业名片信息、以及预先保存的关键词库,由该elasticsearch中的分词器确定出关键词与企业名片信息集合的对应关系并保存,并通过企业名片信息查询接口405获取待查询企业名称信息的每个第一目标关键词,确定出待查询企业名称信息匹配的设定数量的目标企业名称信息对应的每个目标企业名片信息并显示;相当于本发明实施例中的确定模块301和查询模块302。
[0149]
企业名片信息查询接口405与搜索引擎(elasticsearch)403相连,用于获取待查询企业名称信息以及待查询企业名称信息的每个第一目标关键词。具体的该企业名片信息查询接口405通过编程语言(java)使用传输客户端(transportclient)的连接方式与搜索引擎(elasticsearch)403相连,相当于本发明实施例中的查询模块302。
[0150]
企业名片信息更新接口406与关系型数据库404相连,用于接收更正指示、目标企业名片信息的任一元素修改后的子信息、或待添加企业名片信息。
[0151]
关系型数据库404,用于通过企业名片信息更新接口406接收到目标企业名片信息的任一元素修改后的子信息、或待添加企业名片信息后,上传至计算引擎(spark)401。
[0152]
实施例7:
[0153]
图5为本发明实施例提供的一种电子设备的结构示意图,在上述各实施例的基础上,本发明实施例中还提供了一种电子设备,包括处理器501、通信接口502、存储器503和通信总线504,其中,处理器501,通信接口502,存储器503通过通信总线504完成相互间的通信;
[0154]
所述存储器503中存储有计算机程序,当所述程序被所述处理器501执行时,使得所述处理器501执行如下步骤:
[0155]
根据获取的待查询企业名称信息的每个第一目标关键词、预先保存的关键词与企业名片信息集合的对应关系,确定每个第一目标关键词对应的每个目标企业名片信息集合的交集;
[0156]
根据所述待查询企业名称信息以及所述交集中的企业名片信息对应的企业名称信息,确定与所述待查询企业名称信息匹配的设定数量的目标企业名称信息对应的每个目标企业名片信息并显示。
[0157]
进一步地,所述处理器501还用于确定关键词与企业名片信息集合的对应关系包括:
[0158]
根据预先保存的企业名片信息的每个历史信息,确定每个企业的企业名片信息;
[0159]
针对每个企业名片信息中的企业名称信息,根据该企业名称信息、以及预先保存的关键词库,确定该企业名称信息中包含的每个关键词;对应保存该企业名称信息对应的企业名片信息与所述每个关键词。
[0160]
进一步地,所述处理器501具体用于所述根据预先保存的企业名片信息的每个历史信息,确定每个企业的企业名片信息包括:
[0161]
根据预先保存的企业名片信息的每个历史信息中纳税人识别号对应的标识信息,确定每个标识信息标识企业的历史信息组;
[0162]
针对每个历史信息组,根据该历史信息组中所述每个历史信息的日期信息,确定日期最新的每个第一历史信息;针对企业名片信息的每个元素,根据所述每个第一历史信息中该元素对应的每个子信息的出现频次,确定该元素对应的目标子信息;根据每个元素对应的目标子信息,确定该历史信息组对应企业的企业名片信息。
[0163]
进一步地,所述处理器501具体用于所述根据所述每个第一历史信息中该元素对应的每个子信息的出现频次,确定该元素对应的目标子信息包括:
[0164]
根据所述每个第一历史信息中该元素对应的每个子信息的出现频次,确定出现频次最高的子信息;
[0165]
根据所述出现频次最高的子信息,确定该元素对应的目标子信息。
[0166]
进一步地,所述处理器501具体用于所述根据所述出现频次最高的子信息,确定该元素对应的目标子信息包括:
[0167]
若出现频次最高的子信息只有一个,则将该出现频次最高的子信息确定为该元素对应的目标子信息;
[0168]
若出现频次最高的子信息至少有两个,则将出现频次最高且包含字数最多的子信息确定为该元素对应的目标子信息。
[0169]
进一步地,所述处理器501还用于若接收到对输出的任一目标企业名片信息的更正指示;
[0170]
接收所述目标企业名片信息的任一元素修改后的子信息,并对应保存所述目标企业名称信息包含的所述每个第一目标关键词和修改后的目标企业名片信息。
[0171]
进一步地,所述处理器501还用于若未确定出与所述待查询企业名称信息匹配的目标企业名称信息对应的目标企业名片信息,所述方法还包括:
[0172]
接收待添加企业名片信息;
[0173]
确定所述待添加企业名片信息的待添加企业名称信息的每个第二目标关键词;
[0174]
根据所述每个第二目标关键词与所述待添加企业名片信息的对应关系,对预先保存的关键词与企业名片信息集合的所述对应关系进行更新。
[0175]
上述电子设备提到的通信总线可以是外设部件互连标准(peripheral component interconnect,pci)总线或扩展工业标准结构(extended industry standard architecture,eisa)总线等。该通信总线可以分为地址总线、数据总线、控制总线等。为便于表示,图中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
[0176]
通信接口502用于上述电子设备与其他设备之间的通信。
[0177]
存储器可以包括随机存取存储器(random access memory,ram),也可以包括非易失性存储器(non-volatile memory,nvm),例如至少一个磁盘存储器。可选地,存储器还可
以是至少一个位于远离前述处理器的存储装置。
[0178]
上述处理器可以是通用处理器,包括中央处理器、网络处理器(network processor,np)等;还可以是数字指令处理器(digital signal processing,dsp)、专用集成电路、现场可编程门陈列或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。
[0179]
实施例8:
[0180]
在上述各实施例的基础上,本发明实施例还提供了一种计算机可读存储介质,其存储有计算机程序,所述计算机程序被处理器执行如下步骤:
[0181]
根据获取的待查询企业名称信息的每个第一目标关键词、预先保存的关键词与企业名片信息集合的对应关系,确定每个第一目标关键词对应的每个目标企业名片信息集合的交集;
[0182]
根据所述待查询企业名称信息以及所述交集中的企业名片信息对应的企业名称信息,确定与所述待查询企业名称信息匹配的设定数量的目标企业名称信息对应的每个目标企业名片信息并显示。
[0183]
进一步地,确定关键词与企业名片信息集合的对应关系包括:
[0184]
根据预先保存的企业名片信息的每个历史信息,确定每个企业的企业名片信息;
[0185]
针对每个企业名片信息中的企业名称信息,根据该企业名称信息、以及预先保存的关键词库,确定该企业名称信息中包含的每个关键词;对应保存该企业名称信息对应的企业名片信息与所述每个关键词。
[0186]
进一步地,所述根据预先保存的企业名片信息的每个历史信息,确定每个企业的企业名片信息包括:
[0187]
根据预先保存的企业名片信息的每个历史信息中纳税人识别号对应的标识信息,确定每个标识信息标识企业的历史信息组;
[0188]
针对每个历史信息组,根据该历史信息组中所述每个历史信息的日期信息,确定日期最新的每个第一历史信息;针对企业名片信息的每个元素,根据所述每个第一历史信息中该元素对应的每个子信息的出现频次,确定该元素对应的目标子信息;根据每个元素对应的目标子信息,确定该历史信息组对应企业的企业名片信息。
[0189]
进一步地,所述根据所述每个第一历史信息中该元素对应的每个子信息的出现频次,确定该元素对应的目标子信息包括:
[0190]
根据所述每个第一历史信息中该元素对应的每个子信息的出现频次,确定出现频次最高的子信息;
[0191]
根据所述出现频次最高的子信息,确定该元素对应的目标子信息。
[0192]
进一步地,所述根据所述出现频次最高的子信息,确定该元素对应的目标子信息包括:
[0193]
若出现频次最高的子信息只有一个,则将该出现频次最高的子信息确定为该元素对应的目标子信息;
[0194]
若出现频次最高的子信息至少有两个,则将出现频次最高且包含字数最多的子信息确定为该元素对应的目标子信息。
[0195]
进一步地,所述方法还包括:
[0196]
若接收到对输出的任一目标企业名片信息的更正指示;
[0197]
接收所述目标企业名片信息的任一元素修改后的子信息,并对应保存所述目标企业名称信息包含的所述每个第一目标关键词和修改后的目标企业名片信息。
[0198]
进一步地,若未确定出与所述待查询企业名称信息匹配的目标企业名称信息对应的目标企业名片信息,所述方法还包括:
[0199]
接收待添加企业名片信息;
[0200]
确定所述待添加企业名片信息的待添加企业名称信息的每个第二目标关键词;
[0201]
根据所述每个第二目标关键词与所述待添加企业名片信息的对应关系,对预先保存的关键词与企业名片信息集合的所述对应关系进行更新。
[0202]
本领域内的技术人员应明白,本技术的实施例可提供为方法、系统、或计算机程序产品。因此,本技术可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本技术可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、cd-rom、光学存储器等)上实施的计算机程序产品的形式。
[0203]
本技术是参照根据本技术的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
[0204]
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
[0205]
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
[0206]
显然,本领域的技术人员可以对本技术进行各种改动和变型而不脱离本技术的精神和范围。这样,倘若本技术的这些修改和变型属于本技术权利要求及其等同技术的范围之内,则本技术也意图包含这些改动和变型在内。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1