企业性质的识别方法、装置、存储介质及计算机设备与流程

文档序号:29706577发布日期:2022-04-16 15:51阅读:103来源:国知局
企业性质的识别方法、装置、存储介质及计算机设备与流程

1.本技术涉及办公自动化领域,尤其涉及一种企业性质的识别方法、装置、存储介质及计算机设备。


背景技术:

2.随着企业规模的增大,合作伙伴的数量日益增加,为了方便对供应链进行管理,更好的评估采购风险,需要对合作伙伴的企业性质进行检测,以检测是否为民营企业。目前对企业类型的识别工作一般采用人工线下识别,然后手动录入系统的方式,然而这种方式存在效率低和容易出错的问题。


技术实现要素:

3.本技术实施例提供了企业性质的识别方法、装置、存储介质及计算机设备,可以解决现有技术识别企业性质存在效率低和容易出错的问题。所述技术方案如下:
4.第一方面,本技术实施例提供了一种企业性质的识别方法,所述方法包括:
5.获取连续n次采集的目标企业的属性信息;其中,n为大于1的整数,所述属性信息包括工商信息和股东信息;
6.根据预设的识别模型分别对n次采集的属性信息进行检测得到n个检测结果;
7.若n个检测结果相同,以及将所述检测结果和所述目标企业的标识信息进行关联后存储到关系型数据库中。
8.第二方面,本技术实施例提供了一种企业性质的识别装置,所述装置包括:
9.获取单元,用于获取连续n次采集的目标企业的属性信息;其中,n为大于1的整数,所述属性信息包括工商信息和股东信息;
10.检测单元,用于根据预设的识别模型分别对n次采集的属性信息进行检测得到n个检测结果;
11.记录单元,用于若n个检测结果相同,以及将所述检测结果和所述目标企业的标识信息进行关联后存储到关系型数据库中。
12.第三方面,本技术实施例提供一种计算机存储介质,所述计算机存储介质存储有多条指令,所述指令适于由处理器加载并执行上述的方法步骤。
13.第四方面,本技术实施例提供一种计算机设备,可包括:处理器和存储器;其中,所述存储器存储有计算机程序,所述计算机程序适于由所述处理器加载并执行上述的方法步骤。
14.本技术一些实施例提供的技术方案带来的有益效果至少包括:
15.获取多个连续采集的企业的属性信息,根据识别模型自动识别多次采集的属性信息得到多个检测结果,若多个检测结果相同,将该检测结果作为企业的检测结果,以及将检测结果自动存储到关系型数据库中以便后续进行查询和调用,本技术基于识别模型自动识别企业性质,实现海量数据的自动化处理,解放人工繁重和持久的工作任务,提高企业信息
管理的效率。
附图说明
16.为了更清楚地说明本技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
17.图1是本技术实施例提供的系统架构的示意图;
18.图2是本技术实施例提供的企业性质的识别方法的流程示意图;
19.图3是本技术提供的一种企业性质的识别装置的结构示意图;
20.图4是本技术提供的一种计算机设备的结构示意图。
具体实施方式
21.为使本技术的目的、技术方案和优点更加清楚,下面将结合附图对本技术实施例方式作进一步地详细描述。
22.需要说明的是,本技术提供的企业性质的识别方法一般由计算机设备执行,相应的,企业性质的识别装置一般设置于计算机设备中。
23.图1示出了可以应用于本技术的企业性质的识别方法或企业性质的识别装置的示例性系统架构。
24.如图1所示,系统架构可以包括:计算机设备101和服务器102。计算机设备101和服务器102之间可以通过网络进行通信,网络用于上述各个单元之间提供通信链路的介质。网络可以包括各种类型的有线通信链路或无线通信链路,例如:有线通信链路包括光纤、双绞线或同轴电缆的,无线通信链路包括蓝牙通信链路、无线保真(wireless-fidelity,wi-fi)通信链路或微波通信链路等。
25.其中,服务器102中部署数据源,数据源中存储有各个企业的属性信息,例如:工商信息和股东信息等,计算机设备。
26.需要说明的是,计算机设备101和服务器102可以是硬件,也可以是软件。当计算机设备101和服务器102为硬件时,可以实现成多个服务器组成的分布式服务器集群,也可以实现成单个服务器。当计算机设备101和服务器102为软件时,可以实现成多个软件或软件模块(例如用来提供分布式服务),也可以实现成单个软件或软件模块,在此不做具体限定。
27.本技术的计算机设备上可以安装有各种通信客户端应用,例如:视频录制应用、视频播放应用、语音交互应用、搜索类应用、即时通信工具、邮箱客户端、社交平台软件等。
28.计算机设备可以是硬件,也可以是软件。当计算机设备为硬件时,可以是具有显示屏的各种计算机设备,包括但不限于智能手机、平板电脑、膝上型便携式计算机和台式计算机等等。当计算机设备为软件时,可以是安装上上述所列举的计算机设备中。其可以实现呈多个软件或软件模块(例如:用来提供分布式服务),也可以实现成单个软件或软件模块,在此不作具体限定。
29.当计算机设备为硬件时,其上还可以安装有显示设备和摄像头,显示设备显示可以是各种能实现显示功能的设备,摄像头用于采集视频流;例如:显示设备可以是阴极射线
管显示器(cathode ray tube display,简称cr)、发光二极管显示器(light-emitting diode display,简称led)、电子墨水屏、液晶显示屏(liquid crystal display,简称lcd)、等离子显示面板 (plasma display panel,简称pdp)等。用户可以利用计算机设备上的显示设备,来查看显示的文字、图片、视频等信息。
30.应理解,图1中的计算机设备、网络和服务器的数目仅是示意性的。根据实现需要,可以是任意数量的计算机设备、网络和服务器。
31.下面将结合附图2,对本技术实施例提供的企业性质的识别方法进行详细介绍。其中,本技术实施例中的企业性质的识别装置可以是图1所示的计算机设备。
32.请参见图2,为本技术实施例提供了一种企业性质的识别方法的流程示意图。如图1所示,本技术实施例的所述方法可以包括以下步骤:
33.s201、获取连续n次采集的目标企业的属性信息。
34.其中,n为大于1的整数,属性信息包括工商信息和股东信息,工商信息包括但不限于:统一社会信用代码、公司名称、公司类型、注册地址、注册资本等工商注册时登记的信息;股东信息表示企业各个股东的持股比例的信息。计算机设备可通过外部接入、线下导入或rpa (robotic process automation,机器人流程自动化)方式连续n次采集目标企业的属性信息。例如,计算机设备通过网络爬虫从工商管理部门的服务器或第三方的企业信息管理服务器中采集目标企业的属性信息。
35.进一步的,本技术可以同时连续n次采集多个企业的属性信息(海量数据),采集的方式可以为分层抽样或随机抽样的方式从服务器中采集海量企业的属性信息,以提高采集效率。
36.s202、根据预设的识别模型分别对n次采集的属性信息进行检测得到n个检测结果。
37.其中,识别模型可以是机器学习模型、深度学习模型或由于多个判断条件组成的逻辑表达式,检测结果为二元结果,即民营企业和非民营企业。分别对目标企业的n次采集的属性信息进行检测得到n个检测结果。
38.在一个或多个可能的实施例中,若识别模型为机器学习模型或深度学习模型,将企业的属性信息转换为特征向量,将特征向量输入到识别模型中得到检测结果。
39.在一个或多个可能的实施例中,若识别模型由多个判断条件组成的逻辑表达式,则判断过程包括:
40.查询目标企业的实际控制人,查询的方法可以是:根据目标企业的股东信息确定各个股东的持股比例,将持股比例最大的股东作为实际控制人;若查询到实际控制人,确定实际控制人的类型,若实际控制人的类型为自然人,那么目标企业的检测结果为民营企业;若实际控制人的类型为国家行政机关、事业单位或国有企业,那么目标企业的检测结果为国有企业 (非民营企业);若实际控制人的类型为境外法人或境外自然人,那么目标企业的检测结果为外资企业(非民营企业);若实际控制人的类型为除上述情形外的其他情形,那么目标企业的检测结果为民营企业;
41.若未查询到实际控制人,获取目标企业的企业类型,工商信息中包括企业类型,若企业类型中包含关键词“集体”,则目标企业的检测结果为集体企业(非民营企业);若企业类型中包含关键词“国有”,则目标企业的检测结果为国有企业(非民营企业);若企业类型
中包含关键词“全民所有制”,则目标企业的检测结果为国有企业(非民营企业);若企业类型不包含上述的任意一种关键词,则目标企业的检测结果为民营企业。
42.s203、若n个检测结果相同,以及将检测结果和目标企业的标识信息进行关联后存储到关系型数据库中。
43.其中,若n个检测结果全部相同,将检测结果和目标企业的标识信息进行关联后存储到关系型数据库中,标识信息用于唯一表示目标企业的身份,例如:标识信息可以为统一社会信用代码或自定义的代码等,关系型数据库包括但不限于:sql数据库。
44.在一个或多个可能的实施例中,还包括:
45.若所述n个检测结果不完全相同,则继续判断n次采集的属性信息是否相同,若为否,则将最后一个检测结果作为所述目标企业最终的检测结果;
46.若为是,则显示弹出提示消息;其中,所述提示消息用于提示所述识别模型的业务代码发生故障。
47.其中,若n个检测结果中存在至少两个检测结果不相同,继续判断n次采集的属性信息是否相同,若不相同,则表示目标企业的属性信息在数据采集过程中发生变更,此时将最后一个检测结果作为目标企业最终的检测结果;若n次采集的属性信息均相同,即未发生变更,那么弹出提示消息,以提示识别模型的业务代码发生故障,以便用户及时排除业务代码中的故障,提高识别模型识别的准确性。
48.在一个或多个可能的实施例中,用户可以根据实际需求对识别模型进行校正,例如:对识别模型包含的多个判断条件进行删除处理、增加处理或修改处理,以提高识别模型识别的准确性。
49.在一个或多个可能的实施例中,在获取到目标企业的检测结果之后,计算机设备周期性的监测所述目标企业的属性信息;若所述目标企业的属性信息变更时,根据所述识别模型对变更后的属性信息进行检测得到新的检测结果;根据所述新的检测结果更新所述关系型数据库,这样可以及时检测目标企业的企业性质变动情况。
50.在一个或多个可能的实施例中,本技术还设置有api调用接口,计算机设备接收来自调用者的api调用请求;其中,所述api调用请求携带所述目标企业的标识信息;根据所述标识信息在所述关系型数据库中查询对应的检测结果;返回携带所述检测结果的api查询响应。调用者可以是应用程序或网页等,本技术不作限制,可以自动将企业性质返回给调用者。
51.本技术实施例,获取多个连续采集的企业的属性信息,根据识别模型自动识别多次采集的属性信息得到多个检测结果,若多个检测结果相同,将该检测结果作为企业的检测结果,以及将检测结果自动存储到关系型数据库中以便后续进行查询和调用,本技术基于识别模型自动识别企业性质,实现海量数据的自动化处理,解放人工繁重和持久的工作任务,促进企业管理数字化转型工作。
52.下述为本技术装置实施例,可以用于执行本技术方法实施例。对于本技术装置实施例中未披露的细节,请参照本技术方法实施例。
53.请参见图3,其示出了本技术一个示例性实施例提供的企业性质的识别装置的结构示意图,以下简称装置3。该装置3可以通过软件、硬件或者两者的结合实现成为计算机设备的全部或一部分。装置3包括:获取单元301、检测单元302、记录单元303。
54.获取单元301,用于获取连续n次采集的目标企业的属性信息;其中,n为大于1的整数,所述属性信息包括工商信息和股东信息;
55.检测单元302,用于根据预设的识别模型分别对n次采集的属性信息进行检测得到n个检测结果;
56.记录单元303,用于若n个检测结果相同,以及将所述检测结果和所述目标企业的标识信息进行关联后存储到关系型数据库中。
57.在一个或多个可能的实施例中,检测单元302还用于:
58.若所述n个检测结果不完全相同,则继续判断n次采集的属性信息是否相同;
59.若为否,则将最后一个检测结果作为所述目标企业最终的检测结果;
60.若为是,则显示弹出提示消息;其中,所述提示消息用于提示所述识别模型的业务代码发生故障。
61.在一个或多个可能的实施例中,所述识别模型由多个判断条件组成;
62.所述多个判断条件为:
63.查询所述目标企业的实际控制人;
64.若查询到实际控制人,判断所述实际控制人的类型;
65.若所述类型为自然人,则所述目标企业的检测结果为民营企业;
66.若为查询到实际控制人,在所述目标企业的公司信息中获取企业类型;
67.根据所述企业类型包含的关键词确定检测结果。
68.在一个或多个可能的实施例中,还包括:
69.更新单元,用于对所述识别模型包含的多个判断条件进行删除处理、增加处理或修改处理。
70.在一个或多个可能的实施例中,基于随机抽样或分层抽样的方式从数据源中连续n次采集多个企业的属性信息,所述目标企业为所述多个企业中的一个。
71.在一个或多个可能的实施例中,还包括:
72.监测单元,用于周期性的监测所述目标企业的属性信息;
73.若所述目标企业的属性信息变更时,根据所述识别模型对变更后的属性信息进行检测得到新的检测结果;
74.根据所述新的检测结果更新所述关系型数据库。
75.在一个或多个可能的实施例中,还包括:
76.查询单元,用于接收api调用请求;其中,所述api调用请求携带所述目标企业的标识信息;
77.根据所述标识信息在所述关系型数据库中查询对应的检测结果;
78.返回携带所述检测结果的api查询响应。
79.需要说明的是,上述实施例提供的装置3在执行企业性质的识别方法时,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即将设备的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。另外,上述实施例提供的企业性质的识别装置与企业性质的识别方法实施例属于同一构思,其体现实现过程详见方法实施例,这里不再赘述。
80.上述本技术实施例序号仅仅为了描述,不代表实施例的优劣。
81.本技术实施例还提供了一种计算机存储介质,所述计算机存储介质可以存储有多条指令,所述指令适于由处理器加载并执行如上述图2所示实施例的方法步骤,具体执行过程可以参见图2所示实施例的具体说明,在此不进行赘述。
82.本技术还提供了一种计算机程序产品,该计算机程序产品存储有至少一条指令,所述至少一条指令由所述处理器加载并执行以实现如上各个实施例所述的企业性质的识别方法。
83.请参见图4,为本技术实施例提供了一种计算机设备的结构示意图。如图4所示,所述计算机设备400可以包括:至少一个处理器401,至少一个网络接口404,用户接口403,存储器405,至少一个通信总线402。
84.其中,通信总线402用于实现这些组件之间的连接通信。
85.其中,用户接口403可以包括显示屏(display)、摄像头(camera),可选用户接口403 还可以包括标准的有线接口、无线接口。
86.其中,网络接口404可选的可以包括标准的有线接口、无线接口(如wi-fi接口)。
87.其中,处理器401可以包括一个或者多个处理核心。处理器401利用各种借口和线路连接整个终端400内的各个部分,通过运行或执行存储在存储器405内的指令、程序、代码集或指令集,以及调用存储在存储器405内的数据,执行终端400的各种功能和处理数据。可选的,处理器401可以采用数字信号处理(digital signal processing,dsp)、现场可编程门阵列(field-programmable gatearray,fpga)、可编程逻辑阵列(programmable logic array, pla)中的至少一种硬件形式来实现。处理器401可集成中央处理器(central processing unit, cpu)、图像处理器(graphics processing unit,gpu)和调制解调器等中的一种或几种的组合。其中,cpu主要处理操作系统、用户界面和应用程序等;gpu用于负责显示屏所需要显示的内容的渲染和绘制;调制解调器用于处理无线通信。可以理解的是,上述调制解调器也可以不集成到处理器401中,单独通过一块芯片进行实现。
88.其中,存储器405可以包括随机存储器(randomaccess memory,ram),也可以包括只读存储器(read-only memory)。可选的,该存储器405包括非瞬时性计算机可读介质 (non-transitory computer-readable storage medium)。存储器405可用于存储指令、程序、代码、代码集或指令集。存储器405可包括存储程序区和存储数据区,其中,存储程序区可存储用于实现操作系统的指令、用于至少一个功能的指令(比如触控功能、声音播放功能、图像播放功能等)、用于实现上述各个方法实施例的指令等;存储数据区可存储上面各个方法实施例中涉及到的数据等。存储器405可选的还可以是至少一个位于远离前述处理器401的存储装置。如图4所示,作为一种计算机存储介质的存储器405中可以包括操作系统、网络通信模块、用户接口模块以及应用程序。
89.在图4所示的计算机设备400中,用户接口403主要用于为用户提供输入的接口,获取用户输入的数据;而处理器401可以用于调用存储器405中存储的应用程序,并具体执行如图2所示的方法,具体过程可参照图2所示,此处不再赘述。
90.本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,所述的存储介质可为磁碟、光盘、只读存储记忆体或随机存储记忆体等。
91.以上所揭露的仅为本技术较佳实施例而已,当然不能以此来限定本技术之权利范围,因此依本技术权利要求所作的等同变化,仍属本技术所涵盖的范围。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1