本发明涉及自然语言处理,尤其涉及一种企业产品类别确定方法、装置、设备和介质。
背景技术:
1、随着产业转型、升级即新生产业兴起的作用下,将持续高速孵化更多企业,且企业综合性发展、跨行业经营将成为常态,企业所经营的产品也越来越多,所以随着企业数量的不断增长,企业不断开发新产品,快速准确确定成千上万的企业所经营的产品具体有哪些十分重要。
2、目前要获取企业产品类别,只有通人工方法去国家企业信用信息公示系统上去查找,或者到公司的官网上去进行查找和分析。如人为的去进行查询、分析各企业经营产品类别,必将耗费大量的人力、财力和时间资源。且新企业、新产品的不断增加,旧产品的不断消失,每隔固定的时间就需要重新进行统计,这种长期的持续性工作大大增加了公司的运营成本。
3、因此,如何快速、准确的得到大量企业经营的产品类别,成为了急需解决的问题。
技术实现思路
1、本发明提供了一种企业产品类别确定方法、装置、设备和介质,以解决因为企业产品类别多而导致的无法快速、准确的确定不同企业产品类别的问题。
2、根据本发明的一方面,提供了一种企业产品类别确定方法,所述方法包括:
3、获取目标对象不同网页的目标网页数据;
4、从所述目标网页数据中提取多个目标关键词,并确定网页与目标关键词的第一关联关系;其中,所述第一关联关系是通过网页与关键词的相关性进行描述;
5、确定所述目标关键词的产品类别,依据所述第一关联关系确定网页与产品类别的第二关联关系;其中,所述第二关联关系通过所述产品类别对应的所有关键词的相关性进行描述;
6、根据所述第二关联关系确定目标对象产品类别的权值,进而确定目标对象各产品类别的比重。
7、根据本发明的另一方面,提供了一种企业产品类别确定装置,所述装置包括:
8、数据确定模块,用于获取目标对象不同网页的目标网页数据;
9、第一关联关系确定模块,用于从所述目标网页数据中提取多个目标关键词,并确定网页与目标关键词的第一关联关系;其中,所述第一关联关系是通过网页与目标关键词的相关性进行描述;
10、第二关联关系确定模块,用于确定所述目标关键词的产品类别,依据所述第一关联关系确定网页与产品类别的第二关联关系;其中,所述第二关联关系通过所述产品类别对应的所有关键词的相关性进行描述;
11、比重确定模块,用于根据所述第二关联关系确定目标对象产品类别的权值,进而确定目标对象各产品类别的比重。
12、根据本发明的另一方面,提供了一种电子设备,所述电子设备包括:
13、至少一个处理器;以及
14、与所述至少一个处理器通信连接的存储器;其中,
15、所述存储器存储有可被所述至少一个处理器执行的计算机程序,所述计算机程序被所述至少一个处理器执行,以使所述至少一个处理器能够执行本发明任一实施例所述的企业产品类别确定方法。
16、根据本发明的另一方面,提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机指令,所述计算机指令用于使处理器执行时实现本发明任一实施例所述的企业产品类别确定方法。
17、本发明实施例的技术方案,获取目标对象不同网页的目标网页数据;从目标网页数据提取多个目标关键词,并确定网页与目标关键词的第一关联关系;其中,第一关联关系是通过网页与目标关键词的相关性进行描述;确定目标关键词的产品类别,依据第一关联关系确定网页与产品类别的第二关联关系;其中,第二关联关系通过所述产品类别对应的所有目标关键词的相关性进行描述;根据第二关联关系确定目标对象产品类别的权值,进而确定目标对象各产品类别的比重。本申请技术方案,通过建立目标对象不同网页与目标关键词的相关性,进一步的确定目标对象不同网页与产品类别的相关性,再依据网页与产品类别的相关性准确确定目标对象各产品类别的比重,解决了因为企业产品类别多而导致的无法快速、准确的确定不同企业产品类别的问题,实现了企业产品类别的快速准确的确定。
18、应当理解,本部分所描述的内容并非旨在标识本发明的实施例的关键或重要特征,也不用于限制本发明的范围。本发明的其它特征将通过以下的说明书而变得容易理解。
1.一种企业产品类别确定方法,其特征在于,包括:
2.根据权利要求1所述的方法,其特征在于,获取目标对象不同网页的目标网页数据之前,所述方法还包括:
3.根据权利要求1所述的方法,其特征在于,获取目标对象不同网页的目标网页数据,包括:
4.根据权利要求3所述的方法,其特征在于,从所述目标网页数据中提取多个目标关键词,包括:
5.根据权利要求4所述的方法,其特征在于,确定网页与目标关键词的第一关联关系,包括:
6.根据权利要求2所述方法,其特征在于,所述目标关键词的产品类别可依据关联信息表确定;
7.根据权利要求1所述的方法,其特征在于,根据所述第二关联关系确定目标对象产品类别的权值,包括:
8.一种企业产品类别确定装置,其特征在于,包括:
9.一种电子设备,其特征在于,所述电子设备包括:
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机指令,所述计算机指令用于使处理器执行时实现权利要求1-7中任一项所述的企业产品类别提取方法。