一种基于互联网的数字化分析方法、系统、设备及介质与流程

文档序号:34644267发布日期:2023-06-29 17:37阅读:23来源:国知局
一种基于互联网的数字化分析方法、系统、设备及介质与流程

本发明属于数据分析,具体涉及一种基于互联网的数字化分析方法、系统、设备及介质。


背景技术:

1、在进行企业服务管理的过程中,通常需要深度了解企业的各类信息,并通过数字化分析方法对企业信息进行分析及处理,以便对企业产品营销及企业服务提供数据支撑。现有技术中,由于互联网的发展,各类企业的经营信息通常会发布在互联网上,因而基于互联网进行企业数据数字化分析是很有必要的。但是,在使用现有技术过程中,发明人发现现有技术中至少存在如下问题:

2、现有技术中,通常采用人工在各个网站上检索得到企业信息,然而,由于企业信息在互联网上的数据格式通常不固定,且数据存放位置不一,导致在数字化分析过程中对数据的采集和处理需要耗费大量的时间和运算资源,导致数字化分析的效率有限,难以处理大规模数据和复杂信息。此外,现有技术中,基于企业数据的分析过程中,通常采用人工分析的方式执行,导致信息的处理效率较为低下。


技术实现思路

1、本发明旨在至少在一定程度上解决上述技术问题,本发明提供了一种基于互联网的数字化分析方法、系统、设备及介质。

2、为了实现上述目的,本发明采用以下技术方案:

3、第一方面,本发明提供了一种基于互联网的数字化分析方法,基于预设的网络爬虫工具从互联网中爬取得到指定企业的企业数据;

4、对所述企业数据进行预处理,得到预处理后数据;

5、对所述预处理后数据进行数据挖掘处理,得到目标数据;

6、根据所述目标数据生成企业画像。

7、本发明可增加数据采集和处理的效率。具体地,本发明在实施过程中,先基于预设的网络爬虫工具从互联网中爬取得到指定企业的企业数据,然后对所述企业数据进行预处理,得到预处理后数据,随后对所述预处理后数据进行数据挖掘处理,得到目标数据,最后根据所述目标数据生成企业画像。在此过程中,通过网络爬虫工具从互联网上爬取企业数据,利于提高数据的采集效率,随后基于爬取得到的企业数据生成企业画像,可便于实现对企业用户的精准营销,适用于推广使用。

8、在一个可能的设计中,基于预设的网络爬虫工具从互联网中爬取得到指定企业的企业数据,包括:

9、接收指定企业名称对应的企业数据提取请求,并将所述企业数据提取请求发送至指定网站;

10、判断是否接收到当前指定网站发送的验证请求,如是,则进入下一步;其中,所述验证请求携带有验证内容信息;如否,则直接从当前指定网站上爬取与指定企业名称对应的企业数据;

11、将所述验证内容信息输入预设的机器学习模型中,得到验证结果信息;

12、根据所述验证结果信息对当前指定网站的验证请求进行验证操作,并在验证通过后基于预设的网络爬虫工具从当前指定网站上爬取与指定企业名称对应的指定企业的企业数据。

13、在一个可能的设计中,所述企业数据的来源包括企业官网、政务平台和/或第三方机构平台,对应地,所述企业数据包括来自企业官网的企业内部信息、来自政务平台的与当前企业相关的政务信息和/或来自第三方机构平台的企业信息;其中,来自企业官网的企业内部信息包括企业架构信息、企业业务信息和/或企业核心交易信息,来自第三方机构平台的企业信息包括企业动态交易信息、企业评价信息、企业宣传信息和/或企业资质信息。

14、在一个可能的设计中,对所述企业数据进行预处理,得到预处理后数据,包括:

15、对所述企业数据进行数据清洗处理,得到清洗后数据;

16、对所述清洗后数据进行数据转换处理,得到转换后数据;

17、对所述转换后数据进行规约处理,得到预处理后数据。

18、在一个可能的设计中,对所述预处理后数据进行数据挖掘处理时,采用聚类算法和/或关联规则算法执行。

19、在一个可能的设计中,根据所述目标数据生成企业画像,包括:

20、从所述目标数据中提取企业特征标签;

21、对所述企业特征标签进行分类检测,得到检测后标签数据;

22、对所述检测后标签数据进行关联分析,得到最终标签;

23、根据多个最终标签得到企业画像。

24、在一个可能的设计中,根据所述目标数据生成企业画像后,所述方法还包括:

25、获取所述企业画像中的最终标签;

26、从预设的数据库中得到与当前最终标签对应的参照标签;

27、根据所述参照标签对当前最终标签进行准确性验证,得到验证结果;

28、根据所述验证结果对所述企业画像进行调整,得到最终的企业画像。

29、第二方面,本发明提供了一种基于互联网的数字化分析系统,用于实现如上述任一项所述的基于互联网的数字化分析方法;所述基于互联网的数字化分析系统包括:

30、数据采集模块,用于基于预设的网络爬虫工具从互联网中爬取得到指定企业的企业数据;

31、数据预处理模块,与所述数据采集模块通信连接,用于对所述企业数据进行预处理,得到预处理后数据;

32、数据挖掘模块,与所述数据预处理模块通信连接,用于对所述预处理后数据进行数据挖掘处理,得到目标数据;

33、企业画像生成模块,与所述数据挖掘模块通信连接,用于根据所述目标数据生成企业画像。

34、第三方面,本发明提供了一种电子设备,包括:

35、存储器,用于存储计算机程序指令;以及,

36、处理器,用于执行所述计算机程序指令从而完成如上述任一项所述的基于互联网的数字化分析方法的操作。

37、第四方面,本发明提供了一种计算机可读存储介质,用于存储计算机可读取的计算机程序指令,所述计算机程序指令被配置为运行时执行如上述任一项所述的基于互联网的数字化分析方法的操作。



技术特征:

1.一种基于互联网的数字化分析方法,其特征在于:包括:

2.根据权利要求1所述的一种基于互联网的数字化分析方法,其特征在于:基于预设的网络爬虫工具从互联网中爬取得到指定企业的企业数据,包括:

3.根据权利要求1所述的一种基于互联网的数字化分析方法,其特征在于:所述企业数据的来源包括企业官网、政务平台和/或第三方机构平台,对应地,所述企业数据包括来自企业官网的企业内部信息、来自政务平台的与当前企业相关的政务信息和/或来自第三方机构平台的企业信息;其中,来自企业官网的企业内部信息包括企业架构信息、企业业务信息和/或企业核心交易信息,来自第三方机构平台的企业信息包括企业动态交易信息、企业评价信息、企业宣传信息和/或企业资质信息。

4.根据权利要求1所述的一种基于互联网的数字化分析方法,其特征在于:对所述企业数据进行预处理,得到预处理后数据,包括:

5.根据权利要求1所述的一种基于互联网的数字化分析方法,其特征在于:对所述预处理后数据进行数据挖掘处理时,采用聚类算法和/或关联规则算法执行。

6.根据权利要求1所述的一种基于互联网的数字化分析方法,其特征在于:根据所述目标数据生成企业画像,包括:

7.根据权利要求1所述的一种基于互联网的数字化分析方法,其特征在于:根据所述目标数据生成企业画像后,所述方法还包括:

8.一种基于互联网的数字化分析系统,其特征在于:用于实现如权利要求1至7中任一项所述的基于互联网的数字化分析方法;所述基于互联网的数字化分析系统包括:

9.一种电子设备,其特征在于:包括:

10.一种计算机可读存储介质,用于存储计算机可读取的计算机程序指令,其特征在于:所述计算机程序指令被配置为运行时执行如权利要求1至7中任一项所述的基于互联网的数字化分析方法的操作。


技术总结
本发明属于数据分析技术领域,其目的在于提供一种基于互联网的数字化分析方法、系统、设备及介质。本发明先基于预设的网络爬虫工具从互联网中爬取得到指定企业的企业数据,然后对所述企业数据进行预处理,得到预处理后数据,随后对所述预处理后数据进行数据挖掘处理,得到目标数据,最后根据所述目标数据生成企业画像。在此过程中,通过网络爬虫工具从互联网上爬取企业数据,利于提高数据的采集效率,随后基于爬取得到的企业数据生成企业画像,可便于实现对企业用户的精准营销,适用于推广使用。

技术研发人员:赵旭,田蜜,董春辉
受保护的技术使用者:北京德钧科技服务有限公司
技术研发日:
技术公布日:2024/1/13
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1