本发明涉及数据库搭建,具体为基于产业与行业的专业技术数据库的搭建系统。
背景技术:
1、数据库系统是由数据库及其管理软件组成的系统,数据库系统是为适应数据处理的需要而发展起来的一种较为理想的数据处理系统,也是一个为实际可运行的存储、维护和应用系统提供数据的软件系统,是存储介质、处理对象和管理系统的集合体。
2、但现有技术中,现有的数据库的建立过程中,仅针对某一类数据对象,但在将各类数据汇总至平台上时,由于行业的不同,对象特征存在差异,数据的提取标准不尽相同,导致数据提取的过程中会出现数据独特属性的丢失,造成数据缺乏其实际的应用价值,无法实现不同领域的数据交互和业务对接。
3、所以我们提出了基于产业与行业的专业技术数据库的搭建系统,以便于解决上述中提出的问题。
技术实现思路
1、本发明的目的在于提供基于产业与行业的专业技术数据库的搭建系统,以解决上述背景技术提出的现有的专业技术数据库的建立过程中,仅针对某一类数据对象,但在将各类数据汇总至平台上时,由于行业的不同,对象特征存在差异,数据的提取标准不尽相同,导致数据提取的过程中会出现数据独特属性的丢失,造成数据缺乏其实际的应用价值,无法实现不同领域的数据交互和业务对接的问题。
2、为实现上述目的,本发明提供如下技术方案:基于产业与行业的专业技术数据库的搭建系统,包括数据库平台和应用模块;
3、所述数据库平台用于收入各行业的数据,对数据进行清洗处理后,通过关键词提取模型对数据进行关键词提取,识别提取后的关键词,对其进行分类,搭建多个独立的数据库,整合为数据库平台;
4、所述数据库平台包括数据输入模块、数据处理模块、关键词提取模块和识别分类模块;
5、所述数据输入模块用于通过多种数据输入方法对数据进行收集;
6、所述数据处理模块用于对输入的数据进行清洗处理,保证数据的准确性、完整性和可操作性;
7、所述关键词提取模块用于获取不同行业和领域数据的提取标准,生成关键词提取成长模型,通过对处理后的数据进行关键词提取,提高对不同行业数据关键词提取的准确性,防止关键词提取特征的丢失;
8、所述识别分类模块用于对提取的关键词进行识别,将所提取关键词的数据分类,可分为公共数据、专业数据和成果数据,其中的专业数据可细分至各个专业领域;
9、所述应用模块用于用户验证身份登录平台进行成果上传和需求下载,通过用户的积攒经验值进行升级,可获取不同等级的数据库查看权限。
10、优选的,所述数据输入模块的数据输入方法包括从公共平台获取公开数据、企业上传所涉及领域的公开数据、向人群发放问卷获取相关信息和用户自主上传获得成果。
11、优选的,所述数据处理模块在进行数据处理时,通过表格式转换、字段格式转换、重复值去重、缺失值替换、错误值删除和异常值更正等多种方法对数据进行清洗和补缺,保证数据的完整性同时减少数据的重复性,减少占用空间。
12、优选的,所述关键词提取模块关键词提取成长模型的建立,参考文本所涉及行业的提取标准和逻辑,计算某个词在文档中出现的次数,加入归一化处理,同时对文档中的单词进行降维,将单词映射到隐藏的语义范围,挖掘隐藏在文本中的主体信息,生成关键词提取成长模型,对关键词进行提取。
13、优选的,所述数据库平台还包括数据库搭建模块;
14、所述数据库搭建模块用于对分类的数据搭建独立的数据库,整合为数据库平台,包括公共数据库、专业基础知识数据库和成果数据库。
15、优选的,所述应用模块包括身份验证模块、成果上传模块和等级划分模块;
16、所述身份验证模块用于对登录人的身份进行验证,输入登录账号和密码验证,在异地登录时,需要输入账号绑定手机号的验证码验证,确保账号的安全;
17、所述成果上传模块用于将用户和企业的研究成果上传至平台,进行不同行业的信息交互;
18、所述等级划分模块用于对使用者的等级进行划分,使用者可通过上传成果和账号活跃度获取升级经验,通过账号升级获取不同数据库的权限,账号等级分为0-50级,公共数据可供所有人进行调用查阅,专业数据库可供20-40级的用户查看,成果数据库可供40级以上的用户查看。
19、优选的,所述应用模块还包括需求调用模块、账号标记模块和业务推荐模块;
20、所述需求调用模块用于用户在数据库中检索需要的数据,根据检索关键词制定贴合度表格向用户进行结果展示,在结果展示时显示提取的关键词,在用户点击进入后再显示完整文档,减少占用内存;
21、所述账号标记模块用于根据用户上传和下载的数据对用户进行画像标记,对用户进行标签,分为企业类、专家类和普通用户类;
22、所述业务推荐模块用于根据用户的画像标签向用户个性化推荐需求数据。
23、与现有技术相比,本发明的有益效果是:
24、本发明通过收入各行业的数据,对数据进行清洗处理,保证数据的完整性同时减少数据的重复性,减少占用空间,参考需提取数据所涉及行业的提取标准和逻辑,计算某个词在文档中出现的次数,加入归一化处理,同时对文档中的单词进行降维,将单词映射到隐藏的语义范围,挖掘隐藏在文本中的主体信息,生成关键词提取成长模型,对关键词进行提取,提高对不同行业数据关键词提取的准确性,防止关键词提取特征的丢失,将提取关键词的数据分类,依靠分类数据搭建公共数据库、专业基础知识数据库和成果数据库,用户可验证身份登录平台进行成果上传和需求下载,进行账号升级,获取不同数据库的查看权限,根据用户上传和下载的数据类型对用户进行标签画像,实现用户的个性化推荐。
1.基于产业与行业的专业技术数据库的搭建系统,其特征在于:包括数据库平台(1)和应用模块(2);
2.根据权利要求1所述的基于产业与行业的专业技术数据库的搭建系统,其特征在于:所述数据输入模块(11)的数据输入方法包括从公共平台获取公开数据、企业上传所涉及领域的公开数据、向人群发放问卷获取相关信息和用户自主上传获得成果。
3.根据权利要求1所述的基于产业与行业的专业技术数据库的搭建系统,其特征在于:所述数据处理模块(12)在进行数据处理时,通过表格式转换、字段格式转换、重复值去重、缺失值替换、错误值删除和异常值更正等多种方法对数据进行清洗和补缺。
4.根据权利要求1所述的基于产业与行业的专业技术数据库的搭建系统,其特征在于:所述关键词提取模块(13)关键词提取成长模型的建立,参考文本所涉及行业的提取标准和逻辑,计算某个词在文档中出现的次数,加入归一化处理,同时对文档中的单词进行降维,将单词映射到隐藏的语义范围,挖掘隐藏在文本中的主体信息,生成关键词提取成长模型,对关键词进行提取。
5.根据权利要求1所述的基于产业与行业的专业技术数据库的搭建系统,其特征在于:所述数据库平台(1)还包括数据库搭建模块(15);
6.根据权利要求1所述的基于产业与行业的专业技术数据库的搭建系统,其特征在于:所述应用模块(2)包括身份验证模块(21)、成果上传模块(22)和等级划分模块(23);
7.根据权利要求1所述的基于产业与行业的专业技术数据库的搭建系统,其特征在于:所述应用模块(2)还包括需求调用模块(24)、账号标记模块(25)和业务推荐模块(26);