本发明属于电梯检测领域,特别是一种电梯检验项目筛选系统及筛选方法。
背景技术:
1、电梯在使用过程中需要进行年检,15年以内的电梯,分别在第1、4、7、9、11、13和15年进行一次定期检验;超过15年的电梯,每年进行一次定期检验。需要对电梯各个细节进行详细检验,检验过程繁琐,费时费力,而且检验过程没有重点,由于检验繁琐,很容易在检验重点项目时有所懈怠,使检验结果不准确。
技术实现思路
1、本发明的目的在于:提出一种电梯检验项目筛选系统及筛选方法,通过数据外界模块和检测项目筛选模块的结合,筛选出重点推荐检测的项目,解决现有检测过程繁琐、没有重点的问题。
2、为实现上述目的,本发明的电梯检验项目筛选系统及筛选方法,具体技术方案如下:一种电梯检验项目筛选系统,包括数据挖掘模块,用于获取处理电梯数据信息,并将获取的电梯数据信息传输给检测项目筛选模块;
3、检测项目筛选模块,与电梯检验管理信息系统通信连接,根据接收到的数据挖掘模块的电梯数据信息进行分类筛选,并将筛选后的推荐待检项目数据输出显示。
4、优选地,所述数据挖掘模块包括数据获取模块,用于获取电梯检测检验数据和电梯事故案例数据;
5、数据预处理模块,用于对数据获取模块获取的数据进行合并重复项目、剔除必选项目和删除无意义项目的处理;
6、数据存储模块,用于存储数据信息。
7、优选地,所述合并重复项目用于读取表格数据转换成编程处理的数据类型,然后通过指定库函数合并了统计表格中重复的统计项目,使每个检验项目仅在数据结构中出现一次;
8、剔除必选项目处理用于提取不包含必选项目编号的项目作为后续的处理对象;筛选不合格项目数据用于去除无效数据;
9、剔除无意义数据处理用于清洗完数据,对主要数据进行筛选,并提取合计数量超过所有合计数据的指定分位数的项目,剔除相对数据特别少的无意义项目。
10、优选地,所述检测项目筛选模块包括与电梯检验管理信息系统通信连接的输入模块,用于将电梯信息输入至电梯检验管理信息系统。
11、优选地,所述电梯数据信息包括电梯类别、生产厂家、生产日期、注册日期、注册代码、型号规格、额定载重量、额定速度、项目序号、项目内容和项目结论。
12、优选地,所述筛选不合格项目数据为筛选项目结论为“不合格”的数据。
13、本发明的第二个发明目的在于:提供一种电梯检验项目筛选方法,采用上述电梯检验项目筛选系统进行推荐待检测项目的筛选。
14、优选地,还包括分词处理,电梯检验检测历史信息文本分解成为单独的字词进行存储,其具体实施步骤为提取数据预处理结果,将制造单位、生产日期和主要不合格项目的信息与出现的次数结合,形成一个长文本,并进行特征词提取,形成单独的词集。同时标准检验检测项目则直接对每个项目内容进行分词处理;二者的关键词汇总形成一个语料库,以此为基础表征数据源信息文本成为一个二元向量文件,如式(1)所示。
15、{t,n}={(t1,n1),(t2,n2)…(tj,nj)} (1)
16、式中:t代表检验检测项目语料库词项序号;n代表词项出现次数;j代表词项数;词频计算,计算更合理的权重来代表数据源中每个词项的向量值。采用tf-idf方法计算文字权重,tf-idf值的计算如公式(2)(3)所示。
17、
18、tfidf(t,d)=tf(t,d)×idf(t) (3)
19、式中:tfidf(t,d)代表数据源文件d中,检验检测项目词项t的词频;tf(t,d)代表文本d中词项t出现的次数;idf(t)代表词项t的逆向文件频率;id代表检验检测项目文本数;df(d,t)代表包含词项t的文本数;
20、词频计算完成后得到数据源的具体特征表达矩阵,如公式(4)(5)所示。
21、
22、
23、式中:x为标准库数据源词频特征表达,i代表检验检测项目文本数,j代表检验检测项目词项数,xij表示标准库第i条检验检测项目文本中第j个词项的词频计算值;y则为检验检测数据处理后所得数据源词频特征表达,yj表示目标数据源文本中第j个词项的词频计算值;
24、本模型的构建采用余弦相似度计算数据文本间的相似性,即将两个数据源的特征向量化后,通过余弦公式计算两者之间的相似度,如公式(6)(7)所示,通过对相似度数值的排序,结合索引来给出最终标准项目推荐,
25、d=[dk]k=1,2,...,i (6)
26、
27、式中:d代表相似度数值矩阵;dk代表检验检测项目数据源文件与标准库数据源的相似度数值。k代表检验检测项目文本数i的集合,xkl表示标准库第k条检验项目文本中第1个词项的词频计算值,yl表示目标数据源文本中第1个词项的词频计算值。
28、本发明带来的有益效果为:通过数据挖掘模块与检测项目筛选模块相结合,根据电梯数据信息进行处理分析,筛选出推荐检测的项目,无需对电梯的每一个信息都进行复检,显示重点检测项目,提高检测效率。
1.一种电梯检验项目筛选系统,其特征在于:包括数据挖掘模块,用于获取处理电梯数据信息,并将获取的电梯数据信息传输给检测项目筛选模块;
2.如权利要求1所述的电梯检验项目筛选系统,其特征在于:所述数据挖掘模块包括数据获取模块,用于获取电梯检测检验数据和电梯事故案例数据;
3.如权利要求2所述的电梯检验项目筛选系统,其特征在于:所述合并重复项目用于读取表格数据转换成编程处理的数据类型,然后通过指定库函数合并了统计表格中重复的统计项目,使每个检验项目仅在数据结构中出现一次;
4.如权利要求1所述的电梯检验项目筛选系统,其特征在于:所述检测项目筛选模块包括与电梯检验管理信息系统通信连接的输入模块,用于将电梯信息输入至电梯检验管理信息系统。
5.如权利要求3所述的电梯检验项目筛选系统,其特征在于:所述电梯数据信息包括电梯类别、生产厂家、生产日期、注册日期、注册代码、型号规格、额定载重量、额定速度、项目序号、项目内容和项目结论。
6.如权利要求5所述的电梯检验项目筛选系统,其特征在于:所述筛选不合格项目数据为筛选项目结论为“不合格”的数据。
7.一种电梯检验项目筛选方法,其特征在于:采用如权利要求1-6任一所示的电梯检验项目筛选系统进行推荐待检测项目的筛选。
8.如权利要求7所述的电梯检验项目筛选方法,其特征在于,还包括如下步骤:分词处理,电梯检验检测历史信息文本分解成为单独的字词进行存储,其具体实施步骤为提取数据预处理结果,将制造单位、生产日期和主要不合格项目的信息与出现的次数结合,形成一个长文本,并进行特征词提取,形成单独的词集。同时标准检验检测项目则直接对每个项目内容进行分词处理;