本发明涉及数据挖掘技术领域,具体涉及一种新颖的数据挖掘方法。
背景技术:
当今社会已经进入信息高速传播的时代,这为人们带来方便的同时,也出现了越来越多的问题,例如,如何对挖掘收集到的数据进行分类、筛选,目前网络上通过搜索引擎搜索出来的信息基本被广告、垃圾信息、蹭热点信息所充斥,给人们的信息收集带来了诸多误导。
技术实现要素:
针对背景技术中指出的问题,本发明提出一种新颖的数据挖掘方法,其可以通过设置筛选规则来尽量过滤掉无关信息。
本发明的技术方案是这样实现的:
一种新颖的数据挖掘方法,通过智能收集的方式进行数据挖掘,并对挖掘到的数据进行筛查和存储,设置筛查规则库,智能收集包括设置网络探针,自动发现收集信息,筛查按照筛查规则库制定的规则来对收集的信息进行过滤筛查,存储对过滤筛查后的信息进行存储;
所述的筛查规则库包括过滤模块一、过滤模块二、过滤模块三、过滤模块四、过滤模块五、可编辑空模块,过滤模块一、过滤模块二、过滤模块三、过滤模块四、过滤模块五均包含有若干数据特征,若所收集信息中包含筛查规则库中的数据特征则被过滤掉,若所收集信息中没有发现筛查规则库中的数据特征则进行存储;
可编辑空模块供用户进行编辑形成新的过滤模块;
还包括分别与过滤模块一、过滤模块二、过滤模块三、过滤模块四、过滤模块五、可编辑空模块对应的用户编辑模块一、用户编辑模块二、用户编辑模块三、用户编辑模块四、用户编辑模块五、用户编辑模块六,用户编辑模块一、用户编辑模块二、用户编辑模块三、用户编辑模块四、用户编辑模块五、用户编辑模块六均可供用户自主写入数据特征并被存储在其中;
还包括后台管理模块,后台管理模块可对用户编辑模块一、用户编辑模块二、用户编辑模块三、用户编辑模块四、用户编辑模块五、用户编辑模块六中写入的数据特征进行核查,并作出操作是否写入对应的过滤模块中。
本发明还进一步设置为,所述的过滤模块一为广告链接过滤模块,所述的过滤模块二为涉黄信息过滤模块,所述的过滤模块三为木马病毒过滤模块,所述的过滤模块四电商销售链接过滤模块,所述的过滤模块五医病广告链接过滤模块。
本发明还进一步设置为,所述的后台管理模块由人工进行操作,后台管理模块可对筛查规则库进行写入和删除操作。
采用了上述技术方案,本发明的有益效果为:
本发明所提供的新颖的数据挖掘方法,其通过设置筛查规则库来对收集的信息进行过滤处理,以得到用户想要的信息,且筛查规则库对用户进行开放,用户可向过滤模块中写入新的过滤数据特征,使得筛查规则库更加完善和强大。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本发明数据挖掘方法的流程图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
如下参考图1对本发明进行说明:
一种新颖的数据挖掘方法,通过智能收集的方式进行数据挖掘,并对挖掘到的数据进行筛查和存储,设置筛查规则库,智能收集包括设置网络探针,自动发现收集信息,筛查按照筛查规则库制定的规则来对收集的信息进行过滤筛查,存储对过滤筛查后的信息进行存储。
所述的筛查规则库包括过滤模块一、过滤模块二、过滤模块三、过滤模块四、过滤模块五、可编辑空模块,过滤模块一、过滤模块二、过滤模块三、过滤模块四、过滤模块五均包含有若干数据特征,若所收集信息中包含筛查规则库中的数据特征则被过滤掉,若所收集信息中没有发现筛查规则库中的数据特征则进行存储。
可编辑空模块供用户进行编辑形成新的过滤模块。
还包括分别与过滤模块一、过滤模块二、过滤模块三、过滤模块四、过滤模块五、可编辑空模块对应的用户编辑模块一、用户编辑模块二、用户编辑模块三、用户编辑模块四、用户编辑模块五、用户编辑模块六,用户编辑模块一、用户编辑模块二、用户编辑模块三、用户编辑模块四、用户编辑模块五、用户编辑模块六均可供用户自主写入数据特征并被存储在其中。
还包括后台管理模块,后台管理模块可对用户编辑模块一、用户编辑模块二、用户编辑模块三、用户编辑模块四、用户编辑模块五、用户编辑模块六中写入的数据特征进行核查,并作出操作是否写入对应的过滤模块中。
其中,所述的过滤模块一为广告链接过滤模块,所述的过滤模块二为涉黄信息过滤模块,所述的过滤模块三为木马病毒过滤模块,所述的过滤模块四电商销售链接过滤模块,所述的过滤模块五医病广告链接过滤模块。
其中,所述的后台管理模块由人工进行操作,后台管理模块可对筛查规则库进行写入和删除操作。
采用了上述技术方案,本发明的有益效果为:
本发明所提供的新颖的数据挖掘方法,其通过设置筛查规则库来对收集的信息进行过滤处理,以得到用户想要的信息,且筛查规则库对用户进行开放,用户可向过滤模块中写入新的过滤数据特征,使得筛查规则库更加完善和强大。
以上所述的仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
1.一种新颖的数据挖掘方法,其特征在于:通过智能收集的方式进行数据挖掘,并对挖掘到的数据进行筛查和存储,设置筛查规则库,智能收集包括设置网络探针,自动发现收集信息,筛查按照筛查规则库制定的规则来对收集的信息进行过滤筛查,存储对过滤筛查后的信息进行存储;
所述的筛查规则库包括过滤模块一、过滤模块二、过滤模块三、过滤模块四、过滤模块五、可编辑空模块,过滤模块一、过滤模块二、过滤模块三、过滤模块四、过滤模块五均包含有若干数据特征,若所收集信息中包含筛查规则库中的数据特征则被过滤掉,若所收集信息中没有发现筛查规则库中的数据特征则进行存储;
可编辑空模块供用户进行编辑形成新的过滤模块;
还包括分别与过滤模块一、过滤模块二、过滤模块三、过滤模块四、过滤模块五、可编辑空模块对应的用户编辑模块一、用户编辑模块二、用户编辑模块三、用户编辑模块四、用户编辑模块五、用户编辑模块六,用户编辑模块一、用户编辑模块二、用户编辑模块三、用户编辑模块四、用户编辑模块五、用户编辑模块六均可供用户自主写入数据特征并被存储在其中;
还包括后台管理模块,后台管理模块可对用户编辑模块一、用户编辑模块二、用户编辑模块三、用户编辑模块四、用户编辑模块五、用户编辑模块六中写入的数据特征进行核查,并作出操作是否写入对应的过滤模块中。
2.根据权利要求1所述的一种新颖的数据挖掘方法,其特征在于:所述的过滤模块一为广告链接过滤模块,所述的过滤模块二为涉黄信息过滤模块,所述的过滤模块三为木马病毒过滤模块,所述的过滤模块四电商销售链接过滤模块,所述的过滤模块五医病广告链接过滤模块。
3.根据权利要求1所述的一种新颖的数据挖掘方法,其特征在于:所述的后台管理模块由人工进行操作,后台管理模块可对筛查规则库进行写入和删除操作。