一种基于属性划分的序信息并行约简方法与流程

文档序号:13805060阅读:139来源:国知局
本发明涉及粗糙集属性简约领域,尤其涉及一种基于属性划分的序信息并行约简方法。
背景技术
:粗糙集理论作为一种数据分析处理理论,在1982年由波兰科学家z.pawlak提出,是继概率论,模糊集,证据理论之后的又一个处理不确定性的理论工具。它能有效地对数据进行分析和推理,从不精确,不一致和不完整信息中发现隐含的知识,揭示潜在的规律。粗糙集近年来越来越受到重视,是当前国际上人工智能理论及其应用领域中的研究热点之一,其有效性已在许多科学与工程领域的成功应用中得到证实,由于其在处理不确定、不精确和不完备信息中的独特优势从而引起智能信息处理工作者的关注,并被成功应用到机器学习与知识发现、数据挖掘、模式识别、过程控制、临床医疗诊断、决策分析与支持等领域。在粗糙集理论中,序信息系统的属性约简是一个重要的问题,目前已取得一些初步的研究成果,但仍缺乏有效的计算方法,主要表现为求解约简耗时过长,严重影响了约简的可靠性和有效性。技术实现要素:本发明的目的在于提供一种基于属性划分的序信息并行约简方法,本发明对决策系统基于对属性的密度进行划分,进而以此为基础求得决策系统的超约简和约简,从而缩短了解约简耗时时间,提高了约简的可靠性和有效性,为了实现上述目的,本发明采用以下技术效果:根据本发发明的一个方面,提供了一种基于属性划分的序信息并行约简方法,包括以下步骤:步骤一:对输入初始化样本集合s=(u,a,v,f)建立决策系统sai=(u,ai,vai,fai),并根据决策系统sai进行密度划分以此形成约简生成属性集;步骤二:对初始化样本集合形成的约简属性集和决策系统构建不同属性集的优势类差量,以获取最大决策系统的超约简;步骤三:逐一检验超约简的属性,按照超约简的属性大小排列,并逐步向约简属性集插入优势类差量;步骤四:对超约简的属性进行冗余性检验,输出最终约简的最优解。优选的,根据决策系统sai进行密度划分按如下步骤进行:假设在决策系统sai中存在一个任意属性分组使得满足:对于任意的ai,满足||ai|-|aj||≤1,且i≤j,对于给定的属性集合a,按照其属性原始排列顺序依次获取出其对应的属性个数作为相应划分块的属性即可得到最佳密度划分。优选的,所述步骤二对初始化样本集合形成的约简属性集和决策系统构建不同属性集的优势类差量,其中构建不同属性集的优势类差量按如下步骤进行:对于决策系统sai=(u,ai,vai,fai),满足a=c∪d,且c表示属性集合a的条件属性集,d表示属性集合a的决策属性集,则条件属性集c相对于属性集b的优势类差量dci(c,b)满足:其中|·|表示集合的基数。本发明采用了上述技术方案,本发明具有以下技术效果:本发明对决策系统基于对属性的密度进行划分,进而以此为基础求得决策系统的超约简和约简,可以充分利用多台计算机进行并行计算,在设备充足的情况下可以极大提高算法的效率,尤其针对大数据集时更为有效.发明在约简的求取过程中相比于一般利用辨识矩阵的算法而言,具有更低的时间和空间开销.本发明遵从序关系特性,即自反性、传递性及序对称性,可避免语义上的矛盾,本发明提出的决策系统优势关系的模型的近似精度及分类精度更优,从而快速找出决策系统的约简。具体实施方式为使本发明的目的、技术方案及优点更加清楚明白,以下举出优选实施例,对本发明进一步详细说明。然而,需要说明的是,说明书中列出的许多细节仅仅是为了使读者对本发明的一个或多个方面有一个透彻的理解,即便没有这些特定的细节也可以实现本发明的这些方面。根据本发明的一种基于属性划分的序信息并行约简方法,包括以下步骤:步骤一:对输入初始化样本集合s=(u,a,v,f)建立决策系统sai=(u,ai,vai,fai),并根据决策系统sai进行密度划分以此形成约简生成属性集;其中u={x1,x2,…,xn}为对象的非空集合,a={a1,a2,…,am}为属性集,其中va是属性a的值域,且va具有序关系,f为u与a间值域的映射函数,有f:u×a→v,对于任意的而u满足的二元关系其中为对象基于属性集在决策系统sai中的优势关系;根据决策系统sai进行密度划分按如下步骤进行:假设在决策系统sai中存在一个任意属性分组使得满足:对于任意的ai,满足||ai|-|aj||≤1,且i≤j,对于给定的属性集合a,其中,i,j=1,2,…,t;按照其属性原始排列顺序依次获取出其对应的属性个数作为相应划分块的属性即可得到最佳密度划分;步骤二:对初始化样本集合形成的约简属性集和决策系统构建不同属性集的优势类差量,以获取决策系统的超约简;本发明中,对初始化样本集合形成的约简属性集和决策系统构建不同属性集的优势类差量,其中构建不同属性集的优势类差量按如下步骤进行:对于决策系统sai=(u,ai,vai,fai),满足a=c∪d,且且a∈c,c表示属性集合a的条件属性集,d表示属性集合a的决策属性集,则条件属性集c相对于属性集b的优势类差量dci(c,b)满足:其中|·|表示集合的基数。当时,即有则有从而寻找出决策系统的约简red(ai),以获取决策系统的超约简rad(a),其中约简red(ai)满足:从而有决策系统的并集即为策系统的超约简,则满足:其中,∧表示合取运算,∨表示析取运算,表示表示对象x,y的区别函数,表示决策属性集中各决策系统的优势矩阵;步骤三:逐一检验超约简的属性,按照超约简的属性大小排列,并逐步向约简属性集插入优势类差量;按照属性原有的排列顺序依次取出其对应的属性个数作为相应划分块的属性,能够使得各划分块达到最大限度的均匀程度,使得在并行执行过程中,各块的执行时间相互接近,避免极端个别时间较长而导致整体效率低下;一般地,若a={a},则属性a相对于属性集b的重要性为sig(a,b)=dci(b∪{a},b),此时,若sig(a,b)≥0,则称属性a相对于属性集b是重要的,否则称属性a相对于属性集b是冗余的,向属性集b中依次插入重要性最大的优势类差量,从而可以快速地寻找出约简。步骤四:对超约简red(a)的属性进行冗余性检验,输出最终约简的最优解;以red(a)为决策系统sai的约简red(ai)上限,逐步向属性集b中插入red(a)-b中的属性,直至属性集b满足决策系统sai的约简要求,则有red(ai)=b;对red(ai)中的属性进行冗余性检验,从而输出超约简red(a)。为说明本发明如何通过上述方法实现约简的执行过程的例子,为使本领域技术人员能够更加清楚理解本发明的技术方案,本发明从构建的决策系统中进行密度划分,然后得出决策系统的超约简,从而在决策系统上进行约简,大大减少了计算量,从而解决了约简耗时过长,提高了约简的可靠性和有效性。以下给出初始化样本集合s=(u,a,v,f),其中u={x1,x2,…,x6},a={a1,a2,…,a8},v,f如表1所示。表1:u与a间值域的映射函数u\aa1a2a3a4a5a6a7a8x101112301x222212122x300101101x411212300x512122321x601010301对于给定所划分的密度t=2时,根据决策系统sai的属性集中各优势关系构造优势矩阵,可得,a={4,4},其中a1={a1,a2,a3,a4},a2={a5,a6,a7,a8},sa1=(u,a1,va1,fa1)及sa2=(u,a2,va2,fa2)分别如表2和表3所示:则根据可计算出约简为:red(a)={a1,a2,a3,a4,a5,a6,a7,a8};则矩阵ra1和矩阵ra2分别满足:矩阵中的第二行元素代表即[x2]≤a1,在属性b={a1,a2,a3}即其它同理.当时,然后依次从a1和a2逐一去掉属性,依次求各属性在子系统中的重要性sig(a,a1)和sig(a,a2),可得出最大优势差量,从而可以快速地寻找出约简red(a)={a1,a3}。因此根据所给定划分的密度t=2时,近似地计算出约简过程所消耗的时间,随着划分密度的增加,算法时间将显著降低,有更低的时间和空间开销,属性集约简方法约简的速度加快,能有效克服大计算量问题。以上所述仅是本发明的优选实施方式,应当指出,对于本
技术领域
的普通技术人员来说,在不脱离本发明原理的前提下,还可以作出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。当前第1页12
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1