一种错误亲缘关系数据检测方法和装置制造方法
【专利摘要】本发明公开了一种错误亲缘关系数据检测方法和装置,根据亲缘关系数据类别与错误种类对照表判断可能存在的错误种类,然后按照各错误种类对应的检错规则对亲缘关系数据进行错误检测。本发明要解决单个亲缘关系数据错误检测的问题,为解决上述问题,本发明的目的在于提供一种错误亲缘关系数据检测方法和装置,使单个亲缘关系数据在其所有属性均没有出错且不与其它亲缘关系数据进行比较的情况下也能检测出错误。
【专利说明】一种错误亲缘关系数据检测方法和装置
【技术领域】
[0001]本发明属于计算机信息处理领域,尤其涉及一种错误亲缘关系数据检测方法和装置。
【背景技术】
[0002]数据质量问题是影响数据可用性的一个重要因素,在数据质量问题当中,主要有两类问题,一是数据冲突,二是数据错误。数据冲突和数据错误在很多时候存在交叉,一般来说有很多数据冲突是由于错误的数据引起的,比如两个数据分别表示某人有两个不同亲生父亲,显然其中有一个是错误的,但也不全部如此,有些数据冲突是亲缘关系表示的原因造成的,比如说同类的亲缘关系数据只能选其中一个(一般选最优的),比如一个人有两个妻子,但其中必然有一个是不合法的或者是过去式的(前妻),但两个数据本身并没有错。数据冲突只有在有两个亲缘关系数据进行比较时才有,而数据错误可以在比较时发现错误,也可以在不进行比较时发现错误,这里的数据错误就是指无需对两个亲缘关系数据进行比较仅通过对单个亲缘关系数据本身进行判断就可以发现的错误,以和数据冲突时很多情形的数据错误相区别。
[0003]错误亲缘关系数据的错误种类与亲缘关系类别有关,有的亲缘关系类别的亲缘关系数据有可以判断的数据错误,而有的则没有。比如同属血亲关系种类的亲生父母子女关系和同胞兄弟姐妹关系,亲生父母子女关系中亲生父母肯定比亲生子女大N岁以上(这里的N—般可以定为10到15岁之间,由于现代社会中的某些原因,人类性成熟的年龄越来越早,所以这里用N而不用一个确定的值),而同胞兄弟姐妹关系中互为同胞兄弟姐妹的各个关系人之间可能相差一岁,也可能相差几十岁,其中的错误就比较难以判断(当然要非常较真的话,一般同母兄弟姐妹年龄差距应在10个月之上,之内的也可判断为错误)。血亲关系是自然形成的,即一出生就形成,所以这种自然形成的亲缘关系一般可以通过两个关系人之间的年龄差来检测数据错误,这也是日常生活当中的一个常识。而象收养关系、婚姻关系,这些并不是一出生就有的,而是后天通过某种方式建立后才有的,这些亲缘关系数据的错误判断,除了部分可从两个关系人之间的年龄差来检测外,比如收养关系的建立我国法律对于收养人和被收养人的年龄差有明确规定,许多只能从关系人与建立亲缘关系的时间或整个亲缘关系存续的时间来判断对错,比如婚姻关系,大多数国家的法律对于结婚年龄是有明确限制的,所以形成一个婚姻关系时关系人必须要达到一定的法定年龄,不符合的就可以认定为一个错误数据,但法律没有规定夫妻之间的年龄差异限制,虽然大多数夫妻都年龄差不多,但82岁的杨振宁也可以娶28岁的杨帆,法律没有限制,因此不能从关系人的年龄差距来判断亲缘关系数据的对错。有一种常见的错误就是把关系人的性别弄错,如把父亲母亲的角色搞错了等,由于这种错误一般是人为失误造成的,且由于在存储表示亲缘关系的专门数据库中一般采用身份证号表示关系人,一般不会出现这种错误,出现了也可以通过简单的校验就可以发现,所以这里不考虑;另外,身份证号也可能出错,但这种错误也不是这里要解决的范围,出现了也可以通过简单的校验就可以发现,这里只解决在单个属性没有出错的情况下检测亲缘关系的对错情况。因此要检测单个亲缘关系错误数据,必须根据不同亲缘关系类别分别进行考虑,而目前还没有相关的研究及检测方法和装置。
【发明内容】
[0004]本发明要解决单个亲缘关系数据错误检测的问题,为解决上述问题,本发明的目的在于提供一种错误亲缘关系数据检测方法和装置,使单个亲缘关系数据在其所有属性均没有出错且不与其它亲缘关系数据进行比较的情况下也能检测出错误。本发明可用于对亲缘关系数据库中的数据进行检测,也可用于对新进亲缘关系数据的检测。 [0005]为解决上述技术问题,本发明提出的错误亲缘关系数据检测方法,主要包括以下步骤:
根据亲缘关系数据类别与错误种类对照表判断可能存在的错误种类;
然后按照各错误种类对应的检错规则对亲缘关系数据进行错误检测。
[0006]为解决上述技术问题,本发明提出的错误亲缘关系数据检测装置,具备:
至少一个处理器;及
至少一个存储器,含有计算机程序代码,所述至少一个存储器和计算机程序代码被配置为利用所述至少一个处理器使得所述装置
根据亲缘关系数据类别与错误种类对照表判断可能存在的错误种类;
然后按照各错误种类对应的检错规则对亲缘关系数据进行错误检测。
【专利附图】
【附图说明】
[0007]图1为错误亲缘关系数据检测方法或装置的基本流程。
【具体实施方式】
[0008]下面结合附图,对本发明的实施方式进行详细说明。
[0009]图1示出错误亲缘关系数据检测方法或装置的基本流程:
第一步是根据亲缘关系数据类别与错误种类对照表判断可能存在的错误种类。错误亲缘关系数据的错误种类是多种多样的,为了进行区分并为每一种错误的情形制定适合的检错规则,因此最好建立一个亲缘关系数据类别与错误种类对照表,这样就可以在碰到数据错误时按表索骥确定亲缘关系数据冲突的分类,为进而确定适合的检错规则打下基础。亲缘关系数据类别与错误种类对照表至少包括亲缘关系类别、可能错误种类等属性,其中可能错误种类应根据不同亲缘关系类别的实际情况来合理确定,一般来说能够用同一种检错规则的可能错误属于同一种类,亲生父母子女关系中最主要的错误种类就是年龄差不合常理;亲缘关系类别则是根据所采取亲缘关系表示方法所允许的能够表示的亲缘关系类别中有可能出错的类别,不会出错(包括无法检错)的则表中没有相应的条目,比如亲生父母子女关系、婚姻关系等可以列入亲缘关系数据类别与错误种类对照表,而同胞兄弟姐妹关系则不列入亲缘关系数据类别与错误种类对照表。下表是一个适用于基本亲缘关系的亲缘关系数据冲突分类表:
【权利要求】
1.一种错误亲缘关系数据检测方法,其特征在于包括以下步骤:根据亲缘关系数据类别与错误种类对照表判断可能存在的错误种类;然后按照各错误种类对应的检错规则对亲缘关系数据进行错误检测。
2.一种错误亲缘关系数据检测装置,其特征在于,该装置具备:至少一个处理器;及至少一个存储器,含有计算机程序代码,所述至少一个存储器和计算机程序代码被配置为利用所述至少一个处理器使得所述装置根据亲缘关系数据类别与错误种类对照表判断可能存在的错误种类;然后按照各错误种类对应的检错规则对亲缘关系数据进行错误检测。
【文档编号】G06F17/30GK103617207SQ201310581629
【公开日】2014年3月5日 申请日期:2013年11月20日 优先权日:2013年11月20日
【发明者】倪龙 申请人:宁波保税区攀峒信息科技有限公司