专利名称:一种基于迭代函数的遗传信息二维可视化加密方法
技术领域:
本发明属于信息安全和生物特征识别技术领域,特别涉及一种基于迭代函数的遗 传信息二维可视化加密方法。
背景技术:
每个人都有两套染色体,是重要的遗传信息,同时也是一种包含有丰富信息的生 物特征。不同的人遗传信息存在差别,这些差别会在DNA分子上多个不同的位置体现。遗 传信息可以利用PCR技术结合凝胶电泳、质谱技术、基因芯片等技术检测,其结果是不同类 型的实验数据。这些数据经过处理之后,对于STR位点,通常用短重复片段(STR)的重复次 数表示;对于SNP位点,根据其等位基因的基因型,可用11,10或00来代表纯合-常见、杂 合、纯合_罕见三种类型。遗传信息的检测对于进行个体身份识别、疾病诊断、个体化医疗 等方面有重要的价值。这种遗传信息虽然准确,但不便于人工分析和比较,特别是涉及较多位点的时候。 当用作生物特征密钥时,也存在简单、容易被猜中的特点。当把这些信息表示成为具有唯一 性的网格状态和二维图像,就不仅能够直观的看出遗传信息之间的不同,还能够作为一种 特殊的“指纹”,用于信息的加密、验证等领域。
发明内容
发明的目的在于提出一个遗传信息的加密和可视化方法,直观显示出个体遗传信 息之间的差异。当遗传信息有差别时,可以在图中清晰的看出差别,而不必显示具体的哪个 位点发生了变化。这一可视化结果隐含有全部的遗传信息,能够被可视化的方式显示,但并 不能从该结果中获得原始的遗传信息,是一种单向的数据变换。图中所包含的数据可以作 为生物指纹,用于信息的加密。本发明的技术方案是这样实现的本发明是个体遗传信息被数字化,经过迭代函数的多次迭代,以二维图像的方式 来表示,具体包括以下步骤1)生物个体的DNA遗传学标记位点被映射到二维平面中,平面用水平和垂直的线 分割成大小相同的正方形有边界网格,每个格子对应有多种不同的状态,状态数目大于等 于2,用不同颜色的格子表示不同的状态,遗传信息由格子的起始状态表示;2)格子对应的状态变化由迭代函数获得,迭代函数采用二维元胞自动机模型实 现,利用迭代函数系统对每个格子的状态进行设定次数的迭代,所述的迭代是采用不同的 迭代规则组合使用,依次获得二维平面中每个格子的下一个状态,实现遗传信息二维可视 化加密。所述的格子起始状态,由生物样本,通过位点检测分子生物学实验获得,并数字化 得到。格子起始状态根据个体遗传信息确定,具体方法分为2类,分别是根据STR短串重复序列位点(a)和SNP单核苷酸多态性位点(b),其状态初始化方法不同对于(a)类信息,网格状态初始化方法为对于N个STR位点,初始化横向为2N的 二维网格,横轴根据位点的序号排列,每个位点有两个等位基因,在横轴上占有两个位置, 每个位置表示一个等位基因,当该等位基因对应的STR重复次数为k,设定纵向第k个格子 的状态为1,对每个等位基因都应用此方法,从而形成一个起始状态;对于(b)类信息,网格状态初始化方法为;横轴按照SNP的序号进行排列,每个 SNP位点对应两个格子,当个体对应的SNP为常见的纯合子时,设定对应两个格子的状态为 (1、1),当个体对应的SNP为罕见纯合子时,设定对应的两个格子的状态为(0、0),当个体的 信息是杂合子时,设定对应的两个格子的状态为(0、1),形成相应的排列格式,当多个位点 时候,它们依次横向排列。本发明获得的遗传信息表示方法具有全息性。由于所有的位点在初始都占据了平 面网格的不同位置,并参与了迭代过程,因此最终的结果图像会包含所有这些位点的遗传 信息。由于遗传信息经过多次迭代,已经从结果图像中难以直接看出位点的等位基因形式, 图像中的遗传信息处于加密状态,具有保护个人隐私的效果。遗传信息被本发明转换为平 面图形,元胞自动机的迭代过程产生的结果非常美观、直观,可用于遗传信息检测结果的呈 现。结果图象对应的每个元胞的状态信息是由生物特征的到得,可以作为信息加密领 域的生物特征,用于信息传输和保密工作。
图1是本发明对STR信息初始化示意图;图2是本发明对SNP位点初始化示意图;图3是本发明对STR信息的可视化结果示意图;图4是本发明对31个SNP位点可视化结果示意图。下面结合附图对本发明的内容作进一步详细说明。
具体实施例方式例1 STR位点的可视化个体a的遗传信息在17个位点分别为位点名称:D16S539;D7S820 ;D13S317 ;CSFlPO ;TPOX ;THOl ;F13A01 ;FES ;vffFA31 ; HPRTB ;F13B ;FABP ;LPL ;CYAR04 ;CD4 ;GPP3A09 ;D8S1179 个体 A 在这些位点 STR 的重复次数 为11,11 ;11,10 ;12,9 ;12,9 ;11,8 ;9,8 ;6,3 ;11,11 ;17,16 ;13,13 ;10,10 ;10,9 ;12,10 ; 11,7;7,7 ;6,6 ;11,10 ;参照1所示,当这些位点按照本发明叙述的方法进行网格状态初始化后,可视化 结果为图1。随后使用规则1迭代100次,规则2迭代100次,得到最终图像,包含536*536 个方格。如图3。这个图案包含有处于隐藏状态的个体的全部遗传信息。例2 个体甲的SNP遗传信息如下位点名称
rs7121845 rs6592199rs6592202 rs4370960rs 1943699 rs2000815rsl943725 rs7111775rs2155413 rsl073987 rs7108021在每个位点,个体的SNP的形式(0表示低频SNP,1表示常见SNP)个体甲1,0,0,0,1,0,0,0,1,0,1,1,1,0,1,0,1,0,0,0,1,0,1,0,1,0,1,1,1,0,1,1,0,0, 1,1,0,0,1,0,1,1,1,1,0,0,1,0,1,0,1,1,0,0,0,0,1,1,1,1,0,0按照1所示的方法,对该数据进行网格初始化,设定网格的状态,结果为图2。依次 使用2、3描述的迭代方式1、迭代方式2各100次,得到可视化后结果图4。本图像共包含 460*410个方格。具体步骤1遗传信息的转换。对于STR位点信息(a类),遗传信息到二维网格初始图像的映射方法为由于每 个STR位点对应于两个不同重复次数的等位基因,对于N个位点,把它们依次排列在二维网 格中的2N列,每列对应一个等位基因。当对应的STR重复次数为K时,则位于该列第K行 的网格对应于这个位点,记为1,对应于平面网格中黑色方块。见图1。对于SNP信息(b类),遗传信息到二维网格初始图像的映射方法为对于N个SNP 位点,按照SNP的序号依次排列在二维网格中一行的2N格子。对于每个SNP位点,当个体 对应的SNP为常见型纯合子时,对应的两个格子标记为11,当个体对应罕见型纯合子时,对 应的两个格子标记为00,当个体的信息是杂合子时,标记为01,形成图2的排列格式。图中 的标记为1的方格用黑色表示。2迭代规则1 根据元胞自动机模型,对于平面中的每一个小格子,把它看做是上、下、左、右4个 格子的中心,中心格子下一时刻的颜色根据它自己的颜色和周围4个格子的颜色确定。具体迭代方法1 元胞以及上、右、下、左4个元胞的状态定义为X,Xu, XE, Xd, Xy共 5个变量。5个变量的不同状态确定中心元胞下一时刻的状态。这个迭代过程是从上到下, 从左到右的顺序进行。直到整个网格都迭代一遍,形成新的图形。这个过程迭代多次,每次 都改变一个元胞的状态。
Xu
X Xd
Xt 元胞的命名方法
5
各个元胞当前状态和对应的中间元胞下一时刻状态转换规律
权利要求
1.一种基于迭代函数的遗传信息二维可视化加密方法,其特征在于,是个体遗传信息 被数字化,经过迭代函数的多次迭代,以二维图像的方式来表示,具体包括以下步骤1)生物个体的DNA遗传学标记位点被映射到二维平面中,平面用水平和垂直的线分割 成大小相同的正方形有边界网格,每个格子对应有多种不同的状态,状态数目大于等于2, 用不同颜色的格子表示不同的状态,遗传信息由格子的起始状态表示;2)格子对应的状态变化由迭代函数获得,迭代函数采用二维元胞自动机模型实现,利 用迭代函数系统对每个格子的状态进行设定次数的迭代,所述的迭代是采用不同的迭代规 则组合使用,依次获得二维平面中每个格子的下一个状态,实现遗传信息二维可视化加密。
2.根据权利要求1所述的一种基于迭代函数的遗传信息二维可视化加密方法,其特征 在于,所述的格子起始状态,由生物样本,通过位点检测分子生物学实验获得,并数字化得 到。
3.根据权利要求1所述的一种基于迭代函数的遗传信息二维可视化加密方法,其特征 在于,格子起始状态根据个体遗传信息确定,具体方法分为2类,分别是根据STR短串重复 序列位点(a)和SNP单核苷酸多态性位点(b),其状态初始化方法不同对于(a)类信息,网格状态初始化方法为对于N个STR位点,初始化横向为2N的二维 网格,横轴根据位点的序号排列,每个位点有两个等位基因,在横轴上占有两个位置,每个 位置表示一个等位基因,当该等位基因对应的STR重复次数为k,设定纵向第k个格子的状 态为1,对每个等位基因都应用此方法,从而形成一个起始状态;对于(b)类信息,网格状态初始化方法为;横轴按照SNP的序号进行排列,每个SNP位 点对应两个格子,当个体对应的SNP为常见的纯合子时,设定对应两个格子的状态为(1、 1),当个体对应的SNP为罕见纯合子时,设定对应的两个格子的状态为(0、0),当个体的信 息是杂合子时,设定对应的两个格子的状态为(0、1),形成相应的排列格式,当多个位点时 候,它们依次横向排列。
全文摘要
本发明涉及一种基于迭代函数的遗传信息二维可视化加密方法,个体的遗传信息包括传统的STR位点信息和为数众多的SNP信息。通过映射,这些遗传信息可以用二维平面网格中不同坐标、不同颜色的小方格来表示。本发明提出了利用迭代函数的方法,对表示在平面网格中的遗传信息进行迭代,在迭代过程中实现原始遗传信息的隐藏,并得到有一定规律的图案,形成被加密、看得见的个体“遗传指纹”图案。该图案可方便的进行差异比较,可用于进行个体生物特征识别、生物特征密钥、遗传信息可视化等方面。
文档编号G06N3/12GK102122371SQ201010589209
公开日2011年7月13日 申请日期2010年12月15日 优先权日2010年12月15日
发明者吴晓明, 李慧丽, 杜建强, 王旭 申请人:西安交通大学