多性状育种值的测定方法、装置、设备及存储介质与流程

文档序号:33775984发布日期:2023-04-18 23:03阅读:68来源:国知局
多性状育种值的测定方法、装置、设备及存储介质与流程

本申请涉及生物育种,尤其涉及一种多性状育种值的测定方法、装置、设备及存储介质。


背景技术:

1、目前,育种值测定算法主要包括blup(best linear unbiased prediction)算法和bayesian算法,blup算法和bayesian算法均是基于无穷小位点模型(infinitesimalmodel)的假设。其中,算法采用最小二乘法对线性模型进行回归,得到育种值的最佳线性无偏估计值;bayesian算法采用贝叶斯参数估计方法进行育种值估计。

2、然而,blup算法和bayesian算法在针对多性状基因组的育种值测定时,都会出现严重的性能瓶颈。具体地,在多性状基因组育种值计算中,内存消耗与性状数量n之间的关系正比于n2,即每增加1个性状,则内存消耗量增加((n+1)2-n2)/n2倍的。而当前国际育种的性状计算规模通常达到30+,则其内存消耗量比单性状的内存消耗量至少多900倍,导致育种值测定成本增大。


技术实现思路

1、本申请提供了一种多性状育种值的测定方法、装置、设备及存储介质,以解决当前育种值测定算法针对多性状基因组存在测定性能瓶颈的技术问题。

2、为了解决上述技术问题,第一方面,本申请提供了一种多性状育种值的测定方法,包括:

3、获取多性状育种参数,所述多性状育种参数包括多种形状对应的表型文件参数、系谱文件参数和基因组文件参数;

4、利用克罗内克定理,根据blup算法的预设等价式模型,对所述多性状育种参数进行分解,以提取每种性状对应的克罗内克分量;

5、对每个所述克罗内克分量进行单性状测定,得到每个所述克罗内克分量对应的第一育种值;

6、根据多个所述第一育种值,计算所述多性状育种参数对应的第二育种值。

7、在一些实现方式中,所述利用克罗内克定理,根据blup算法的预设等价式模型,对所述多性状育种参数进行分解,以提取每种性状对应的克罗内克分量,包括:

8、根据所述多性状育种参数,建立第一设计矩阵和第二设计矩阵,以及残差效应矩阵与单位矩阵之间的关系矩阵;

9、利用所述克罗内克定理,根据所述第一设计矩阵、所述第二设计矩阵和残差效应,对所述预设等价式模型进行矩阵转换,得到每种性状对应的所述克罗内克分量。

10、在一些实现方式中,所述根据所述多性状育种参数,建立第一设计矩阵和第二设计矩阵,以及残差效应与单位矩阵之间的关系矩阵,包括:

11、根据所述多性状育种参数,建立所述第一设计矩阵、所述第二设计矩阵和残差效应矩阵;

12、基于目标行数与性状数之间的比值,确定所述单位矩阵,所述目标行数为所述第一设计矩阵或所述第二设计矩阵的行数;

13、对所述残差效应矩阵与所述单位矩阵进行克罗内克乘积,得到所述关系矩阵。

14、在一些实现方式中,所述预设等价式模型为:

15、

16、其中,x为第一设计矩阵,x′为第一设计矩阵的转置矩阵,r为残差效应矩阵,i为单位矩阵,z为第二设计矩阵,z′为第二设计矩阵的转置矩阵,g0为加性效应的多性状方差组分,g为加性效应的方差,为固定效应的最佳无偏线性估计值,为育种值的最佳无偏线性估计值,y为表型值,表示克罗内克乘积。

17、在一些实现方式中,所述对每个所述克罗内克分量进行单性状测定,得到每个所述克罗内克分量对应的第一育种值,包括:

18、分配每个所述克罗内克分量对应的计算节点;

19、对多个计算节点进行并行执行,所述计算节点用于对所述克罗内克分量进行单性状测定,得到所述克罗内克分量对应的第一育种值。

20、在一些实现方式中,所述根据多个所述第一育种值,计算所述多性状育种参数对应的第二育种值,包括:

21、对于具有相同变量的多个所述第一育种值进行均值运算,得到所述多性状育种参数中每种性状对应的第二育种值。

22、第二方面,本申请还提供一种多性状育种值的测定装置,包括:

23、获取模块,用于获取多性状育种参数,所述多性状育种参数包括多种形状对应的表型文件参数、系谱文件参数和基因组文件参数;

24、分解模块,用于利用克罗内克定理,根据blup算法的预设等价式模型,对所述多性状育种参数进行分解,以提取每种性状对应的克罗内克分量;

25、测定模块,用于对所述克罗内克分量进行单性状测定,得到每个所述克罗内克分量对应的第一育种值;

26、计算模块,用于根据多个所述第一育种值,计算所述多性状育种参数对应的第二育种值。

27、在一些实现方式中,所述分解模块,包括:

28、建立单元,用于根据所述多性状育种参数,建立第一设计矩阵和第二设计矩阵,以及残差效应矩阵与单位矩阵之间的关系矩阵;

29、转换单元,用于利用所述克罗内克定理,根据所述第一设计矩阵、所述第二设计矩阵和残差效应,对所述预设等价式模型进行矩阵转换,得到每种性状对应的所述克罗内克分量。

30、第三方面,本申请还提供一种计算机设备,包括处理器和存储器,所述存储器用于存储计算机程序,所述计算机程序被所述处理器执行时实现如第一方面所述的多性状育种值的测定方法。

31、第四方面,本申请还提供一种计算机可读存储介质,其存储有计算机程序,所述计算机程序被处理器执行时实现如第一方面所述的多性状育种值的测定方法。

32、与现有技术相比,本申请至少具备以下有益效果:

33、通过获取多性状育种参数,所述多性状育种参数包括多种形状对应的表型文件参数、系谱文件参数和基因组文件参数,并利用克罗内克定理,根据blup算法的预设等价式模型,对所述多性状育种参数进行分解,以提取每种性状对应的克罗内克分量,从而将多性状测定过程分解为多个单性状测定过程,进而减少多性状测定过程对内存的消耗;再对每个所述克罗内克分量进行单性状测定,得到每个所述克罗内克分量对应的第一育种值,以及根据多个所述第一育种值,计算所述多性状育种参数对应的第二育种值,以通过并行处理方式提升育种值测定速度以及满足单机内存需求,有效提升多性状育种值测定的内存性能。



技术特征:

1.一种多性状育种值的测定方法,其特征在于,包括:

2.如权利要求1所述的多性状育种值的测定方法,其特征在于,所述利用克罗内克定理,根据blup算法的预设等价式模型,对所述多性状育种参数进行分解,以提取每种性状对应的克罗内克分量,包括:

3.如权利要求2所述的多性状育种值的测定方法,其特征在于,所述根据所述多性状育种参数,建立第一设计矩阵和第二设计矩阵,以及残差效应与单位矩阵之间的关系矩阵,包括:

4.如权利要求1至3任一项所述的多性状育种值的测定方法,其特征在于,所述预设等价式模型为:

5.如权利要求1所述的多性状育种值的测定方法,其特征在于,所述对每个所述克罗内克分量进行单性状测定,得到每个所述克罗内克分量对应的第一育种值,包括:

6.如权利要求1所述的多性状育种值的测定方法,其特征在于,所述根据多个所述第一育种值,计算所述多性状育种参数对应的第二育种值,包括:

7.一种多性状育种值的测定装置,其特征在于,包括:

8.如权利要求1所述的多性状育种值的测定方法,其特征在于,所述分解模块,包括:

9.一种计算机设备,其特征在于,包括处理器和存储器,所述存储器用于存储计算机程序,所述计算机程序被所述处理器执行时实现如权利要求1至6任一项所述的多性状育种值的测定方法。

10.一种计算机可读存储介质,其特征在于,其存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1至6任一项所述的多性状育种值的测定方法。


技术总结
本申请公开了一种多性状育种值的测定方法、装置、设备及存储介质,通过获取多性状育种参数,所述多性状育种参数包括多种形状对应的表型文件参数、系谱文件参数和基因组文件参数,并利用克罗内克定理,根据BLUP算法的预设等价式模型,对所述多性状育种参数进行分解,以提取每种性状对应的克罗内克分量,从而将多性状测定过程分解为多个单性状测定过程,进而减少多性状测定过程对内存的消耗;再对每个所述克罗内克分量进行单性状测定,得到每个所述克罗内克分量对应的第一育种值,以及根据多个所述第一育种值,计算所述多性状育种参数对应的第二育种值。实现提升育种值测定速度以及满足单机内存需求,有效提升多性状育种值测定的内存性能。

技术研发人员:张兴,丁偌楠,杨雨婷,牛安然,荆晓燕,张锡飞,杨昌雨,张丽萍,马康,梁志刚,龚华忠,闫之春
受保护的技术使用者:四川新希望六和猪育种科技有限公司
技术研发日:
技术公布日:2024/1/13
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1