本申请涉及空间转录组,特别是涉及一种空间转录组的处理方法、装置、计算机设备和存储介质。
背景技术:
1、空间转录组技术的核心价值在于研究基因在真实物理空间的表达模式。而要在全转录组中研究和定义真实物理空间的表达模式,关键在于空间坐标系的选取和构建。
2、传统技术中,通过在空间转录组数据上人工描绘一条折线,进而获得折线附近区域的、沿该折线方向的一维参考系。显然,这种方法严重受限于手绘,比较局限。
技术实现思路
1、基于此,有必要针对上述技术问题,提供一种能够提高适应性的空间转录组数据的处理方法、装置、计算机设备、计算机可读存储介质和计算机程序产品。
2、第一方面,本申请提供了一种空间转录组的处理方法。所述方法包括:
3、确定生物组织区域的边界;所述生物组织区域是指用于检测出空间转录组数据的生物组织所在的空间区域;
4、从所述边界中确定出多组对边;
5、针对每组对边,以势能值为坐标值,构建每组对边对应的势能场坐标系;
6、基于各组对边分别对应的势能场坐标系对所述空间转录组数据中的空间位置进行重建,得到重建后的空间转录组数据。
7、在其中一个实施例中,所述确定生物组织区域的边界,包括:
8、从空间转录组数据中确定出包括多个样本点的点集;
9、针对所述点集的凸包进行轮廓检测,得到所述多个样本点对应的生物组织区域的边界。
10、在其中一个实施例中,每组对边包括第一边界线和第二边界线;所述针对每组对边,以势能值为坐标值,构建每组对边对应的势能场坐标系,包括:
11、针对每组对边中的第一边界线和第二边界线赋予势能值,以得到每组对边对应的初始势能场坐标系;
12、对所述初始势能场坐标系进行多次迭代;
13、在迭代完成的情况下,确定每组对边对应的势能场坐标系。
14、在其中一个实施例中,所述针对每组对边中的第一边界线和第二边界线赋予势能值,以得到每组对边对应的初始势能场坐标系,包括:
15、对每组对边中的第一边界线和第二边界线分别进行拟合,得到所述第一边界线对应的第一线段和所述第二边界线对应的第二线段;
16、对所述第一线段和所述第二线段分别赋予连续的势能值,以得到每组对边对应的初始势能场坐标系。
17、在其中一个实施例中,所述对所述初始势能场坐标系进行多次迭代,包括:
18、将所述初始势能场坐标系作为首次势能场坐标系,在每次迭代中,基于本次势能场坐标系中每一势能值对应的参考势能值,对所述本次势能场坐标系中每一势能值进行迭代,得到下一次势能场坐标系。
19、在其中一个实施例中,所述基于本次势能场坐标系中每一势能值对应的参考势能值,对所述本次势能场坐标系中每一势能值进行迭代,得到下一次势能场坐标系包括:
20、针对本次势能场坐标系中的每一势能值,确定所述势能值对应的多个参考势能值,并对所述多个参考势能值进行平均处理,得到参考均值;
21、根据所述参考均值对所述势能值进行迭代,以得到下一次势能场坐标系。
22、在其中一个实施例中,所述对所述本次势能场坐标系中每一势能值进行迭代,得到下一次势能场坐标系,包括:
23、对所述本次势能场坐标系中每一势能值进行迭代,得到迭代后的各势能值;所述迭代后的各势能值包括迭代后的边界势能值;所述边界势能值表征的空间位置处于所述边界上;
24、将所述迭代后的边界势能值进行重置,以得到下一次势能场坐标系;
25、其中,每次势能场坐标系中的边界势能值与所述初始势能场坐标系中的边界势能值一致。
26、在其中一个实施例中,所述在迭代完成的情况下,确定每组对边对应的势能场坐标系之前,还包括:
27、在每次迭代后的势能场坐标系中势能值与上次迭代后的势能场坐标系中势能值之间的差异符合迭代停止条件的情况下,确定迭代完成。
28、在其中一个实施例中,各组对边分别对应的势能场坐标系包括连续的势能值;所述基于各组对边分别对应的势能场坐标系对所述空间转录组数据中的空间位置进行重建,得到重建后的空间转录组数据,包括:
29、对所述各组对边分别对应的势能场坐标系中的连续的势能值进行离散化,得到离散化后的势能场坐标系;
30、将所述空间转录组数据中的空间位置映射至所述离散化后的势能场坐标系中以进行位置重建,得到重建后的空间转录组数据。
31、在其中一个实施例中,所述方法还包括:
32、对所述重建后的空间转录组数据进行模型拟合,得到模型拟合结果;
33、基于所述模型拟合结果对空间转录组数据的表达模式进行识别,得到识别结果。
34、第二方面,本申请还提供了一种空间转录组的处理装置。所述装置包括:
35、第一确定模块,用于确定生物组织区域的边界;所述生物组织区域是指用于检测出空间转录组数据的生物组织所在的空间区域;
36、第二确定模块,用于从所述边界中确定出多组对边;
37、构建模块,用于针对每组对边,以势能值为坐标值,构建每组对边对应的势能场坐标系;
38、重建模块,用于基于各组对边分别对应的势能场坐标系对所述空间转录组数据中的空间位置进行重建,得到重建后的空间转录组数据。
39、第三方面,本申请还提供了一种计算机设备。所述计算机设备包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现上述的方法中的步骤。
40、第四方面,本申请还提供了一种计算机可读存储介质。所述计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述的方法中的步骤。
41、第五方面,本申请还提供了一种计算机程序产品。所述计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现上述的方法中的步骤。
42、上述空间转录组的处理方法、装置、计算机设备、存储介质和计算机程序产品,确定生物组织区域的边界;生物组织区域是指用于检测出空间转录组数据的生物组织所在的空间区域;从边界中确定出多组对边;针对每组对边,以势能值为坐标值,构建每组对边对应的势能场坐标系;基于各组对边分别对应的势能场坐标系对空间转录组数据中的空间位置进行重建,得到重建后的空间转录组数据,通过针对边界中的每组对边构建势能场坐标系,实现了不规则生物组织区域上进行非欧坐标系的构建,显著提高了坐标系构建的自由度,能够满足对大部分不规则生物学结构内部的基因表达模式进行定义和量化分析,提高了适应性。
1.一种空间转录组的处理方法,其特征在于,所述方法包括:
2.根据权利要求1所述的方法,其特征在于,所述确定生物组织区域的边界,包括:
3.根据权利要求1所述的方法,其特征在于,每组对边包括第一边界线和第二边界线;所述针对每组对边,以势能值为坐标值,构建每组对边对应的势能场坐标系,包括:
4.根据权利要求3所述的方法,其特征在于,所述针对每组对边中的第一边界线和第二边界线赋予势能值,以得到每组对边对应的初始势能场坐标系,包括:
5.根据权利要求3所述的方法,其特征在于,所述对所述初始势能场坐标系进行多次迭代,包括:
6.根据权利要求5所述的方法,其特征在于,所述基于本次势能场坐标系中每一势能值对应的参考势能值,对所述本次势能场坐标系中每一势能值进行迭代,得到下一次势能场坐标系包括:
7.根据权利要求5所述的方法,其特征在于,所述对所述本次势能场坐标系中每一势能值进行迭代,得到下一次势能场坐标系,包括:
8.根据权利要求3所述的方法,其特征在于,所述在迭代完成的情况下,确定每组对边对应的势能场坐标系之前,还包括:
9.根据权利要求1所述的方法,其特征在于,各组对边分别对应的势能场坐标系包括连续的势能值;所述基于各组对边分别对应的势能场坐标系对所述空间转录组数据中的空间位置进行重建,得到重建后的空间转录组数据,包括:
10.根据权利要求1至9任一项所述的方法,其特征在于,所述方法还包括:
11.一种空间转录组的处理装置,其特征在于,所述装置包括:
12.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至10中任一项所述的方法的步骤。
13.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至10中任一项所述的方法的步骤。