一种前列腺肿瘤的类型预测方法和系统的制作方法
【技术领域】
[0001] 本申请涉及基因技术领域,更具体地说,涉及一种前列腺肿瘤的类型预测方法和 系统。
【背景技术】
[0002] 前列腺肿瘤包括前列腺上皮来源或间叶来源的肿瘤,大部分为恶性肿瘤,包括前 列腺肿瘤、前列腺肉瘤等。前列腺肿瘤患者主要是老年男性。但随着20世纪90年代中期 大量开展血清前列腺特异抗原(PSA)的检测以来,越来越早的前列腺肿瘤被发现,此时往 往不伴有任何症状。前列腺肉瘤好发于年轻人,发病率不高,以排尿困难为首发症状,此病 恶性程度极高,疾病发展极快,预后极差。
[0003] 随着人工智能在医院领域的应用,越来越多的机器学习方法被用于进行智能诊 断。目前在对健康人群进行前列腺肿瘤筛选时,一般采用DNA微阵列技术来获取基因表达 数据,通过对基因表达数据的分析计算能够得到作为对前列腺肿瘤进行类型预测的参考因 素,由于得到的基因表达数据的数据量非常庞大,因此如何从庞大的基因表达数据中得到 类型预测结果是较为困难的问题。当然,一般的医务人员根据该类型预测结果还是无法最 终确定受检者是否罹患肿瘤,但是通过该结果的倾向性指导可以促使医务人员通过病理诊 断方法对受检者做进一步诊断,以确定是否患有前列腺肿瘤。
【发明内容】
[0004] 有鉴于此,本申请提供一种前列腺肿瘤的类型预测方法和系统,用于对受检者的 基因标定数据进行处理,并得到类型预测结果。
[0005] 为了实现上述目的,现提出的方案如下:
[0006] -种前列腺肿瘤的类型预测方法,包括步骤:
[0007] 获取包含受检者的基因表达数据的待测样本;
[0008] 对所述待测样本进行归一化,构造归一化后的新待测样本;
[0009] 利用预设的投影变换矩阵将所述新待测样本映射到低维特征空间中,得到映射后 的投影测试样本;
[0010] 从所述投影变换矩阵的训练样本集中找到与所述投影测试样本距离最近的样 本;
[0011] 将所述样本的类型赋予所述投影测试样本,完成类型预测。
[0012] 可选的,所述投影变换矩阵通过下面步骤获取:
[0013] 获取基因表达训练数据;
[0014] 从所述基因表达训练数据中随机抽取部分特征数据,得到训练数据集;
[0015] 将所述训练数据集映射到相对低维的低维特征空间;
[0016] 将所述低维度特征空间中的训练数据集构建为类内相似矩阵和类间相似矩阵;
[0017] 对与所述类内相似矩阵的关联的类内局部散度矩阵和与所述类间相似矩阵相关 联的类间局部散度矩阵进行广义特征分解,得到所述投影变换矩阵。
[0018] 可选的,所述得到训练数据集过程中需要对所述部分特征数据进行归一化处理, 从而得到所述训练数据集。
[0019] 可选的,所述类内相似矩阵和所述类间相似矩阵通过预先定义的余弦去中心相似 性函数获得。
[0020] -种前列腺肿瘤的类型预测系统,包括:
[0021] 待测样本获取模块,用于获取包含受检者的基因表达数据的待测样本;
[0022] 归一化模块,用于对所述待测样本进行归一化,构造归一化后的新待测样本;
[0023] 学习模块,用于利用预设的投影变换矩阵将所述新待测样本映射到低维特征空间 中,得到映射后的投影测试样本;
[0024] 查找模块,用于从所述投影变换矩阵的训练样本集中找到与所述投影测试样本距 离最近的样本;
[0025] 预测模块,用于将所述样本的类型赋予所述投影测试样本,完成类型预测。
[0026] 可选的,所述待测样本获取模块包括DNA微阵列芯片。
[0027] 可选的,所述学习模块包括:
[0028] 训练数据获取单元,用于获取基因表达训练数据;
[0029] 随机抽取单元,用于从所述基因表达训练数据中随机抽取部分特征数据,得到训 练数据集;
[0030] 映射单元,用于将所述训练数据集映射到相对低维的低维特征空间;
[0031] 相似矩阵构建单元,用于将所述低维度特征空间中的训练数据集构建为类内相似 矩阵和类间相似矩阵;
[0032] 投影变换矩阵构建单元,用于对与所述类内相似矩阵的关联的类内局部散度矩阵 和与所述类间相似矩阵相关联的类间局部散度矩阵进行广义特征分解,得到所述投影变换 矩阵。
[0033] 可选的,所述随机抽取单元包括:
[0034] 归一化子单元,用于通过对所述部分特征数据进行归一化处理得到所述训练数据 集。
[0035] 可选的,所述相似矩阵构建单元还包括:
[0036] 函数构建子单元,用于通过构建所述余弦去中心相似性函数获得所述类内相似矩 阵和所述类间相似矩阵。
[0037] 从上述的技术方案可以看出,本申请公开了一种前列腺肿瘤的类型预测方法和系 统,该方法和系统首先获取包含受检者的基因表达数据的待测样本;对待测样本进行归一 化,构造归一化后的新待测样本;利用预设的投影变换矩阵将新待测样本映射到低维特征 空间中,得到映射后的投影测试样本;从投影变换矩阵的训练样本集中找到与投影测试样 本距离最近的样本;将样本的类型赋予投影测试样本,从而完成对前列腺肿瘤的类型预测 并得到类型预测结果。
【附图说明】
[0038] 为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现 有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本 申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以 根据这些附图获得其他的附图。
[0039] 图1为本申请实施例提供的一种前列腺肿瘤的类型预测方法的流程图;
[0040] 图2为本申请提供的预测率随维数的变化曲线图;
[0041] 图3为本申请提供的另一预测率随维数的变化曲线图;
[0042] 图4为本申请提供的投影变换矩阵的获取步骤的流程图;
[0043] 图5为本申请另一实施例提供的一种前列腺肿瘤的类型预测系统的结构图。
【具体实施方式】
[0044] 下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完 整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于 本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他 实施例,都属于本申请保护的范围。
[0045] 实施例一
[0046] 图1为本申请实施例提供的一种前列腺肿瘤的类型预测方法的流程图。
[0047] 如图1所示,本实施例提供的前列腺肿瘤的类型预测方法包括如下步骤:
[0048] SlOl :获取包含受检者的基因表达数据的待测样本。
[0049] 将该待测样本记录为X e Rd。
[0050] S102 :根据待测样本得到新待测样本。
[0051] 根据保留的特征位置集I和训练样本集的归一化方式,利用待测样本X e妒构造 一个新待测样本X' eRd。
[0052] S103 :利用投影变换矩阵得到投影测试样本。
[0053] 利用预设的投影变换矩阵P把新待测样本映射到低维特征空间中,得到投影后的 测试样本z = PTX' e R%为记录方便,将其记为投影测试样本。
[0054]