本发明涉及医学技术,特别是涉及一种基于拉曼光谱的乳腺癌和癌旁分类系统及知识库构建方法的技术。
背景技术:
1、影响保乳手术局部治疗疗效的最重要因素之一是病灶完全切除,即手术切缘阴性。目前国内通常将术中冰冻与术后石蜡病理学综合评估切缘组织有无癌细胞累及作为评判切缘状态的标准。但是术中冰冻病理等待周期长,并且只能获得有限的组织病理信息。在手术过程中,临床医生需要确保病灶完整切除,同时控制乳腺组织的切除量,以保持乳房的美观。然而手术操作往往都是靠经验积累,从而导致不少乳腺癌患者(即使是未接受过新辅助治疗的患者)因术后石蜡病理提示切缘癌累及而需要行二次补充手术。在荷兰开展的一项针对乳腺癌保乳手术的乳腺组织切除量和手术切缘的全国性病理学研究结果发现,在初次接受保乳手术的患者中,16.4%的患者切缘存在肿瘤累及。而对于接受过新辅助治疗的患者,相比较于未接受过新辅助治疗的患者,在保乳手术中还需要额外确定残留病变的范围和肿瘤治疗前的位置,尤其是对新辅助治疗敏感性较高的患者,甚至会出现肿瘤明显临床退缩,因此新辅助治疗后能否对保乳手术标本切缘进行准确快速的判断是保乳术成功与否的关键步骤之一。由此可见,保乳手术尤其是新辅助治疗后的保乳手术,迫切需要一种快速、简便、准确的新型术中切缘检测方法,以期提高切缘阴性率、降低二次手术率。
2、目前鉴别诊断新辅助治疗后癌和癌旁组织最常用的方法是对活检样本进行病理组织学分析。但是病理学分析主要是形态学分析,对病理科医生经验的依赖度高,可能会存在误诊;另外操作步骤繁琐,活检到报告的周期时间长。
技术实现思路
1、针对上述现有技术中存在的缺陷,本发明所要解决的技术问题是提供一种能辅助医生快速、精准的给待检测乳腺组织样本进行病理分类标记的基于拉曼光谱的乳腺癌和癌旁分类系统及知识库构建方法。
2、为了解决上述技术问题,本发明所提供的一种基于拉曼光谱的乳腺癌和癌旁分类系统,其特征在于:包括共聚焦拉曼光谱仪、数据采集模块、病理分类知识库模块、病理分类模块;
3、所述共聚焦拉曼光谱仪用于输出待检测乳腺组织样本的拉曼光谱检测数据;
4、所述数据采集模块用于采集共聚焦拉曼光谱仪输出的待检测乳腺组织样本的拉曼光谱检测数据,并用收集的数据构建待检测乳腺组织样本光谱曲线后发送给病理分类模块;
5、所述病理分类知识库模块中存储有乳腺癌和癌旁组织的拉曼光谱曲线特征峰数据,所述乳腺癌和癌旁组织的拉曼光谱曲线特征峰包括如下五个特征峰中的任意一个或多个,该五个特征峰分别为:rna相关特征峰,腺嘌呤中c-n振动相关特征峰,dna相关特征峰,核酸相关特征峰,苯丙氨酸c-c骨骼振动相关特征峰;
6、其中,rna相关特征峰的拉曼位移值为673cm-1~679cm-1,腺嘌呤中c-n振动相关特征峰的拉曼位移值为716cm-1~722cm-1,dna相关特征峰的拉曼位移值为748cm-1~754cm-1,核酸相关特征峰的拉曼位移值为778cm-1~784cm-1,苯丙氨酸c-c骨骼振动相关特征峰的拉曼位移值为999cm-1~1005cm-1;
7、所述病理分类模块用于将待检测乳腺组织样本光谱曲线与病理分类知识库模块中的乳腺癌和癌旁组织的拉曼光谱曲线特征峰数据进行匹配,并根据匹配结果对待检测乳腺组织样本进行病理分类标记。
8、进一步的,所述病理分类模块将待检测乳腺组织样本光谱曲线与病理分类知识库模块中的乳腺癌和癌旁组织的拉曼光谱曲线特征峰数据进行匹配时;
9、如果在待检测乳腺组织样本光谱曲线中,查找到与病理分类知识库模块中的乳腺癌和癌旁组织的拉曼光谱曲线特征峰数据相匹配的特征峰,则用病理分类知识库模块中的匹配特征峰的病理分类标签,对待检测乳腺组织样本进行病理分类标记;
10、如果在待检测乳腺组织样本光谱曲线中,未查找到与病理分类知识库模块中的乳腺癌和癌旁组织的拉曼光谱曲线特征峰数据相匹配的特征峰,则将待检测乳腺组织样本的病理分类标记为非癌组织。
11、进一步的,rna相关特征峰的拉曼位移值为676cm-1,腺嘌呤中c-n振动相关特征峰的拉曼位移值为719cm-1,dna相关特征峰的拉曼位移值为751cm-1,核酸相关特征峰的拉曼位移值为781cm-1,苯丙氨酸c-c骨骼振动相关特征峰的拉曼位移值为1002cm-1。
12、进一步的,所述数据采集模块中设有数据预处理子模块,所述数据采集模块用待检测乳腺组织样本的拉曼光谱检测数据构建待检测乳腺组织样本光谱曲线后,先由数据预处理子模块对待检测乳腺组织样本光谱曲线实施标准化及归一化处理,然后再发送给病理分类模块。
13、进一步的,所述数据预处理子模块对待检测乳腺组织样本光谱曲线实施标准化及归一化处理前,先进行平滑处理。
14、进一步的,所述病理分类知识库模块中存储的乳腺癌和癌旁组织的拉曼光谱曲线特征峰,是通过秩和检验的方法从乳腺癌和癌旁组织样本的拉曼光谱曲线中筛选得到的强度存在显著差异的特征峰,强度存在显著差异的特征峰是指p值小于0.05的特征峰。
15、本发明所提供的基于拉曼光谱的乳腺癌和癌旁分类系统的知识库构建方法,其特征在于,具体步骤如下:
16、1)收集多个乳腺癌和癌旁组织样本的拉曼光谱检测数据及病理信息,并根据所收集的数据构建各个样本的拉曼光谱曲线,并根据各个样本的病理信息,对各个样本的拉曼光谱曲线标注病理分类标签;
17、2)通过秩和检验的方法在各个样本的拉曼光谱曲线中筛选出强度存在显著差异的特征峰,利用筛选出的特征峰数据构建乳腺癌和癌旁组织的病理分类知识库,强度存在显著差异的特征峰是指p值小于0.05的特征峰。
18、进一步的,所述步骤2)执行前,先对各个样本的拉曼光谱曲线实施标准化及归一化处理,从而将各个样本的拉曼光谱曲线的拉曼光谱强度调整为0均值1方差的数据集,并映射到0~1的数据范围。
19、进一步的,在对各个样本的拉曼光谱曲线实施标准化及归一化处理前,先对各个样本的拉曼光谱曲线进行平滑处理。
20、进一步的,对各个样本的拉曼光谱曲线进行平滑处理采用的是savitz-golay滤波器。
21、本发明提供的基于拉曼光谱的乳腺癌和癌旁分类系统及知识库构建方法,利用乳腺癌和癌旁组织的拉曼光谱曲线特征峰数据构建病理分类知识库,通过将待检测乳腺组织样本光谱曲线与病理分类知识库模块中的乳腺癌和癌旁组织的拉曼光谱曲线特征峰数据进行匹配,能对待检测乳腺组织样本进行精准化、智能化的病理分类,拉曼光谱具有“分子指纹”的成像能力,能利用氨基酸、脂质、蛋白质和核酸的特征谱线对生物组织进行高对比度高特异性的成像,与传统的医学检测方法相比,拉曼光谱检测数据具有分辨率高、不用试剂、高度自动化、检测速度快等优点,能辅助医生快速、精准的给待检测乳腺组织样本进行病理分类标记。
1.一种基于拉曼光谱的乳腺癌和癌旁分类系统,其特征在于:包括共聚焦拉曼光谱仪、数据采集模块、病理分类知识库模块、病理分类模块;
2.根据权利要求1所述的基于拉曼光谱的乳腺癌和癌旁分类系统,其特征在于:所述病理分类模块将待检测乳腺组织样本光谱曲线与病理分类知识库模块中的乳腺癌和癌旁组织的拉曼光谱曲线特征峰数据进行匹配时;
3.根据权利要求1所述的基于拉曼光谱的乳腺癌和癌旁分类系统,其特征在于:rna相关特征峰的拉曼位移值为676cm-1,腺嘌呤中c-n振动相关特征峰的拉曼位移值为719cm-1,dna相关特征峰的拉曼位移值为751cm-1,核酸相关特征峰的拉曼位移值为781cm-1,苯丙氨酸c-c骨骼振动相关特征峰的拉曼位移值为1002cm-1。
4.根据权利要求1所述的基于拉曼光谱的乳腺癌和癌旁分类系统,其特征在于:所述数据采集模块中设有数据预处理子模块,所述数据采集模块用待检测乳腺组织样本的拉曼光谱检测数据构建待检测乳腺组织样本光谱曲线后,先由数据预处理子模块对待检测乳腺组织样本光谱曲线实施标准化及归一化处理,然后再发送给病理分类模块。
5.根据权利要求4所述的基于拉曼光谱的乳腺癌和癌旁分类系统,其特征在于:所述数据预处理子模块对待检测乳腺组织样本光谱曲线实施标准化及归一化处理前,先进行平滑处理。
6.根据权利要求1所述的基于拉曼光谱的乳腺癌和癌旁分类系统,其特征在于:所述病理分类知识库模块中存储的乳腺癌和癌旁组织的拉曼光谱曲线特征峰,是通过秩和检验的方法从乳腺癌和癌旁组织样本的拉曼光谱曲线中筛选得到的强度存在显著差异的特征峰,强度存在显著差异的特征峰是指p值小于0.05的特征峰。
7.根据权利要求1所述的基于拉曼光谱的乳腺癌和癌旁分类系统的知识库构建方法,其特征在于,具体步骤如下:
8.根据权利要求7所述的基于拉曼光谱的乳腺癌和癌旁分类系统的知识库构建方法,其特征在于,所述步骤2)执行前,先对各个样本的拉曼光谱曲线实施标准化及归一化处理,从而将各个样本的拉曼光谱曲线的拉曼光谱强度调整为0均值1方差的数据集,并映射到0~1的数据范围。
9.根据权利要求8所述的基于拉曼光谱的乳腺癌和癌旁分类系统的知识库构建方法,其特征在于,在对各个样本的拉曼光谱曲线实施标准化及归一化处理前,先对各个样本的拉曼光谱曲线进行平滑处理。
10.根据权利要求9所述的基于拉曼光谱的乳腺癌和癌旁分类系统的知识库构建方法,其特征在于,对各个样本的拉曼光谱曲线进行平滑处理采用的是savitz-golay滤波器。