本发明涉及数据处理技术领域,尤其涉及一种肾脏病理免疫荧光数据处理方法、装置及相关设备。
背景技术:
肾脏病理报告数据通常作为科学研究的重要素材,而随着指标数量增多,肾脏病理报告的免疫荧光内容部分,对于部位、形态和分布等属性的描述多种多样,且伴随着技术的发展,新名词也频频出现,因此,规范描述以促进交流和科研显得尤为重要。
通过人工完成对肾脏病理报告数据的清洗,可以达成很好的效果,但耗时长、效率低,无法应对大批量数据的任务,因此,有必要提供一种能够实现对肾脏病理荧光数据进行清洗的方法。
技术实现要素:
本发明旨在至少在一定程度上解决相关技术中的技术问题之一。为此,本发明的目的在于提出一种肾脏病理免疫荧光数据处理方法、装置及相关设备。
为实现上述目的,第一方面,根据本发明实施例的肾脏病理免疫荧光数据处理方法,包括:
获取原始数据,所述原始数据为肾脏病理报告中的免疫荧光数据;
对所述原始数据进行预处理以形成中间数据,所述中间数据包括指标及该指标的指标描述;
依据肾脏病理学的标准化描述对所述中间数据进行规范化描述处理以形成规范化数据;
根据所述规范化数据生成多列值报表。
根据本发明的一个实施例,所述对所述原始数据进行预处理以形成中间数据包括:
对所述原始数据按照格式进行分类;
利用与所述原始数据类型相对应的解析器对分类后的所述原始数据分别进行预处理以形成中间数据。
根据本发明的一个实施例,所述依据肾脏病理学的标准术语对所述中间数据进行规范化描述处理以形成规范化数据包括:
获取肾脏病理学文献中的标准化描述,所述标准化描述至少包括专业指标及指标专业描述;
接受人工对所述标准化描述的错误修订并保存为标准化参考数据;
根据所述标准化参考数据对所述中间数据中的指标及指标描述进行规范化修正,以形成规范化数据。
根据本发明的一个实施例,所述根据所述规范化数据生成多列值报表包括:
解析自定义字典,并转换为数据映射规则,所述自定义字典指定了指标描述转化为取值的方式和流程;
依据所述数据映射规则,对所述规范化数据进行数据映射及缺省值补充,以生成多列值报表。
第二方面,根据本发明实施例的肾脏病理免疫荧光数据处理装置,包括:
获取单元,用于获取原始数据,所述原始数据为肾脏病理报告中的免疫荧光数据;
预处理单元,用于对所述原始数据进行预处理以形成中间数据,所述中间数据包括指标及该指标的指标描述;
规范化描述单元,用于依据肾脏病理学的标准化描述对所述中间数据进行规范化描述处理以形成规范化数据;
生成单元,用于根据所述规范化数据生成多列值报表。
根据本发明的一个实施例,所述预处理单元包括:
分类模块,用于对所述原始数据按照格式进行分类;
第一解析模块,用于利用与所述原始数据类型相对应的解析器对分类后的所述原始数据分别进行预处理以形成中间数据。
根据本发明的一个实施例,所述规范化描述单元包括:
获取模块,用于获取肾脏病理学文献中的标准化描述,所述标准化描述至少包括专业指标及指标专业描述;
修订模块,用于接受人工对所述标准化描述的错误修订并保存为标准化参考数据;
规范处理模块,用于根据所述标准化参考数据对所述中间数据中的指标及指标描述进行规范化修正,以形成规范化数据。
根据本发明的一个实施例,所述生成单元包括:
第二解析模块,解析自定义字典,并转换为数据映射规则,所述自定义字典指定了指标描述转化为取值的方式和流程;
生成模块,用于依据所述数据映射规则,对所述规范化数据进行数据映射及缺省值补充,以生成多列值报表。
第三方面,根据本发明实施例的计算机设备,包括存储器、处理器以及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如上所述的肾脏病理免疫荧光数据处理方法。
第四方面,根据本发明实施例的计算机存储介质,其上存储有计算机程序,该程序被处理器执行时实现如上所述的肾脏病理免疫荧光数据处理方法。
根据本发明实施例提供的肾脏病理免疫荧光数据处理方法、装置及相关设备,先对原始数据进行预处理以形成中间数据,再依据肾脏病理学的标准化描述对所述中间数据进行规范化描述处理以形成规范化数据;最后根据所述规范化数据生成多列值报表,如此,可以实现肾脏病理免疫荧光数据的清洗处理,效率高,有利于大批量数据的清洗处理,并且,形成的多列值报表便于科学研究。
本发明的附加方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本发明的实践了解到。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图示出的结构获得其他的附图。
图1是本发明肾脏病理免疫荧光数据处理方法一个实施例的流程图;
图2是本发明肾脏病理免疫荧光数据处理方法另一个实施例的流程图;
图3是本发明肾脏病理免疫荧光数据处理方法又一个实施例的流程图;
图4是本发明肾脏病理免疫荧光数据处理方法又一个实施例的流程图;
图5是本发明肾脏病理免疫荧光数据处理装置一个实施例的结构示意图;
图6是本发明肾脏病理免疫荧光数据处理装置中预处理单元的结构示意图;
图7是本发明肾脏病理免疫荧光数据处理装置中规范化处理单元的结构示意图;
图8是本发明肾脏病理免疫荧光数据处理装置中生成单元的结构示意图;
图9是本发明计算机设备一个实施例的结构示意图。
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
下面详细描述本发明的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,仅用于解释本发明,而不能理解为对本发明的限制。
参照图1所示,图1示出了本发明实施例提供的肾脏病理免疫荧光数据处理方法一个实施例的流程图,为了便于描述,仅示出了与本发明实施例相关的部分。具体的,该肾脏病理免疫荧光数据处理方法具体包括:
s101、获取原始数据,所述原始数据为肾脏病理报告中的免疫荧光数据。
其中,该原始数据一般来自his系统中肾脏病理报告中的免疫荧光数据。
s102、对所述原始数据进行预处理以形成中间数据,所述中间数据包括指标及该指标的指标描述。
由于不同源(医院)的免疫荧光数据,其格式并不相同,例如可以是表格化、半表格化、自然文本或者上述几种的组合,所以,该步骤s102中,通过对这些原始数据进行预处理,使得这些不同格式的数据形成统一格式的中间数据,该中间数据可以是包含指标及该指标的指标描述的多级数据结构,其中,指标描述诸如强度、沉淀部位、形态和分布等。
s103、依据肾脏病理学的标准化描述对所述中间数据进行规范化描述处理以形成规范化数据。
如上所述,由于这些原始数据来源于不同的医院,在指标及指标的描述上可能并不统一,描述方式也不符合肾脏病理学的标准化描述,即描述不规范,所以,该步骤s103中,利用肾脏病理学的标准化描述方式,对中间数据进行规范化描述,使得中间数据的描述符合肾脏病理学的标准化描述,形成规范化数据。
s104、根据所述规范化数据生成多列值报表。
由于这些数据的数据量大,且来自不同的临床对象,所以,为了便于在后续科研中有序查看这些数据,该步骤s104可以将规范化数据进行处理,生成多列值报表,也即是,以列表方式展示这些数据。
根据本发明实施例提供的肾脏病理免疫荧光数据处理方法,先对原始数据进行预处理以形成中间数据,再依据肾脏病理学的标准化描述对所述中间数据进行规范化描述处理以形成规范化数据;最后根据所述规范化数据生成多列值报表,如此,可以实现肾脏病理免疫荧光数据的清洗处理,效率高,有利于大批量数据的清洗处理,并且,形成的多列值报表便于科学研究。
参照图2所示,在本发明的一个实施例中,步骤s102包括:
s201、对所述原始数据按照格式进行分类。
s202、利用与所述原始数据类型相对应的解析器对分类后的所述原始数据分别进行预处理以形成中间数据。
如上所述,来源于不同源(医院)的原始数据,其格式并不相同,例如表格化、半表格化、自然文本或者上述几种组合等格式,而不同格式的原始数据,需要利用不同的解析器进行解析,所以,可以先对这些原始数据按照格式进行分类,分类之后,在利用表格解析器、自然文本解析器分别对对应格式的原始数据进行数据解析,并整理得到中间数据。
本实施例中,先对不同的原始数据按照类型进行分类,再利用不同的解析器对不同格式的原始数据进行分别解析,如此,可以实现对不同格式的原始数据进行预处理,处理效率高,对数据格式的兼容效果好。
参照图3所示,在本发明的一个实施例中,步骤s103包括:
s301、获取肾脏病理学文献中的标准化描述,所述标准化描述至少包括专业指标及指标专业描述。
s302、接受人工对所述标准化描述的错误修订并保存为标准化参考数据。
s303、根据所述标准化参考数据对所述中间数据中的指标及指标描述进行规范化修正,以形成规范化数据。
具体地,可以通过阅读肾脏病理文献,从肾脏病理文献中获取标准化描述,例如专业指标、专业描述文字和符号。由于获取的标准化描述可能存在错误,可以通过该领域专家对获取的标准化描述中存在的错误进行修正,以及按照标准的术语进一步规范,形成标准化参考数据,该标准化参考数据可以作为知识库。接着可以根据标准化参考数据对所述中间数据中的指标及指标描述进行规范化修正,以形成规范化数据,例如,将标准化参考数据中的专业指标、指标专业描述、符号等与中间数据中的指标及指标描述进行相似匹配,匹配成功后,利用该指标专业描述对该指标进行规范描述,进而完成规范化处理。
本实施例中,依据专家修正后的标准化参考数据对中间数据进行规范化处理,可以使得得到的规范化数据符合肾脏病理学业内的专业描述,进而方便后续科研人员的研读分析。
参照图4所示,在本发明的一个实施例中,步骤s104包括:
s401、解析自定义字典,并转换为数据映射规则,所述自定义字典指定了指标描述转化为取值的方式和流程。
s402、依据所述数据映射规则,对所述规范化数据进行数据映射及缺省值补充,以生成多列值报表。
具体地,可以预先建立自定义字典,该自定义字典,指定了指标描述、符号转化为特定取值的方式和流程。在本发明的方法中,在得到规范化数据之后,可以解析自定义字典得到数据映射规则,再利用该数据映射规则,对规范化数据进行数据映射及缺省补充,使得各个指标对应的指标描述被赋值,最后,将这些数据生成多列值报表。
本实施例中,通过对指标描述等进行数据映射,使得各个指标描述能够对应一个特定的值,进而便于生成多列值报表。
参照图5所示,图5示出了本发明实施例提供的肾脏病理免疫荧光数据处理装置一个实施例的结构示意图,为了便于描述,仅示出了与本发明实施例相关的部分。具体的,该肾脏病理免疫荧光数据处理装置包括:
获取单元501,用于获取原始数据,所述原始数据为肾脏病理报告中的免疫荧光数据。
预处理单元502,用于对所述原始数据进行预处理以形成中间数据,所述中间数据包括指标及该指标的指标描述。
规范化描述单元503,用于依据肾脏病理学的标准化描述对所述中间数据进行规范化描述处理以形成规范化数据。
生成单元504,用于根据所述规范化数据生成多列值报表。
参照图6所示,在本发明的一个实施例中,所述预处理单元502包括:
分类模块601,用于对所述原始数据按照格式进行分类。
第一解析模块602,用于利用与所述原始数据类型相对应的解析器对分类后的所述原始数据分别进行预处理以形成中间数据。
参照图7所示,在本发明的一个实施例中,所述规范化描述单元503包括:
获取模块701,用于获取肾脏病理学文献中的标准化描述,所述标准化描述至少包括专业指标及指标专业描述。
修订模块702,用于接受人工对所述标准化描述的错误修订并保存为标准化参考数据。
规范处理模块703,用于根据所述标准化参考数据对所述中间数据中的指标及指标描述进行规范化修正,以形成规范化数据。
参照图8所示,在本发明的一个实施例中,所述生成单元504包括:
第二解析模块801,解析自定义字典,并转换为数据映射规则,所述自定义字典指定了指标描述转化为取值的方式和流程。
生成模块802,用于依据所述数据映射规则,对所述规范化数据进行数据映射及缺省值补充,以生成多列值报表。
根据本发明实施例提供的肾脏病理免疫荧光数据处理方法,先利用预处理单元502对原始数据进行预处理以形成中间数据,再利用规范化描述单元503依据肾脏病理学的标准化描述对所述中间数据进行规范化描述处理以形成规范化数据;最后利用生成单元504根据所述规范化数据生成多列值报表,如此,可以实现肾脏病理免疫荧光数据的清洗处理,效率高,有利于大批量数据的清洗处理,并且,形成的多列值报表便于科学研究。
需要说明的是,本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。对于装置或系统类实施例而言,由于其与方法实施例基本相似,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
参照图9所示,图9示出了本发明实施例提供的计算机设备100实施例的结构示意图,为了便于描述,仅示出了与本发明实施例相关的部分。具体的,该计算机设备100包括存储器102、处理器101以及存储在所述存储器102中并可在所述处理器101上运行的计算机程序1021,所述处理器101执行所述计算机程序1021时实现如上述实施例所述方法的步骤,例如图1所示的s101至s104的步骤。或者,所述处理器101执行所述计算机程序时实现上述实施例所述装置中的各模块/单元的功能,例如图5所示单元501至504的功能。
示例性的,所述计算机程序1021可以被分割成一个或多个模块/单元,所述一个或者多个模块/单元被存储在所述存储器中,并由所述处理器101执行,以完成本发明。所述一个或多个模块/单元可以是能够完成特定功能的一系列计算机程序指令段,该指令段用于描述所述计算机程序1021在所述计算机设备中的执行过程。
所述计算机设备100可包括,但不仅限于处理器101、存储器102。本领域技术人员可以理解,图仅仅是计算机设备的示例,并不构成对计算机设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件,例如所述计算机设备100还可以包括输入输出设备、网络接入设备、总线等。
所称处理器101可以是中央处理单元(centralprocessingunit,cpu),还可以是其他通用处理器、数字信号处理器(digitalsignalprocessor,dsp)、专用集成电路(applicationspecificintegratedcircuit,asic)、现场可编程门阵列(fieldprogrammablegatearray,fpga)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立预设硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
所述存储器102可以是所述计算机设备的内部存储单元,例如计算机设备的硬盘或内存。所述存储器也可以是所述计算机设备的外部存储设备,例如所述计算机设备上配备的插接式硬盘,智能存储卡(smartmediacard,smc),安全数字(securedigital,sd)卡,闪存卡(flashcard)等。进一步地,所述存储器还可以既包括所述计算机设备的内部存储单元也包括外部存储设备。所述存储器用于存储所述计算机程序以及所述计算机设备所需的其他程序和数据。所述存储器还可以用于暂时地存储已经输出或者将要输出的数据。
本发明实施例还提供了一种计算机可读存储介质,计算机可读存储介质存储有计算机程序1021,计算机程序1021被处理器101执行时实现如上述实施例中所述方法中的步骤,例如图1所示的步骤s101至步骤s104。或者,所述计算机程序1021被处理器101执行时实现上述实施例中所述装置中的各模块/单元的功能,例如图5所示的模块501至504的功能。
所述的计算机程序1021可存储于一计算机可读存储介质中,该计算机程序在被处理器101执行时,可实现上述各个方法实施例的步骤。其中,所述计算机程序1021包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、u盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(rom,read-onlymemory)、随机存取存储器(ram,randomaccessmemory)、电载波信号、电信信号以及软件分发介质等。
需要说明的是,所述计算机可读介质包含的内容可以根据司法管辖区内立法和专利实践的要求进行适当的增减,例如在某些司法管辖区,根据立法和专利实践,计算机可读介质不包括是电载波信号和电信信号。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述或记载的部分,可以参见其它实施例的相关描述。
本发明实施例方法中的步骤可以根据实际需要进行顺序调整、合并和删减。
本发明实施例系统中的模块或单元可以根据实际需要进行合并、划分和删减。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子预设硬件、或者计算机软件和电子预设硬件的结合来实现。这些功能究竟以预设硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
本发明所提供的实施例中,应该理解到,所揭露的装置/计算机设备和方法,可以通过其它的方式实现。例如,以上所描述的装置/计算机设备实施例仅仅是示意性的,例如,所述模块或单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通讯连接可以是通过一些接口,装置或单元的间接耦合或通讯连接,可以是电性,机械或其它的形式。
以上所述实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围,均应包含在本发明的保护范围之内。