本发明涉及用于数据校正的(计算机实现的)方法,尤其是荧光数据、相关系统、软件、图形用户界面及其使用。
背景技术:
尽管存在将(计算机实现的)方法用于数据校正的概念,但是这些方法主要集成在测量系统中并且因此它们不是非常精确或灵活。
技术实现要素:
本发明的目的是提供用于数据校正、相关系统、软件、图形用户界面及其用途的(计算机实现的)方法,它们是更加精确和/或灵活的,并且可以或者无法被独立使用,其尤其适合于荧光数据。
本发明包括用于数据校正、相关系统、软件、图形用户界面及其用途的各种(计算机实现的)子方法,尤其适合于荧光数据,本发明还提供了这些子方法的优选顺序。底层软件可被用作独立的或者可被集成在测量装备中,并且因此其可在处理器上运行,其可被集成在测量装备中,或者其可被分开(即部分地在测量装备上,部分在独立计算机上)。
底层软件还可以包括基本软件和特定于客户端和/或特定于应用的部分。本创造性贡献涉及认识到从测量装备得到的数据即使在用集成在测量装备中的软件处理该数据之后也偏离理想上可被预期的数据。甚至更多地,所述偏离可由共集成(co-integrated)软件造成,并且测量装备的缺陷的仔细校正因而是必需的。该校正应当优选地在各种步骤中发生,更甚至,优选地通过按照特定次序为这些步骤排序来发生。
另一创造性贡献是认识到这些校正是特定于客户端的和/或特定于应用的和/或特定于测量装备的,并且因此提供足够的选项来由此进行处理,例如通过提供使用多个数据格式、校准数据和/或其他设定参数的可能性。然而,本发明不仅如此注重于数据的校正本身,而且还旨在改善将数据用于对目标分子的检测、对感染的更特定检测,其通常经由峰值检测完成。在数据的校正之后的数据分析必须因而优选地集成在软件中并且还具有所需参数和验证方法。
本发明的各种方面在权利要求中得到描述。
附图说明
图1示出了本发明的实施例的流程图。
图2示出了荧光频谱以及时移的结果。
图3示出了荧光频谱以及颜色补偿的结果。
图4示出了基准解链曲线。
图5示出了没有补偿的解链曲线。
图6示出了具有补偿的解链曲线。
图7示出了没有减去背景信号的数据。
图8示出了减去背景信号之后的数据。
图9(a和b)示出了使用移动平均的效果。
图10例示出数据点丢失的问题。
图11示出了方法的流程图。
图12示出了验证方法的流程图。
图13例示出峰值检测。
图14例示出肩部感染。
图15例示出多重感染。
图16例示出用于数据分析的方法。
图17例示出在各种区域中3值分数(3-value-score)的使用。
图18例示出时移的方法。
具体实施方式
关于本发明的编号陈述
陈述1.一种用于调整来自多个参数(600,610,620)的至少第一参数(600)的测量结果(630,660,670)的子集的方法,所述多个参数各自经受相同的依赖于时间的环境,其中测量结果是在不同时间点(700,703,706)得到的并且其中所述调整产生可与至少第二参数(620)的对应测量结果(650,680,690)相比较的计算出的值(630*,660*,670*),相当于它们是在第二参数(620)的对应测量结果被确定时的时间(702,705,708)得到的,其中该方法包括以下步骤:
(1)计算针对第一参数(600)的各自在不同时间(700,703,706)得到的一些测量结果(630,660,670);
(2)确定当第二参数(620)的对应测量结果(650,680,690)被确定时的时间点(702,705,708);以及
(3)基于第一参数(630,660,670)的测量结果确定在第二参数(620)的时间点(702,705,708)处代表第一参数(600)的计算出的值(630*,660*,670*)。
陈述2.根据陈述1所述的方法,其中,测量结果是实时pcr实验的荧光数据,并且依赖于时间的环境由在pcr反应期间的温度来反映。
陈述3.根据陈述1或2所述的方法,其中,第一参数的计算出的值是通过对第一参数的测量结果关于第二参数的时间点进行插值而确定的。
陈述4.一种用于调整样本的荧光测量结果(300,310,320)的方法,其中测量结果是在至少两个部分重叠的波长区域中得到的,该方法包括以下步骤:
(1)确定荧光测量结果,
(2)确定指示所述重叠的信息,
(3)基于来自步骤(2)的信息通过使用数学乘法运算来调整荧光测量结果,以减少所述重叠的影响。
陈述5.根据陈述4所述的方法,其中,调整是使得不存在过度补偿。
陈述6.一种用于调整荧光测量结果的方法,包括执行根据陈述1至3中的一个所述的方法,接着是执行根据陈述4至5所述的方法。
陈述7.根据陈述1至6中的一个所述的方法,还包括以下步骤:确定针对参数中的至少一个参数的背景信号的存在;以及针对所述背景信号校正(减去)通过陈述1至6所述的方法得到的经调整的测量结果。
陈述8.根据陈述1至7所述的方法,还包括优选地通过使用移动平均使通过陈述1至7所述的方法得到的经调整的测量结果变得平坦的步骤。
陈述9.一种用于确定样本中的一个或多个目标分子的存在的方法,包括:(1)对从样本得到的测量结果执行前述陈述中的一个的方法以取得计算出的值,(2)基于来自步骤(1)的计算出的值来确定目标分子的存在与否。
陈述10.根据权利要求9所述的方法,其中,在步骤(2)中,基于来自步骤(1)的计算出的值来确定目标分子的存在与否是通过确定最大值以及将针对该计算的可靠性的3值分数考虑在内来执行的。
陈述11.根据陈述9或10所述的方法,还包括:(3)通过对在指定的最大值附近的前述经调整的值执行对称分析来描述目标分子的特性。
陈述12.一种计算机程序产品,其在用于执行根据陈述1至11中的一个所述的方法的步骤之一的计算的处理器上活动。
陈述13.一种机器可读存储介质,其存储先前发现结果的计算机程序产品。
陈述14.根据陈述1至12所述的方法的使用。
陈述15.一种图形用户界面,其适合于使用根据陈述1至12所述的方法。
在一个具体实施例中,本发明还包括如本文所定义的方法,其中上面提到的步骤借助于计算机通过加载和/或计算测量/时间点来执行。这里应当特别注意到,在该具体实施例中,时间点实际上被考虑在内,而现有技术未预见任何时间校正,并且因而不承认时移对目标分子的检测的影响,并且更具体地是对待分析的样本中的感染的检测的影响。具体而言,通过与粗数据一起显式地读取时间点或者通过使用测量设备的特征(例如,其对环境因素即温度做出的改变)从而隐式地确定这些时间点来考虑到时间点,并且将这些时间点用于未来的计算以改善对目标分子的检测,并且更具体地是对待分析的样本中的感染的检测。
在方法中一个接一个地执行不同步骤的情况下,使用从先前步骤接收到的计算出的值来执行每一个步骤。
详细说明
本发明包括可以在软件中实现的、特别是用于对在生物技术应用中使用的数据(诸如pcr分析中的荧光)进行计算、校正和处理的方法,因此,其旨在用于检测目标分子更具体地是检测在待分析的样本中的感染的应用。
以下表示可能的实施例,然而,本发明不仅限于该实施例。
在图2和3中,x轴(10)表示测量光的波长并且y轴表示测量光(荧光)的量。
在图4至10(这里仅在图4中示出)、图13至15和图17中,x轴(30)表示温度(指示测量样本的环境)并且y轴(40)表示经处理的荧光数据(例如减去这些数据相对于温度的导数)。
用于执行根据本发明的方法的软件
在本发明的特定实施例中,决定开发独立的软件应用。这为终端用户简化了软件的使用和安装。这样,所有数据都保持在一个系统上,这在存在许多用户时显得更安全。根据本发明的方法对从用于pcr分析的系统得到的数据起作用。这种系统通常包含使测量数据可视化的集成软件包。然而,这些软件包最初旨在研究和开发,这同时也是最大的缺点。每当用户想要查看样本时,其需要执行各种动作(鼠标点击)并且因而花费一些时间来取回数据,尤其如果其想要分析多个样本的话。然而,从该集成软件可以导出数据到例如xml文件。这样,与特定运行有关的所有数据被保存在一个文件中。该xml文件或者其他合适的文件(例如文本文件(txt)被用在根据本发明的方法中并且可在相关软件中被捕获。本发明的方面之一因而是能够处理以各种格式接收到的数据。
这样,在pcr设备中的全循环之后,仅用单次鼠标点击,用户就能够导出数据。由此其可使用本发明的方法来执行完整数据分析。
除了增加的效率和精度之外,经由本发明的方法还可以将用户的技术提高到更高的水平。利用本发明的方法做出的修改使得用户能够检测增加其测试的选项(例如多重)的多个参数(例如,荧光通道)。
加载数据
在软件中加载数据以便执行根据本发明的方法是使用完全自行开发的代码来执行的。必须被加载的xml文件包括150000行。因为只想要使用该信息中的一些,因此从该文件中过滤期望数据。针对每个样本创建对象并且将所有对象保持在列表中。每个样本对象包含原始荧光数据以及所测量的三个参数(faw、rox和cy5通道)的温度。图1中示出的流程图的流程表示意性地示出了被编写用来捕获来自xml文件的所有数据的代码。
编辑数据
在可以分析数据之前,必须首先对数据进行编辑和补偿。执行四步来编辑原始数据。
1.时移
2.颜色补偿
3.减去
4.移动平均
时移
时移校正是执行的最初校正之一。需要该校正以比较相同温度的各种参数(荧光通道)。
在第一方面中,本发明因而包括一种用于调整来自各自经受相同环境的多个参数(600,610,620)的至少第一参数(600)的测量结果(630,660,670)的子集的方法,所述环境依赖于时间,其中测量结果是在不同时间点(700,703,706)得到的并且其中所述调整产生可与至少一个第二参数(620)的对应测量结果(650,680,690)相比较的计算出的值(630*,660*,670*),如同它们是在第二参数(620)的对应测量结果被确定时的时间(702,705,708)得到的,其中该方法包括以下步骤:
(1)针对第一参数(600)计算各自在不同时间(700,703,706)得到的一些测量结果(630,660,670);
(2)确定第二参数(620)的对应测量结果(650,680,690)被确定时的时间点(702,705,708);以及
(3)基于第一参数(630,660,670)的测量结果确定在第二参数(620)的时间点(702,705,708)处代表第一参数(600)的计算出的值(630*,660*,670*)。
在pcr反应期间,测量硬件将在内部不断地增加温度。因为各种荧光通道被一个接一个地测量,因此每一个通道在不同温度被读取。这样,在例如fam和rox通道中的测量的荧光之间以及在rox和cy5通道之间存在温标的微小变化。(图2)。对原始数据执行时移校正。在软件中,来自最初通道的温度被补偿至这些通道中的最后通道的温度,例如,fam和rox通道被补偿至cy5的温度。通过该校正,能够在相同温度比较从各种通道接收到的测量结果。时移基于来自当前和下一个通道的温度来插入数据。根据在最初通道(例如rox或fam)中测量的温度,将或多或少地进行补偿。例如,基于cy5温度来补偿ram和rox温度。这确保了校正后的数据(计算出的值)移动到后续测量发生处的略高的温度。
在该时移校正的形成期间,基于源自各种导出的数据来评估如何可以最优地进行该补偿。最终,决定将温度从最初通道(例如fam和rox)移动到最后通道(例如cy5)。然而,可以使用任何通道作为基准并且可以据此来校正来自其他通道的值。在软件的具体实施例中,时移校正将是对原始数据的第一校正。因为在该特定实施例中,在进一步的步骤中不再使用人为的不正确的基准值(对于环境,例如,由温度表示并且实际上在不正确的基准时间下),所以这些进一步的步骤更佳地发生并且因而最终导致对目标分子的改善了的检测,并且更具体地,导致对在待分析样本中的感染的更好的检测。该具体实施例的理解,更具体地是时间校正应当在颜色补偿之前发生,要求设备上的任何可能的颜色补偿应当被关闭。这将被进一步说明。
对待分析的样本的荧光数据以及负控制的数据这两者均执行时移校正。该负控制(基准样本)是仅包含试剂并且没有临床材料的样本。时移优选地对来自最初通道(例如fam和rox通道)的数据发生。
图18例示出在各种时间点(700-708)得到的针对各种参数(600,610,620)的沿着时间轴陈列的测量结果(深灰,例如630),以及当在针对另一个参数(620)的测量结果的时间轴中可以得到测量结果(650)时的时间(702)处,适合于包括在这些参数中的1个(600)的测量结果的时间轴上的计算出的测量结果(浅灰,例如630*),以允许对测量结果(650)和(630*)进行比较。
在数学上,利用根据在具有x和y值的曲线上的插值的偏好,将数据插入至最后通道cy5的温度。
颜色补偿
颜色补偿是在稍后获得正确分析时的极重要的步骤。
在下一方面中,本发明因而包括一种用于调整样本的荧光测量结果(300,310,320)的方法,其中测量结果是在部分重叠的至少两个波长中得到的,该方法然后包括以下步骤:(1)确定荧光测量结果,(2)确定指示所述重叠的信息,(3)基于来自步骤(2)的信息通过使用数学乘法运算来调整荧光测量结果,以减少所述重叠的影响。
在实时pcr处理期间,测量在三个通道中发生。这使得信号从第一通道(例如fam通道)辐射到第二通道(例如rox通道)以及从第二通道(例如rox通道)辐射到最后通道(例如cy5通道)。该辐射在图3中可被清楚地看到。与第一通道(300)相对应的曲线与来自第二通道(310)的曲线部分地重叠。该重叠部分是第一通道(fam)到第二通道(rox)中的辐射(330)。这对于第二通道(310)的信号也发生,该信号在最后信号(320)的曲线中辐射。该最后辐射(340)是第二通道(rox)到最后通道(cy5)中的辐射。
各种通道的百分比辐射取决于所使用的设备。为了执行正确的颜色补偿,必须对每个设备执行校准以判定各种通道之间的辐射延伸到何处。在没有该校正的情况下,在分析期间可由于从一个通道辐射到另一个通道中的峰值而发生错误。为了执行颜色补偿,必须首先计算校正系数,稍后可以使用该校正系数来校正所测量的数据。基于源自颜色补偿运行或校准运行的数据来计算这些校正系数。软件是以如下方式开发的:一旦该运行已被捕获,校正系数就被存储在用户的硬盘上。从现在开始,每当用户打开软件时,其将能够重载并使用这些校正系数。
对原始数据执行颜色补偿。所执行的校正取决于颜色补偿运行。在这种运行中,也在三个不同通道中测量荧光。与正常运行的唯一差异是样本不包含所有荧光标签,但是存在仅具有rox、cy5或fam标签的样本。在分析期间通过在三个通道中辐射并测量样本之一,可以确定到其他通道中的辐射的量。仅当在样本中存在仅一个荧光标签时,这些测量是可能的。
图4和5指示颜色补偿的目的。
假定具有如在图4中看见的在rox中的峰值。该峰值具有大约0.7的高度。如果经由颜色补偿运行判定rox通道辐射35%到cy5通道中,则当颜色补偿被关闭时将会需要看见在cy5通道中的大约0.25的峰值(图5)。
一旦激活颜色补偿,峰值就在cy5通道中消失。因为不再存在任何辐射,因此源自rox的辐射的峰值消失。现在具有实际指示过度补偿的在cy5中的最小值(图6)。在过度补偿的情况下,与辐射在相同地方处的在cy5中的感染也会消失。使软件中的颜色补偿算法优化以使得将不存在任何过度补偿,这样实际上为感染的峰值不被错误地滤除。
如果更详细地研究该颜色补偿,则将基于校正系数来补偿数据。仅需要对第二和随后的通道(rox和cy5)施加颜色补偿,因为只有这些通道能具有辐射。被测量的第一通道(fam)将不具有来自具有更低波长的通道的任何辐射。
首先说明从fam到rox的校正。为了补偿rox通道中的fam的辐射,从四个参数出发的函数被编写:来自rox通道的原始荧光数据,来自fam通道的可能的时移校正数据以及fam通道的辐射百分比。将基于上面提到的数据来计算校正后的数据集,可将其进一步用作针对rox通道的校正后的数据。
颜色补偿基于开发的可以是为终端用户量身定做的算法而发生,这与可用的现有算法相比将改善效果。在本发明的具体实施例中,用户应当因此关闭设备上存在的任何颜色补偿。更具体地说,该具体实施例因而包括建立一些测量结果,其中每个测量结果是在与第一参数的测量结果的时间点不同的时间点得到的,由此所述测量结果是实时pcr实验的荧光数据,由此设备上的颜色补偿被关闭。在本发明的替代实施例中,(例如在用户无法关闭设备上存在的任何可能的颜色补偿的情况下),本发明的方法除必要的颜色补偿之外还将针对设备的任何异常颜色补偿进行补偿。
为了颜色补偿,将为每个设备测量一次辐射。这通过在设备上加载特定运行而发生。通过仅仅辐射和测量1个通道,将知道辐射的量。基于在这里测量到的百分比,稍后将能够经由乘法校正其他运行。
减法
减法是使用的可能的第三校正。利用该减法,想要除去信号的背景。在减法之后,仅保留纯数据,而没有由于特定背景或噪声的人工增加。
图7示出了负控制(400)的曲线不完全在0上,而是在这种情况下在0.1左右。该信号是在反应中具有所有pcr试剂的样本但是不具有dna样本的情况下的结果。理论上,没有dna,任何产品将不可能形成。理论上,也将不可能测量该负控制的通道中的1个通道中的荧光。如果在实践中对其进行测试,则将清楚地看见光背景。该背景在图上被指示为曲线(400)。在校正后的图(图8)中,通过在样本的荧光数据和负控制的荧光数据处减去负控制信号而除去该背景。这样,负控制的曲线(410)对于所有点都完美地在0上。反映样本的荧光数据的图(420)由于该减法而更低。取决于背景的高度,样本数据由于该减法将或多或少地下降。
该减法应当优选地是用于对数据四舍五入的最后校正。该减法可以仅在rox通道或cy5通道中发生。如果必须在fam通道中执行减法,则在fam通道中读取的负控制因此将不会被正确地解释。减法将使fam通道中的控制信号显得比它们实际上负得更多。
在数学上,减法包括信号与背景之间的差异。
移动平均
移动平均不是用来纠正测量错误的校正。然而,该移动平均被包括在软件中。在调查之后,看出基于该移动平均使数据优化是高效的。在原始数据上没有可见的尖峰,但是看出的是图的形式不总是最佳的。在进一步分析该问题之后,推断这是由于当前协议,在当前协议中每1℃增加仅确定一个测量结果。通过经由移动平均来补偿数据,数据的异常消失。
通过使用移动平均,能够使图“平滑”。能够实验性地推断该平滑稍后将简化对目标分子尤其是感染的检测。
移动平均是对数据的最后校正。该校正不在原始数据上发生,而是在衍生数据上发生。必须总是使用衍生数据来计算曲线的梯度以确保最大检测。
图9示出了该校正的优点。在截图中,见到图(a)中的曲线是如何相当有角的,而在利用移动平均进行校正之后的图(b)中曲线是更加平滑的。通过向衍生数据施加移动平均增加了该图的平滑。在图(a)中存在的该极轻的最大值由于平滑而在图(b)中几乎被除去。这证明了对流动数据的峰值检测是更加容易的。
在数学上,移动平均通过用一个点和接下去的点中的一个或更多个点的平均值来替换该点而发生。
校正参数
为了执行所有校正,可以使用一些数学参数。这样,校正的程度可以被实验性地调整。数据的校正对于执行正确的峰值检测是重要的。平滑的量是流动曲线和仍然保持足够分辨率以便不放开来自结果的小感染之间的平衡。
dx:该第一参数决定如何基于可调整的参数9dx(分化间隔)来计算衍生值。该dx值越高,则减法的范围越高并且曲线将越平滑。该值也不可以过高,因为这能导致不足的分辨率以致无法执行正确分析。在衍生出数据时总是丢失一些点。在实施例中,以丢失不是后部的所有数据点的方式来设计数据的减法。例如,假定知道在计算来自面板的第一目标分子时的解链点(meltingpoint)温度是至少53℃,而在计算来自面板的最后目标分子时的解链点温度是最高80℃,并且利用测量装备可以在45℃和85℃之间进行测量。根据该数据,可以丢失前部(低温度)和后部(高温度)的一些数据点而不丢失有用的数据对。
图10示出了可以如何衍生出数据。由于可以查看测量点的左边和右边的点dx之间的梯度,因此丢失在前部和后部的点dx(分别见(800,810))。这样,能够正确地得出,而不丢失与关于第一或最后目标分子的值接近的任何数据点。
移动平均dx:如前所述,移动平均可被用来补偿曲线中的较小不规则物。这产生了简化峰值检测的更平滑的曲线。通过该校正,极大值的数目减少。滤除与目标分子不相符的极大值。
也在这里,以丢失前部和后部的点的方式工作。该原理与衍生的方式是相同的。假定为1的dx被用于移动平均,则将基于当前点的前一个点和后一个点以及该点本身来计算平均值。如果为0的dx被选择用于移动平均,则当前点和下一点之间的部分将被考虑在内。这样,仅丢失后面的一个点。
在实施例中,有限的减法与移动平均结合。这两个数学运算均将在一定程度上使曲线平滑。
额外百分比颜色补偿:可以针对软件中的颜色补偿增加校正系数的百分比。这样,用户可以增加颜色的影响。在某些情况下,这能导致经改善的校正。
除了针对各种校正设置校正的数量的选项之外,可以个别地排除一个或多个校正。按以下方式开发软件的:每一个补偿均可以被分开地包括或排除,而只有其他校正将继续正确地发生。
数据的结尾处理
图11示出了将对数据进行校正的函数的完整流程图。该函数需要样本数目和通道作为参数。基于这些数据,针对期望的样本和所选择的通道计算正确的数据并且显示曲线。该算法的流程是通过实验性地开始搜寻校正该数据的最合适的方式来确定的。除了校正数据的各种方法之外,还研究各种步骤可被采用的顺序。必须确定用于各种校正的参数,这导致搜寻平滑与良好校正之间的正确平衡,这将不会导致任何数据丢失。
图11在步骤(100)中示出了如何通过使用这些加载的测量结果来确定针对加载了测量的参数(荧光通道)的计算出的值,以得到代表在加载时的环境下的参数的计算出的值。图11在步骤(200)中示出了通过使用加载的信息来调整前述计算出的值以抑制频率重叠的影响。图11在步骤(300)中示出了如何确定参数中的至少一个参数的背景信号的存在;以及校正(减去)经调整的测量结果。图11在步骤(400)中示出了优选地通过移动平均对计算出的值的平滑。图11还示出了子方法和步骤的优选顺序。
负控制的验证
在开始分析数据之前,检查iac(internalamplificationcontrol,内部放大控制)。通过检查iac,可以判定试剂盒中的反应是否正确地发生。取决于试剂盒,存在温度,如果在rox或cy5通道中未发现感染,那么在该温度处iac信号一定具有最小值。已经包括用于iac的验证的一些参数。当测试软件时,确定某些弱感染未被检测到。在分析这些具体情况之后,决定必须被调整的不是参数,而是确保更好的负平衡从而能实现更好的归一化,这意味着早先会被漏掉的弱感染显露出来。当用户选择验证iac时,其在先前输入的iac不符合有效iac的要求的情况下接收到具有用来实现新iac的选项的通知。如果用户给出与之前相同的iac或者当前iac,则软件将使用该iac。有效iac是在第一和最后的荧光值之间具有足够差异的有效负信号。见图12。
数据分析
在所有数据被精确校正之后,数据将被分析。该分析包括从完整数据集中过滤感染峰值。如从图13中见到,不是所有的极大值都是针对特定感染的真正的最大值。这然后也例示出本发明的创造性贡献。存在多样的数据,但是算法必须普遍地处理数据并且总是从完整数据集中仅过滤正确的极大值。为了这样做,开发了分析该数据集或该数据集的一部分的一组函数。从最大值成功地通过该分析时的时刻起,能够推断该最大值表示特定感染。
分开对单次感染和多重感染的分析。这样,感染总是在其绝对最大值处被计分。这样,从不存在可能从多重感染中漏掉甚至最明显的感染的可能性。从该最大值遵从参数的组合时的时刻起,将有进一步的调查,以看看在所找到的最大值的左边或右边是否存在肩部。
在某些情况下,不处理肩部感染,而是处理可以通过在其底部的巨大宽度来识别的多重感染。还必须执行对这些感染的分析,这仅在可以从数据中得出这是否是潜在的多重感染的情况下可被执行。图14清楚地示出了这点。可看见清楚的肩部。在被计分的感染的左边,存在更小更弱的感染,该更小更弱的感染确保了曲线获得特定的肩部。图15示出了不具有肩部的多重感染的清楚示例。
这两个曲线之间的主要差异在于曲线的对称性。由于所发现的最大值,不具有肩部的多重感染关于垂直对称线将总是在很大程度上对称。与此形成对比,肩部感染在顶部将是对称的但是在肩部高度处总是不对称。基于该对称性计算,也搜寻多重感染或肩部感染。
从一般观点来看,所发现的方法因此使得能够基于前述的经调整的测量结果,通过确定极大值以及通过借助对涉及指定最大值的前述经调整的测量结果执行对称性分析给污染分类来检测前述污染的存在。
在分析期间,已经使用了许多参数来从完整数据集中过滤感染峰值。
因此,如早先指示的,设置方法和底层软件的参数的能力有助于本发明。在下面更详细地讨论所能够使用的各种参数。
动态系数阈值阳性:判定针对明显阳性感染的阈值高于负控制的平均值多少倍。例如,负控制的平均值是0.1并且动态系数阈值阳性是2.5,则为了被看作明显阳性的峰值必须高于0.25。
动态系数阈值阴性:与前一参数相同。该值将仅确定针对不确认区域的最小阈值。高于该阈值但是仍低于阳性阈值的感染落入不确定区域中。该不确定区域是包括不确定情况的区域。用户更确切地说应当再一次视觉地检查来自该不确定区域的感染。
绝对系数原始:为了将信号看作感染,在样本数据与负控制之间必须存在高于该参数的绝对差异。这里的差异总是涉及原始数据和来自两个数据集的第一点。该差异基于样本的荧光和负控制的荧光而发生。
动态系数原始:仅当第一数据点比乘以该参数的负控制的测量结果更高时可以将信号记分为感染。也是在这里,原始荧光数据被用于计算。
宽度:该参数包含感染峰值必须具有的最小宽度。离用来查看宽度的顶部的距离是由百分比宽度(percentagewidth)参数决定的。
百分比宽度:该参数给出宽度必须被从哪里查看的百分比。该百分比总是从顶部查看的。假定具有为1的y值的最大值并且该百分比被设置在15%,则峰值的宽度将从0.85的高度被查看。这样,感染必须具有特定宽度和高度,以及具有许多极大值不具有的且可以在感染峰值处找到的某物。基于该参数和前一参数,从背景周围的区域中过滤相当多的不正确的极大值。
宽度底部&百分比底部边界:这些参数以与正常宽度和相关百分比同样的方式起作用。这些参数将仅被用来查看在底部处的宽度。这些参数在对不具有肩部的多重感染的检测中起重要作用。因为这些峰值以在底部处的巨大宽度为特征,因此易于基于这些值来检测它们。
绝对阈值:该阈值是绝对阈值。为了被看作感染,峰值必须总是高于该值。即使峰值仍在动态阈值之上,但是仍不高于该值,其将不是有效的感染峰值。该参数是为了过滤背景中的极大值而创建的。在某些情形下,在仍被记分为感染的负信号中找到极大值。
双重感染峰值最小高度:该参数与前述参数相同并且该参数将记录针对双重感染的最小高度。
左右的对称性差异:为了检测肩部,在特定高度处查看对称性。肩部必须具有比该值更高的偏离对称的偏差,以便能够被记为肩部。该偏差是基于对称轴的左部分和右部分之间的比例来计算的。当信号必须偏离30%时,即,对称轴的左部分和右部分之间的比例必须低于0.7或者高于1.3。
对称高度:该高度取决于该百分比,在该高度处对称轴被查看。也是在这里,将存在从y值的一定百分比的下降。在具体实施例中,如果详细查看峰值检测,则图16中的流程图可被遵循。如可看见的,首先检测可应用于一个或更多个感染的每个最大值。从最大值已被检测到的时刻起,将进一步分析该最大值是单个还是多重的。
样本的自动检测
在开始分析之前,软件必须优选地首先检查哪一个样本已被识别为负控制。用户可以在软件中指定标签,其可被用来自动地搜寻负控制或者用来区分mix1和mix2样本。当用户一度提交其标签时,这些标签被保存在系统的硬盘上并且当用户启动软件时这些标签将总是被加载。
当评估数据分析并将其与现有技术软件相比较时,看到本发明的数据分析在90%的情况下对于被比较的所有软件包是类似的。软件包之间的差异在于另10%。这最后10%的高峰包括极弱的感染、肩部以及多重感染。因为这涉及医疗诊断,因此软件分数必须100%受信任。当只有2%的情况无法被精确打分时,所有的样本必须被视觉地检查以确保分数是正确的。
为了解决该问题,在本发明的实施例中使用了阴性、不确定阳性和确定阳性区域。该参数设定必须以如下方式确定:确信峰值在绿色或者说阳性区域中的结果处是阳性的。峰值落在不确定区域中的情形必须仍然被用户视觉地检查。这样,必须被手动分析的样本的数目被减少至落入橙色区域的数目。这样,也不给任何假阳性记分。图17示出了具有伴随结果的区域。本发明在对多于2个区域,优选地3个区域(500阳性,510不确定,520阴性)的使用上是独特的。该方法被有意识地选择,因为这将导致更可靠结果的实现。
一般而言,这些方法因而基于前述经调整的测量结果优选通过确定最大值并且通过包括该确定的可靠性的3值分数来检测所述污染的存在。
数据的输出
在对数据执行校正和分析之后,必须也可以导出数据。通过创建导出,用户得到对完整运行的结果的好的全局概览。
软件还提供给出利用针对所选择的通道的伴随曲线对软件中的特定样本找到的感染的概览的机会。如果用户想自动地为完整运行计分,其更确切地说应当选择导出。该导出将总是被软件创建为pdf和csv文件。csv给予在诸如excel之类的电子表格中容易地处理数据的机会。pdf的导出取决于pdf被创建的模式而具有不同的布局。在软件中,区分可以将2种参数设定相互比较的实验模式和用来给感染计分的模式。第二种模式是用来为峰值名称计分的模式。该模式被开发为自动地为运行计分并且快速地接收具有各种样本和所发现的感染的概览。在该模式中,在软件中在1混合化验(assay)和2混合化验之间内部地创建概览。两个样本有必要具有相同的名称,在结尾具有表明其涉及mix1还是mix2的特定标签。在“为峰值名称计分”中的2混合化验的pdf总是彼此相邻地混合所发现的感染以及曲线下面的伴随数据。对于用户,关于软件没有任何改变。用户选择其想要使用的化验。取决于所使用的化验,软件以不同方式处理导出。这在没有用户的任何干预的情况下发生。在背景上,在2混合化验和1混合化验的处理之间存在清楚的差异。在2混合模式下,每页还将显示1个样本。如果混合中的仅1个必须被包括在针对特定样本的运行中,则软件将通过将相对应混合的左边或右边的列留空来指示该混合。在“为峰值名称计分”导出处,pdf在第一页上包含具有结果的概览的表格。这样,易于快速地获得完整运行的全局概览。在该概览之后,将会存在具有在运行期间使用的参数的表格。