计模块325可W使用机器学习技术例如决 策树、朴素贝叶斯算法、内核方法和/或支持向量机来预测罕见疾病的可能性。在一些实施 方式中,可w将特定类型的罕见疾病与一个或更多个特定的机器学习技术进行关联。此外, 用于罕见疾病的统计模块325还可W确定测序错误的可能性。该可能性值可W确定W下可 能性:变异是测序错误的结果而非患者或胎儿中真实存在的变异。在一些实施方式中,仅那 些通过测序错误检验的可能性的疾病相关变异可W被进一步报告给报告模块345。
[0050] 在一些实施方式中,用于罕见疾病的统计模块325可W生成可用于表示患者感染 罕见疾病的可能性的数值。在一些实施方式中,可W确定截止值,并且将其用于感染罕见疾 病的可能性使得可能性低于该截止值的罕见疾病不会被进一步报告给报告模块345。在一 些实施方式中,可W确定多于一个的截止值并且将其用于不同类型的罕见疾病。在一些实 施方式中,截止值被严格地选择,使得仅那些极可能出现的罕见疾病可W被报告给报告模 块 345。
[0051] 报告模块345可W收集从相应统计模块325和330所接收的罕见疾病和常见疾 病的列表、每种疾病的相应可能性、基因组变异信息和/或其他相关信息,并且可W验证所 接收的每条疾病和变异信息已经通过用于疾病可能性和测序错误的一个或更多个截止值。 然后,报告模块可W将罕见疾病相关变异和常见疾病相关变异的初始列表提交给验证步骤 350W用于进一步验证。
[0052] 在一些实施方式中,验证步骤350可W设及执行PCR和/或重新测序,W便验证: 被预测成引起一种或更多种罕见疾病或常见疾病的所识别的变异不是由测序错误所造成 的人工产物。在一些其他实施方式中,可W使用其它验证技术W便准确地并且低成本地验 证所识别的变异的存在性。
[0053] 在设及变异的每个验证步骤完成时,可W将验证的结果反馈给报告模块345。在 一些实施方式中,报告模块可W基于报告的受众的特定需要来创建一个或更多个定制报告 360。例如,如果报告的受众是医师,则针对医师的定制报告360可W包括信息例如:罕见疾 病/常见疾病的可能性,其可W按可能性值进行排序;变异信息,例如变异位置、参考基因 组序列、变异基因组序列等;验证的结果;测序参数;比对参数;和/或验证参数。还可W包 括另外的信息,该信息可W是例如药物信息(如果存在的话)。
[0054] 在一些实施方式中,如果报告的受众是患者或者患者和/或胎儿的亲属、朋友和/ 或家人,则定制报告360可W包括同样被包括在针对医师的报告中的信息。另外,该定制报 告360可W包括W下信息,该信息可W帮助患者和他们的家人解释关于疾病和变异的学术 语言和术语。此外,定制报告360可W包括翻译的文章、段落和/或其他信息,W帮助其第 一语言不是英语的患者和他们的家属更好地理解所生成的报告中的科学和技术细节。 阳化5] 图4是可W被生成并且呈现给用户的用于使用户能够生成定制的变异分析和疾 病可能性报告的说明性用户界面,该变异分析和疾病可能性报告包括关于运样的分析和/ 或报告的验证的信息。在图4中,示例用户界面400可W包括至所使用的测序和验证方法的 链接402。在一些实施方式中,还可W将测序和验证方法402直接显示在用户界面400上。 [0056] 示例用户界面400还可W包括至少部分地基于疾病的可能性的排序靠前的可能 疾病的列表。在一些实施方式中,可W针对常见疾病和罕见疾病分别生成排名靠前的可能 疾病的单独列表。在示例用户界面400中,例如,列出了可能的疾病1至8(附图标记404 至附图标记420)与用于选择要在报告中显示的可能疾病中的每种疾病、疾病的子集或所 有疾病的选项。
[0057] 图6A是可包括例如疾病风险、载体状态、性状和/或药物反应的信息的临床报告 的实施方式。在图6A中,临床报告可W被生成并且被呈现给医生、患者、患者的家庭成员 等。如所示的示例报告600可W包括信息例如患者的姓名、疾病风险、载体状态、患者的性 状和/或用于查看测序数据和与基因组序列相关联的变异的链接620。
[0058] 在一些实施方式中,在临床报告中呈现给患者的疾病风险还可W包括可表示为数 值或图表的疾病的可能性。
[0059] 根据实施方式,还可W通过点击链接(例如链接610)来进一步探究与疾病风险条 目或载体状态条目相关联的每个变异。可W自动地生成与示例报告600中所列出的每个变 异相关的更多细节并且将其呈现给用户。 W60] 图6B是包括例如变异、疾病关联、疾病的可能性和受影响的基因的信息的报告的 实施方式。根据实施方式,报告(例如示例报告650)可W包括关于特定变异的细节。在该 实施方式中,示出了变异1 (附图标记为615)。该变异1属于SNV(单核巧酸变异)类型,该 变异1包括G到C的突变。可能关联的疾病为X疾病,疾病概率为99%。宿主基因/邻近 基因为基因X。
[0061] 图6C是可W被生成并且呈现给用户的用于示出与一个或更多个基因组变异相关 联的特定疾病风险的用户界面的实施方式。在图6C的该实施方式中,示出了基因0GT(641) 和基因CXorf65。还显示了每个基因的基因组坐标。例如,0GT的基因组坐标是70711329。 在一些实施方式中,还可W显示每个基因的化SNPID(例如,643)连同等位基因信息。在一 些实施方式中,可W显示基因的染色体图视图。在用户界面640中,根据实施方式,还可W 生成并且向用户呈现示出风险等位基因的数目和疾病风险的可能性(百分比值)的柱状图 表,如示例实施方式645中所示。在一些其他实施方式中,可W生成其它类型的图表W显示 类似的信息。其他类型的图表可W包括散点图、饼图等。
[0062] 图抓是与患者的特定基因组变异相关的细节的实施方式。在该特定示例中,可W 探究关于潜在疾病相关变异的更详细的信息。在示例用户界面650中,名称为0GT的基因 被识别。提供了关于由基因0GT编码的蛋白质的功能的信息连同该基因的染色体位置、描 述和别名。在一些实施方式中,可W在用户界面中提供外部链接。例如,用户界面650可W 包括至uses基因组浏览器、NCBI基因、NCBI蛋白、0MIM、维基百科等等的链接。
[0063] 图7是可W被生成并且呈现给用户的界面700的实施方式,其示出了可能与用户 W及他或她的潜在疾病风险有关的祖先相关信息。例如,关于个体之间遗传距离的信息可 如在用户界面700中所示的树格式来显示。在一些实施方式中,如果关于另一个体的 遗传变异和可能相关的疾病风险的信息可用,则可W向患者提供运样的信息。根据实施方 式,可树格式向患者显示至运样的信息的链接。另外,在一些实施方式中,医生能够查 看如在用户界面700中所示的树格式图,并且能够在一组相关的个体中找到共同的遗传变 异和/或其他祖先信息和/或社会信息。
[0064] 图8是提供使与患者的基因组序列数据相关的基因组测序变异文件显现的报告 的用户界面的实施方式。如在示例VCF文件查看器660中所示的,每个染色体中设及的变 异被突出显示。在一些实施方式中,接口 800可W包括在所显示的染色体的至少一部分中 可点击的链接,运将使用户能够跟随链接并且查看特定的序列信息。 阳0化]图9A是可W被生成并且呈现给用户的具有疾病概率的警告的疾病预测用户界面 模板的实施方式,该疾病预测用户界面模板可w包括突变和相关联的疾病风险的条形图表 示。在模板900中,条形图可W包括特定的疾病风险的指示符925,该指示符指示该疾病风 险百分比与突变的数量之间的关系。在一些实施方式中,模板900还可W包括从疾病/变 异数据结构302中检索的相关疾病信息,例如疾病说明、疾病类型(例如,单基因病症)、针 对其生成预测报告的相关致病基因/突变的列表W及所识别的突变的列表。
[0066] 在一些实施方式中,模板900还可W包括至疾病预测报告的染色体视图的链接 915。在一些实施方式中,疾病预测报告的染色体视图可W显示相关变异的位置与下述信 息,所述信息不仅与该变异有关,还与该变异周围的基因组环境有关,所述信息包括例如最 靠近的基因或受影响的基因的信息。根据实施方式,模板900可W向用户显示关于特别有 可能感染疾病的警告并且建议患者寻求专家的帮助。在一些实施方式中,如果用户希望看 到属于