基于生物云平台的文章分析系统和方法
【专利摘要】本发明公开了基于生物云平台的文章分析系统和方法,其中系统包括:用户界面模块、请求分析模块、图表呈现模块、综合分析模块;用户界面模块用于获取并发送用户请求;请求分析模块用于接收用户请求并对用户请求进行分析,指示将指定的文章内容发送给图表呈现模块;图表呈现模块接收并将指定的文章以图表的形式进行展示;综合分析模块根据图表呈现模块中展示的图表对测序数据进行分析,并将分析结果以图表形式在图表呈现模块进行展示。用户可以根据指定的文章内容中所采用的逻辑分析方法对测序数据进行分析,最终以图表呈现,图表与文章中图表呈现形式高度相似,使得数据分析方式不再局限于传统业务线流程的单一性,提高对测序数据的处理效率。
【专利说明】基于生物云平台的文章分析系统和方法
【技术领域】
[0001]本发明涉及生物信息分析【技术领域】,特别涉及一种基于生物云平台的文章分析系统和方法。
【背景技术】
[0002]随着高通量测序技术在医疗、健康、医药、环境、能源等相关领域的广泛应用,生物大数据时代已经到来。由于采用不同代进行测序,测序得到的高通量原始数据是长度不等的序列,要通过生物信息学工具将这些序列组装成长的邻接片段甚至是整个基因组的框架,或者把这些序列比对到已有的基因组或者相近物种基因组序列上,并进一步分析得到有生物学意义的结果。
[0003]文章分析模式由于文章间分析思路是不同的,因而分析方式多元化,由于对测序数据进行分析所参照的文章在选择时需要依赖于某个公司业务线涵盖的领域技术的支持,因此选定的文章在涵盖领域上会有一定的偏向性。发表文章对图表的格式质量要求较高,有些学者做出的图表内容极具启发性,却由于格式不符合期刊的指定要求而得不到及时发表。
[0004]因此利用现有技术的方法,对同一业务线流程结果具有较强的单一性,如果用户有新的需求,则需要采用一套全新的系统性的分析方法来进行数据分析,这样就会增加测序成本,而且即便相同的原始数据由不同的测序公司进行测序所得到的测序结果也会有所差别,导致测序结果精确度很差。
【发明内容】
[0005]为了解决现有技术对测序数据处理过程中分析方法单一性,处理效率低的技术问题,一方面,
[0006]基于生物云平台的文章分析系统,包括:用户界面模块、请求分析模块、图表呈现模块、综合分析模块;
[0007]所述用户界面模块用于获取并发送用户请求;
[0008]所述请求分析模块用于接收所述用户请求并对所述用户请求进行分析,指示将指定的文章内容发送给所述图表呈现模块;
[0009]所述图表呈现模块用于接收所述指定的文章内容并将所述指定的文章以图表的形式进行展示;
[0010]所述综合分析模块根据所述图表呈现模块中展示的图表对测序数据进行分析,并将分析结果以图表形式在所述图表呈现模块进行展示。
[0011]可选的,还包括:
[0012]云端数据库,用于存储测序数据和文章,所述用户请求用于指示从所述云端数据库中选择符合要求的文章作为指定的文章内容。
[0013]可选的,所述综合分析模块包括分析软件模块和任务调度模块;
[0014]所述分析软件模块用于以所述图表呈现模块中展示的图表作为模板,根据所述模板生成对所述测序数据进行分析的操作任务;
[0015]所述任务调度模块用于接收并执行所述操作任务,所述操作任务为分析软件模块对测序数据进行分析后生成的任务。
[0016]可选的,所述综合分析软件还包括分析软件库,用于存储各种分析软件,所述任务调度模块在执行所述操作任务过程中从所述分析软件库中选择相应的分析软件。
[0017]可选的,所述用户界面模块还用于获取并发送处理请求,所述处理请求用于指示从所述云端数据里中选择测序数据。
[0018]可选的,所述用户界面模块为网页WEB图形化用户界面模块。
[0019]可选的,所述指定的文章为整篇文章、整篇文章中的部分图表或整篇文章中的某一个图表中的一种。
[0020]另一方面,
[0021]本发明还提供了基于生物云平台的文章分析方法,包括:
[0022]接收用户请求并进行分析,所述用户请求用于指示从云端数据库中选择符合要求的文章作为指定的文章内容;
[0023]按照所述用户请求的指示将指定的文章内容以图表的形式进行展示;
[0024]根据所述图表呈现模块中展示的图表对测序数据进行分析,并将分析结果以图表形式在所述图表呈现模块进行展示。
[0025]可选的,根据所述图表呈现模块中展示的图表对测序数据进行分析之前还包括:
[0026]获取并发送处理请求,其中所述处理请求用于指示从所述云端数据里中选择测序数据。
[0027]可选的,根据所述图表呈现模块中展示的图表对测序数据进行分析包括:
[0028]以所述图表呈现模块中展示的图表作为模板,根据所述模板生成对所述测序数据进行分析的操作任务;
[0029]接收并执行所述操作任务,所述操作任务为分析软件模块对测序数据进行分析后生成的任务。
[0030]利用本发明提供的基于生物云平台的文章分析系统,用户可以根据指定的文章内容中所采用的逻辑分析方法对测序数据进行分析,最终以图表呈现。文章分析模式收录的文章分析方法极具代表性和可重复性并且与传统测序公司提供的服务有区别,其分析思路是基于成功发表的文章中的图表进行提炼,并且将测序数据处理成与指定的文章内容高度相似,可以直接发表的高质量图表形式,而且图表与文章中图表呈现形式高度相似,使得数据分析方式不再局限于传统业务线流程的单一性,极大地丰富了对数据的实用性,提高对测序数据的处理效率。
【专利附图】
【附图说明】
[0031]图1为实施例一提供的基于生物云平台的文章分析系统的组成结构示意图;
[0032]图2为实施例一中文章选择界面的示意图;
[0033]图3为实施例一中对指定的文章内容中摘要以及图表进行展示的示意图;
[0034]图4为实施例一中对测序数据按照指定的文章内容的分析思路进行分析得到的图表不意图;
[0035]图5为实施例一中用户请求以及处理请求参数输入的界面示意图;
[0036]图6为实施例一中图表呈现模块同时呈现指定的文章内容中的图表与测序数据采用同样的思路进行分析得到的图表对比图;
[0037]图7为实例二提供的基于生物云平台的文章分析方法的步骤流程图;
[0038]图8为实施例二中步骤S3的步骤流程图。
【具体实施方式】
[0039]下面结合附图和实施例,对本发明的【具体实施方式】作进一步详细描述。以下实施例用于说明本发明,但不用来限制本发明的范围。
[0040]实施例一
[0041]本实施例提供了基于生物云平台的文章分析系统,组成示意图如图1所示,包括:用户界面模块10、请求分析模块20、图表呈现模块30、综合分析模块40 ;
[0042]用户界面模块10用于获取并发送用户请求;
[0043]请求分析模块20用于接收用户请求并对用户请求进行分析,指示将指定的文章内容发送给图表呈现模块30;
[0044]图表呈现模块30用于接收指定的文章内容并将指定的文章以图表的形式进行展示;
[0045]综合分析模块40根据图表呈现模块30中展示的图表对测序数据进行分析,并将分析结果以图表形式在图表呈现模块30进行展示。
[0046]本实施例提供的文章分析系统属于云平台文章分析模式,是基于生物云平台的一种分析模块,旨在提供一种新的思路,利用已有的优秀的文章分析方法对测序数据进行分析,并且用高质量可直接发表的图表来进行展示,利用这种思路可以打破传统业务线流程的单一性,可以节省对测序数据的处理时间,从而提高处理效率。
[0047]可选的,本实施例的系统中还包括:
[0048]云端数据库50,用于存储测序数据和文章,用户请求用于指示从云端数据库50中选择符合要求的文章作为指定的文章内容。
[0049]可选的,综合分析模块40包括分析软件模块41和任务调度模块42,其中分析软件模块41用于以图表呈现模块30中展示的图表作为模板,根据模板生成对测序数据进行分析的操作任务;任务调度模块42,用于接收并执行操作任务,操作任务为分析软件模块41对测序数据进行分析后生成的任务。
[0050]可选的,综合分析软件40还包括分析软件库43,用于存储各种分析软件,任务调度模块42在执行操作任务过程中从分析软件库43选择相应的分析软件。
[0051]可选的,用户界面模块10还用于获取并发送处理请求,处理请求用于指示从云端数据里中选择测序数据。
[0052]可选的,用户界面模块10为网页WEB图形化用户界面模块,利用图形化的用户界面可以方便用户操作。
[0053]可选的,云端数据库50中的文章来自于nature,nature b1technology,naturegenetics, Cell, PLOS ONE,PNAS,Nucleic Acids Research 中任意一种期刊。云端数据库50中的文章还可以是除上述期刊以外其他生物医学期刊,已有的有关生物测序技术的文章,即对文章所在的平台不做具体限定。
[0054]WEB图形化用户界面模块、请求分析模式模块、图表呈现模块、分析软件模块这些模块操作均基于html5+CSS3+jS的前端页面和java服务器后台,任务调度模块接受到调度命令后,调动Perl、C、Python、R等计算机语言的服务器端脚本。用户可以根据所需选择按照整篇文章呈现或者只选择其中一部分,最终呈现与文章数量一致或相差无几,并且呈现高度相似的高质量图表。
[0055]按照云端数据库中的测序数据,根据指定的文章内容的思路来分析,并且结果图表在数量上与文章分析结果一致或相差无几;在呈现形式方面,表格的表头与文章中表格一致,图在图形上与文章保持一致。系统包括WEB图形化用户界面模块、请求分析模块、图表呈现模块、分析软件模块、任务调度模块,云端数据库,以及包含多种用于生物测序数据的分析软件库。用户将生物测序数据导入云端数据库,在请求分析模块中选择指定文章,WEB图形化用户界面模块接收用户请求后将指定的文章内容发送到图表呈现模块,图表呈现模块将其以图表形式进行展示,用户通过图表呈现模块浏览图表后,后根据需求选择分析软件,WEB图形化用户界面模块将请求传至分析软件模块,分析软件模块接收用户请求后,在分析软件库中选择相应软件,将其封装为操作任务并传递给任务调度模块,任务调度模块接收操作任务后,根据调度计划执行任务,并将运行结果返回给图表呈现模块,最终将展示的图表存储于云端数据库中。
[0056]以下以具体方案为例进行说明:
[0057]用户利用云平台文章分析模式平台对已有生物测序数据进行分析,需先进入如图2所示的文章选择界面,界面包括文章名称、作者以及对应的期刊,用户可以根据自己需求,选择所需的文章。进入所选的文章后,其呈现方式如图3,包括文章名称、作者、摘要以及文章中的所有图表,其图表被划分为不同模块,用户可以点击“Click to run the mainpipeline of the paper”运行出文章内容所有的图表,也可以切换模块对感兴趣的模块点击“Software for the step”进行模块分析,还可以点击感兴趣的图表,对单独的图表用自己所选的测序数据进行分析。图4呈现的是用户点击单一图片后出现的页面,点击左下角的“software for the graph”将跳转到图5中所示的程序参数填写页面。按照说明与案例,用户将测序数据与参数填写后,点击运行,运行成功后将得到如图6所示的分析结果,图6中左边为指定的文章内容已有的图表,右边为按照左边图表对用户所选的测序数据进行分析得到的图表。
[0058]利用本发明提供的基于生物云平台的文章分析系统,用户可以根据指定的文章内容中所采用的逻辑分析方法对测序数据进行分析,最终以图表呈现。文章分析模式收录的文章分析方法极具代表性和可重复性并且与传统测序公司提供的服务有区别,其分析思路是基于成功发表的文章中的图表进行提炼,并且将测序数据处理成与指定的文章内容高度相似,可以直接发表的高质量图表形式,而且图表与文章中图表呈现形式高度相似,使得数据分析方式不再局限于传统业务线流程的单一性,极大地丰富了对数据的实用性,提高对测序数据的处理效率。
[0059]实施例二
[0060]本实施例提供了基于生物云平台的文章分析方法,步骤流程如图7所示,包括以下步骤:
[0061]步骤S1、接收用户请求并进行分析,用户请求用于指示从云端数据库中选择符合要求的文章作为指定的文章内容。
[0062]步骤S2、按照用户请求的指示将指定的文章内容以图表的形式进行展示。
[0063]步骤S3、根据图表呈现模块中展示的图表对测序数据进行分析,并将分析结果以图表形式在图表呈现模块进行展示。
[0064]可选的,步骤S3根据图表呈现模块中展示的图表对测序数据进行分析之前还包括:
[0065]步骤S0、获取并发送处理请求,其中处理请求用于指示从云端数据里中选择测序数据。
[0066]可选的,步骤S3根据图表呈现模块中展示的图表对测序数据进行分析的步骤流程如图8所示,具体包括以下步骤:
[0067]步骤S31、以图表呈现模块中展示的图表作为模板,根据模板生成对测序数据进行分析的操作任务。
[0068]步骤S32、接收并执行操作任务,操作任务为分析软件模块41对测序数据进行分析后生成的任务。
[0069]利用本实施例提供的方法能够实现与实施例一相同的技术效果,此处不再赘述。
[0070]以上实施方式仅用于说明本发明,而并非对本发明的限制,有关【技术领域】的普通技术人员,在不脱离本发明的精神和范围的情况下,还可以做出各种变化和变型,因此所有等同的技术方案也属于本发明的范畴,本发明的专利保护范围应由权利要求限定。
【权利要求】
1.基于生物云平台的文章分析系统,其特征在于,包括:用户界面模块、请求分析模块、图表呈现模块、综合分析模块; 所述用户界面模块用于获取并发送用户请求; 所述请求分析模块用于接收所述用户请求并对所述用户请求进行分析,指示将指定的文章内容发送给所述图表呈现模块; 所述图表呈现模块用于接收所述指定的文章内容并将所述指定的文章以图表的形式进行展示; 所述综合分析模块根据所述图表呈现模块中展示的图表对测序数据进行分析,并将分析结果以图表形式在所述图表呈现模块进行展示。
2.根据权利要求1所述的系统,其特征在于,还包括: 云端数据库,用于存储测序数据和文章,所述用户请求用于指示从所述云端数据库中选择符合要求的文章作为指定的文章内容。
3.根据权利要求1所述的系统,其特征在于,所述综合分析模块包括分析软件模块和任务调度模块; 所述分析软件模块用于以所述图表呈现模块中展示的图表作为模板,根据所述模板生成对所述测序数据进行分析的操作任务; 所述任务调度模块用于接收并执行所述操作任务,所述操作任务为分析软件模块对测序数据进行分析后生成的任务。
4.根据权利要求3所述的系统,其特征在于,所述综合分析软件还包括分析软件库,用于存储各种分析软件,所述任务调度模块在执行所述操作任务过程中从所述分析软件库中选择相应的分析软件。
5.根据权利要求2所述的系统,其特征在于,所述用户界面模块还用于获取并发送处理请求,所述处理请求用于指示从所述云端数据里中选择测序数据。
6.根据权利要求1或5所述的系统,其特征在于,所述用户界面模块为网页WEB图形化用户界面模块。
7.根据权利要求1所述的系统,其特征在于,所述指定的文章为整篇文章、整篇文章中的部分图表或整篇文章中的某一个图表中的一种。
8.基于生物云平台的文章分析方法,其特征在于,包括: 接收用户请求并进行分析,所述用户请求用于指示从云端数据库中选择符合要求的文章作为指定的文章内容; 按照所述用户请求的指示将指定的文章内容以图表的形式进行展示; 根据所述图表呈现模块中展示的图表对测序数据进行分析,并将分析结果以图表形式在所述图表呈现模块进行展示。
9.根据权利要求8所述的方法,其特征在于,根据所述图表呈现模块中展示的图表对测序数据进行分析之前还包括: 获取并发送处理请求,其中所述处理请求用于指示从所述云端数据里中选择测序数据。
10.根据权利要求8所述的方法,其特征在于,根据所述图表呈现模块中展示的图表对测序数据进行分析包括: 以所述图表呈现模块中展示的图表作为模板,根据所述模板生成对所述测序数据进行分析的操作任务; 接收并执行所述操作任务,所述操作任务为分析软件模块对测序数据进行分析后生成的任务。
【文档编号】G06F19/28GK104462865SQ201410555021
【公开日】2015年3月25日 申请日期:2014年10月17日 优先权日:2014年10月17日
【发明者】郑洪坤, 刘戈, 刘东源 申请人:北京百迈客生物科技有限公司