一种基于云架构的基因数据服务系统及方法与流程

文档序号:17933631发布日期:2019-06-15 01:08阅读:219来源:国知局
一种基于云架构的基因数据服务系统及方法与流程

本发明涉及基因数据服务领域,具体而言,涉及一种基于云架构的基因数据服务系统及方法。



背景技术:

美国ibm公司于2007年底宣布的云计算计划,云计算(或简称“云”)是一种可随时随地使用又非常便宜,且具有无限存贮与计算能力的服务设施。

云计算借鉴了传统分布式计算的思想,并具有如下特点:

(1)弹性服务。服务的规模可快速伸缩,以自动适应业务负载的动态变化。

(2)资源池化。资源以共享资源池的方式统一管理,利用虚拟化技术,将资源分享给不同用户。

(3)按需服务。以服务的形式根据用户需求为用户自动分配应用程序、数据存储、基础设施等资源。

(4)服务可计费。根据用户的资源使用量情况进行服务计费。

(5)泛在接入。用户可以利用各种终端设备(如笔记本电脑、智能手机等)随时随地通过网络访问云计算服务。

随着信息技术的发展,知识产权保护也日益得到各方的高度重视。大数据时代,数据即资产,如何将公司已有的数据资源加以保护和转化为服务也逐渐得到世界各国的认同,而云计算的发展为这种商业模式提供契机,即数据即服务。数据使用方通过购买的方式来获取数据,省去了数据采集、数据整理等诸多不便,在便捷自身的同时,也提高了数据利用效率。

随着人类社会的不断发展,生命科技相关各行业越来越受到人们的关注,它包括一系列的重要动植物、人类健康、微生物、海洋生物、生物能源等基因组的研究,基因科技可以造福人类,促进生物经济产业的蓬勃发展。这些主要涉及基因、蛋白质测序等工作,目前的基因、蛋白质测序等工作,在测序、数据整理等工作完成后,获得的基因数据可以提供用户使用,但目前对于基因数据,存在用户获取数据不全面、不准确,为后续的研究过程带来一定的阻碍、或研究结果产生较大误差,因此实有必要提出一种技术手段,以解决上述用获取数据不全面、不准确问题。



技术实现要素:

本发明的目的在于提供一种基于云架构的基因数据服务系统及方法,以克服上述现有技术存在的不足,以为用户提供全面准确的基因数据。

为实现上述目的,本发明提出一种基于云架构的基因数据服务系统,包括用于输入用户所需基因数据信息的用户需求模块、用于存储基因的数据存储模块、用于根据用户需求筛选所需基因数据的数据处理模块、用于反馈所选基因是否全面、准确的用户反馈模块,以及用于根据用户需要对系统处理模块进行更新的更新模块。

进一步地,所述用户需求模块与pc端连接,用于获取用户需求,用户可以按照生物种类ci的不同进行基因筛选,例如动物基因、植物基因和微生物基因;可以按照基因结构的不同进行筛选,如基因长度为lj的基因、含有某种碱基的数量nm的基因,m为某种碱基、包含某段核苷酸序列qk的基因,或是根据某一基因位点上的碱基对rs查找相关基因,s为基因位点,所述用户需求模块还与所述数据处理模块连接,用于将用户输入的基因需求传输至数据处理模块。

进一步地,所述数据存储模块与所述数据处理模块连接,用于储存基因库所述数据存储模块包括云端存储服务器,可以实现智能化存储。

进一步地,所述云端存储服务器采用代理重加密。

进一步地,所述数据处理模块还包括数据收发单元,用于接收更新数据及发送所需数据。

进一步地,所述数据处理模块还包括数据异常诊断单元,用于检测所述云端存储器内的数据异常,并记录数据日志,发送给系统管理员。

进一步地,所述数据日志用于记录异常数据,存储异常文件。

进一步地,所述数据处理模块与所述用户需求模块连接,用于接收上述用户需求,并对所述数据存储模块中的基因数据进行分类处理,筛选出满足用户需求的基因数据以提供给用户,其具体步骤如下:

首先,所述数据存储模块内的基因按照生物种类、基因长度、含有某种碱基的数量、包含某段核苷酸序列、及某一基因位点上的碱基对进行分类,大大降低了筛选的复杂程度,简化筛选过程。

其次,所述数据处理模块根据用户提供的生物种类ci、基因长度为lj、含有碱基m的数量nm、包含某段核苷酸序列qk及某一基因位点s上的碱基对rs中的一种或多种基因信息的组合,建立需求模型:

f=(ci,lj,nm,qk,rs)(1)

其中,f表示需求基因函数模型,ci表示生物种类,分为动物、植物和微生物,i表示序列号,每种生物分别对应一个序号,1表示动物,2表示植物,3表示微生物,lj表示待寻找或者存储的基因长度,j为大于0的自然数,代表碱基对的数量,nm表示某种碱基数量,m表示a、t、c、g四种碱基类型,qk表示某段核苷酸序列,k表示该段核苷酸序列排列方式的序号,所述核苷酸序列的排列方式有种,每种排列方式对应一种序号,rs表示基因位点s上的碱基对,所述基因位点包括第一基因位点、第二基因位点、第三基因位点,以此类推。

进一步地,所述用户反馈模块分别与所述数据处理模块和更新模块连接,用于为用户提供平台以反馈获取的基因数据的质量,例如基因数据不够全面、存在多余的无用的基因数据,或是需要更加细化的语境下的基因数据,用户在使用过程中遇到任何问题都可以通过用户反馈模块进行反馈,并将反馈内容发送至更新模块。

进一步地,所述更新模块分别与用户反馈模块和所述数据处理模块连接,用于接收用户反馈模块的反馈信息并根据用户需要预调整基因匹配精度、增加基因所处语境的划分,并且试运行所述基因数据服务系统;

进一步地,调整前后系统分别筛选出b个基因;

所述调整前系统筛选出的b个基因两两对比,并计算出两基因中重合的碱基对占碱基对总数的比值,即为两基因的重合度xij,i和j分别表示所筛选出的基因序号;

所述调整后系统筛选出的b个基因两两对比,并计算出两基因中重合的碱基对占碱基对总数的比值,即为两基因的重合度yij,i和j分别表示所筛选出的基因序号;计算调整后系统筛选出的基因对比调整前系统筛选出的基因的相关度c:

其中,xij表示调整前系统筛选出的调整前的第i个和第j个基因序列的重合度,yij表示调整后的第i个和第j个基因的重合度,a表示所述基因数据库的数据量,b表示调整前后系统筛选出的基因数据量;

所述调整后系统筛选出的基因对比调整前系统筛选出的基因的相关度c若大于0.6,,则更新模块对数据处理模块进行调整,反之则保持调整前系统继续运行。

基于上述云架构的基因数据服务系统,本发明提出一种基于云架构的基因数据服务方法,其步骤如下:

步骤a,用户根据自身需求输入所需基因的数据信息;

步骤b,所述数据处理模块接收所需基因的数据信息,所述数据存储模块内的基因按照生物种类、基因长度、含有某种碱基的数量、包含某段核苷酸序列、及某一基因位点上的碱基对进行分类;

步骤c,通过需求基因函数筛选出所需基因;

步骤d,用户获取所需基因后,对存在问题进行反馈,反馈内容发送至更新模块;

步骤e,更新模块根据用户反馈内容进行预调整和试运行调整后的系统,若调整后系统所筛选基因相对于调整前的相关度大于0.6,则对数据处理模块进行更新。

与现有技术相比,本发明的有益效果在于所述数据处理模块为云端存储服务器,可以实现智能化存储,通过虚拟存储解决了硬件存储空间不足的问题,所有存储资源整合在一起,提高了存储空间的利用率,并且存储设备升级不会导致服务的中断,也避免了硬件损坏造成的数据损失。

尤其,所述数据处理模块根据用户提供的生物种类ci、基因长度为lj、含有碱基m的数量nm、包含某段核苷酸序列qk及某一基因位点s上的碱基对rs中的一种或多种基因信息的组合,建立需求函数模型,能够根据用户需求准确筛选出所需基因。本发明中的基因需求函数模型,能够根据特定碱基对数量的基因需求进行筛选,在筛选过程中,能够点对点定位,满足上述模型中的各个条件的基因序列都能筛选出。并且,数据处理模块根据筛选出的基因序列,两两进行重合度的对比,也即,根据基因序列每个位置上的碱基对是否相同,判定为重合或者不重合,能够评价筛选基因的准确程度。

进一步地,所述反馈模块直接与用户对接,能够及时发现所述数据处理模块的处理过程中的问题,便于及时改进,使系统不断完善,从而提供更加全面、精确的基因数据,进一步提高用户的满意度。本发明所述调整前系统筛选出的b个基因两两对比,并计算出两基因中重合的碱基对占碱基对总数的比值,即为两基因的重合度xij,i和j分别表示所筛选出的基因序号;所述调整后系统筛选出的b个基因两两对比,并计算出两基因中重合的碱基对占碱基对总数的比值,即为两基因的重合度yij,i和j分别表示所筛选出的基因序号;计算调整后系统筛选出的基因对比调整前系统筛选出的基因的相关度c。

进一步地,所述更新模块对用户反馈信息对系统进行预调整和试运行,避免了因用户提供错误的反馈信息而对系统造成负面作用,保证了系统的稳定性。

附图说明

通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本发明的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:

图1为本发明实施例基于云架构的基因数据服务系统的系统结构图;

图2为本发明实施例基于云架构的基因数据服务方法的流程图。

具体实施方式

下面参照附图来描述发明的优选实施方式。本领域技术人员应当理解的是,这些实施方式仅仅用于解释发明的技术原理,并非在限制发明的保护范围。

需要说明的是,在发明的描述中,术语“上”、“下”、“左”、“右”、“内”、“外”等指示的方向或位置关系的术语是基于附图所示的方向或位置关系,这仅仅是为了便于描述,而不是指示或暗示所述装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对发明的限制。

此外,还需要说明的是,在发明的描述中,除非另有明确的规定和限定,术语“安装”、“相连”、“连接”应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或一体地连接;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通。对于本领域技术人员而言,可根据具体情况理解上述术语在发明中的具体含义。

请参阅图1所示,本发明实施例提出一种基于云架构的基因数据服务系统,包括用于输入用户所需基因数据信息的用户需求模块、用于存储基因的数据存储模块、用于根据用户需求筛选所需基因数据的数据处理模块、用于反馈所选基因是否全面、准确的用户反馈模块,以及用于根据用户需要对系统处理模块进行更新的更新模块。

具体而言,所述用户需求模块与pc端连接,用于获取用户需求,用户可以按照生物种类ci的不同进行基因筛选,如动物基因、植物基因和微生物基因;可以按照基因结构的不同进行筛选,如基因长度为lj的基因、含有某种碱基的数量nm的基因,m为某种碱基、包含某段核苷酸序列qk的基因,或是根据某一基因位点上的碱基对rs查找相关基因,s为基因位点,所述用户需求模块还与所述数据处理模块连接,用于将用户输入的基因需求传输至数据处理模块。

具体而言,所述数据存储模块与所述数据处理模块连接,用于储存基因库,所述数据存储模块包括云端存储服务器,可以实现智能化存储,通过虚拟化存储解决了硬件存储空间不足的问题,所有存储资源整合在一起,提高了存储空间的利用率,并且存储设备升级不会导致服务的中断,也避免了硬件损坏造成的数据损失。

具体而言,所述云端存储服务器采用代理重加密,能够解决用户在数据共享方面的不便,在云端进行的数据密文转换可以有效的减轻用户端频繁释放和获取密码的负担,并强化了云端数据的可靠性和保密性。

具体而言,所述数据处理模块还包括数据收发单元,用于接收更新数据及发送所需数据。

具体而言,所述数据处理模块还包括数据异常诊断单元,用于检测所述云端存储器内的数据异常,并记录数据日志,发送给系统管理员。具体而言,所述数据日志用于记录异常数据,存储异常文件。

具体而言,所述数据处理模块与所述用户需求模块连接,用于接收上述用户需求,并对所述数据存储模块中的基因数据进行分类处理,筛选出满足用户需求的基因数据以提供给用户,其具体步骤如下:

首先,所述数据存储模块内的基因按照生物种类、基因长度、含有某种碱基的数量、包含某段核苷酸序列、及某一基因位点上的碱基对进行分类,大大降低了筛选的复杂程度,简化筛选过程。

其次,所述数据处理模块根据用户提供的生物种类ci、基因长度为lj、含有碱基m的数量nm、包含某段核苷酸序列qk及某一基因位点s上的碱基对rs中的一种或多种基因信息的组合,建立需求模型:

f=(ci,lj,nm,qk,rs)(1)

其中,f表示需求基因函数模型,ci表示生物种类,分为动物、植物和微生物,i表示序列号,每种生物分别对应一个序号,1表示动物,2表示植物,3表示微生物,lj表示待寻找或者存储的基因长度,j为大于0的自然数,代表碱基对的数量,nm表示某种碱基数量,m表示a、t、c、g四种碱基类型,qk表示某段核苷酸序列,k表示该段核苷酸序列排列方式的序号,所述核苷酸序列的排列方式有种,每种排列方式对应一种序号,rs表示基因位点s上的碱基对,所述基因位点包括第一基因位点、第二基因位点、第三基因位点,以此类推。比如选择动物类基因,基因长度为8个碱基对,含有3个碱基c,且包含核苷序列agc,第一基因位点的碱基对为a-t,则根据此需求建立的需求函数模型为f=(c1,l8,3c,q1,r1)以找到对应的基因序列。

具体而言,所述用户反馈模块分别与所述数据处理模块和更新模块连接,用于为用户提供平台以反馈获取的基因数据的质量,例如基因数据不够全面、存在多余的无用的基因数据,或是需要更加细化的语境下的基因数据,用户在使用过程中遇到任何问题都可以通过用户反馈模块进行反馈,并将反馈内容发送至更新模块。

具体而言,所述更新模块分别与用户反馈模块和所述数据处理模块连接,用于接收用户反馈模块的反馈信息并根据用户需要预调整基因匹配精度、增加基因所处语境的划分,并且试运行所述基因数据服务系统;

调整前后系统分别筛选出b个基因;

所述调整前系统筛选出的b个基因两两对比,并计算出两基因中重合的碱基对占碱基对总数的比值,即为两基因的重合度xij,i和j分别表示所筛选出的基因序号;

所述调整后系统筛选出的b个基因两两对比,并计算出两基因中重合的碱基对占碱基对总数的比值,即为两基因的重合度yij,i和j分别表示所筛选出的基因序号;计算调整后系统筛选出的基因对比调整前系统筛选出的基因的相关度c:

其中,xij表示调整前系统筛选出的调整前的第i个和第j个基因序列的重合度,yij表示调整后的第i个和第j个基因的重合度,a表示所述基因数据库的数据量,b表示调整前后系统筛选出的基因数据量;

所述调整后系统筛选出的基因对比调整前系统筛选出的基因的相关度c若大于0.6,则更新模块对数据处理模块进行调整,反之则保持调整前系统继续运行

从而使系统在不断更新中逐渐完善,提供更加全面、准确的基因数据服务。

请参阅图2所示,基于上述云架构的基因数据服务系统,本发明实施例提出一种基于云架构的基因数据服务方法,其步骤如下:

步骤a,用户根据自身需求输入所需基因的数据信息;

步骤b,所述数据处理模块接收所需基因的数据信息,所述数据存储模块内的基因按照生物种类、基因长度、含有某种碱基的数量、包含某段核苷酸序列、及某一基因位点上的碱基对进行分类;

步骤c,通过需求基因函数筛选出所需基因;

步骤d,用户获取所需基因后,对存在问题进行反馈,反馈内容发送至更新模块;

步骤e,更新模块根据用户反馈内容进行预调整和试运行调整后的系统,若调整后系统所筛选基因相对于调整前的相关度大于0.6,则对数据处理模块进行更新。

尽管已经示出和描述了本发明的实施例,对于本领域的普通技术人员而言,可以理解在不脱离本发明的原理和精神的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由所附权利要求及其等同物限定。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1