载体推荐方法、系统、计算机存储介质及电子设备与流程

文档序号:32484589发布日期:2022-12-10 00:37阅读:67来源:国知局
载体推荐方法、系统、计算机存储介质及电子设备与流程

1.本发明涉及载体构建领域,更具体地,涉及一种载体推荐方法、载体推荐系统、计算机存储介质以及电子设备。


背景技术:

2.近些年来,随着现代生物技术突飞猛进的的发展,载体成为必不可少的关键。目前实验室能生产的载体多种多样,但是不能让客户更直接的设计出想要的载体,以及不能快速得到需求的载体有没有现货。


技术实现要素:

3.为解决上述技术问题,本发明提供一种载体推荐方法、载体推荐系统、计算机存储介质和电子设备,能够让用户快速判断载体库中是否存在满足需求的载体。
4.根据本发明第一方面实施例的载体推荐方法,包括以下步骤:s1、预设现货载体,形成载体库;s2、获取并识别用户的输入信息,当所述输入信息为基因时,判断所述基因是否符合第一条件,若符合所述第一条件,则执行步骤s3;s3、根据所述基因的属性进行基因搜索,得到与所述基因对应的基因信息;s4、根据所述基因信息获取与所述基因信息相匹配的转录本信息;s5、将所述转录本信息与所述载体库进行匹配,获取与所述转录本信息相匹配的匹配载体;s6、显示所述匹配载体。
5.根据本发明实施例的载体推荐方法,通过预设载体库,然后对用户输入的信息进行判断和匹配,在初步判断出载体库中存在与用户输入的信息相对应的载体之后,可以快速从载体库中获取与用户输入的信息相对应的载体,并且让用户知道该载体是否有现货,从而大大提高了用户的使用体验。
6.根据本发明的一个实施例,所述第一条件包括:所述载体库中具有与所述基因相匹配的转录本。
7.根据本发明的一个实施例,所述第一条件还包括:
8.所述基因的启动子为广泛性启动子,标记基因为常用标记基因,只有1个转录本;
9.所述基因的启动子为广泛性启动子,标记基因为常用标记基因,有1个转录本,有1个标准标签;
10.所述基因的启动子为广泛性启动子,标记基因为常用标记基因,有1个转录本,有两个或以上标准标签;
11.所述基因的启动子为广泛性启动子,标记基因为常用标记基因,有1个标准常用orf、1个常用连接子及1个转录本。
12.根据本发明的一个实施例,在步骤s3中,通过elasticsearch数据库进行基因搜索,以得到与所述基因对应的基因信息。
13.根据本发明的一个实施例,在步骤s5中,将所述转录本信息通过blast与所述载体库进行匹配。
14.根据本发明的一个实施例,所述方法还包括:s7、根据用户选择,确认是否需要选择显示的所述匹配载体;s8、对用户选择的所述匹配载体进行准确性检测。
15.根据本发明第二方面实施例的载体推荐系统,包括:载体库;信息识别模块,所述信息识别模块用于获取并识别用户的输入信息;判断模块,所述判断模块用于判断用户输入的基因是否符合第一条件;搜索模块,所述搜索模块根据所述基因的属性搜索并得到与所述基因对应的基因信息;第一匹配模块,所述第一匹配模块根据所述基因信息获取与所述基因信息相匹配的转录本信息;第二匹配模块,所述第二匹配模块将所述转录本信息与所述载体库进行匹配,获取与所述转录本信息相匹配的匹配载体;显示模块,所述显示模块用于显示所述匹配载体。
16.根据本发明的一个实施例,所述载体推荐系统还包括:选择模块,所述选择模块用于确认是否需要选择显示的所述匹配载体;检测模块,所述检测模块用于对用户选择的所述匹配载体进行准确性检测。
17.第三方面,本发明实施例提供一种计算机存储介质,包括一条或多条计算机指令,所述一条或多条计算机指令在执行时实现如上述实施例所述的方法。
18.根据本发明第四方面实施例的电子设备,包括存储器和处理器,所述存储器用于存储一条或多条计算机指令;所述处理器用于调用并执行所述一条或多条计算机指令,从而实现如上述任一实施例所述的方法。
19.本发明的附加方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本发明的实践了解到。
附图说明
20.本发明的上述和/或附加的方面和优点从结合下面附图对实施例的描述中将变得明显和容易理解,其中:
21.图1为本发明实施例的电子设备的示意图。
22.附图标记:
23.电子设备300;
24.存储器310;操作系统311;应用程序312;
25.处理器320;网络接口330;输入设备340;硬盘350;显示设备360。
具体实施方式
26.下面详细描述本发明的实施例,实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,仅用于解释本发明,而不能理解为对本发明的限制。
27.在本发明的描述中,需要理解的是,术语“中心”、“纵向”、“横向”、“长度”、“宽度”、“厚度”、“上”、“下”、“前”、“后”、“左”、“右”、“竖直”、“水平”、“顶”、“底”“内”、“外”、“顺时针”、“逆时针”、“轴向”、“径向”、“周向”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。此外,限定有“第一”、“第二”的特征可以明示或者隐含地包括一个或者更多个该特征。在本发明的
描述中,除非另有说明,“多个”的含义是两个或两个以上。
28.在本发明的描述中,需要说明的是,除非另有明确的规定和限定,术语“安装”、“相连”、“连接”应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或一体地连接;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通。对于本领域的普通技术人员而言,可以具体情况理解上述术语在本发明中的具体含义。
29.下面首先对本技术中所提到的专有名词进行解释。
30.premade vector:现货载体。
31.refseq transcript:转录本,一个基因可能有一个或者多个转录本,而且有可能每个转录本都会编码产生相应的蛋白。
32.pms:是库存系统的名称。
33.blast(basic local alignment search tool):是一套在蛋白质数据库或dna数据库中进行相bai似性比较的分析工具。blast程序能迅速与公开数据库进行相似性序列比较。blast结果中的得分是对一种对相似性的统计说明。
34.下面具体描述根据本发明实施例的载体推荐方法。
35.根据本发明实施例的载体推荐方法包括以下步骤:
36.s1、预设现货载体,形成载体库;
37.s2、获取并识别用户的输入信息,当所述输入信息为基因时,判断所述基因是否符合第一条件,若符合所述第一条件,则执行步骤s3;
38.s3、根据所述基因的属性进行基因搜索,得到与所述基因对应的基因信息;
39.s4、根据所述基因信息获取与所述基因信息相匹配的转录本信息;
40.s5、将所述转录本信息与所述载体库进行匹配,获取与所述转录本信息相匹配的匹配载体;
41.s6、显示所述匹配载体。
42.换句话说,根据本发明实施例的载体推荐方法在实施之前,需要首先预设现货载体,形成载体库,其中,预设的现货载体可以是实验室生产过的所有载体,或者可以直接从外部获取的载体等。在形成载体库之后,便可以获取用户在操作界面输入的信息,并且对输入信息进行识别。当识别到输入信息为基因的情况下,则初步判断该基因是否符合预设的第一条件,如果符合第一条件,说明该基因对应的载体在载体库中有记录。
43.在初步判断载体库中存在与用户输入的基因相对应的载体之后,可以根据基因的属性进行基因搜索,获得与该基因相对应的基因信息,进而获取与该基因信息相匹配的转录本信息。将转录本信息与载体库进行匹配,从而可以准确的获取到与转录本信息相对应的匹配载体,最终,可以将该匹配载体的信息在界面显示,供用户选择。
44.其中需要说明的是,根据本发明实施例的载体推荐方法可以应用于用户输入的信息为基因核苷酸序列的情况,也可以应用于用户输入的信息为载体的情况。当用户输入的信息为载体信息时,可以直接与载体库进行匹配,从而判断用户输入的载体是否属于实验室能够生产的载体。
45.而在更多的情况下,用户通常不知道自己需要什么样的载体,而是只能根据已知的核苷酸序列来进行搜索,由于作为使目的基因得到表达的基因载体可以有多种多样,启
动子是基因的一个组成部分,是一段dna序列,控制基因表达(转录)的起始时间和表达的程度。启动子就像“开关”,决定基因的活动。启动子由核苷酸组成,其本身并不控制基因活动,而是通过与称为转录因子的蛋白质结合而控制基因活动的。启动子与转录因子结合后,可被rna聚合酶识别,开始基因的转录。基因是携带有遗传信息的dna序列,由核苷酸组成。基因的表达分为转录和翻译两个相互独立但又紧密联系的阶段。
46.目的基因能通过翻译转录,得到产物,对于同一目的基因,可以有不同的表达载体。大多数基因有多个转录本,而且有可能每个转录本都会编码产生相应的蛋白,这样就有可能造成一个基因有多种功能。采用本发明实施例的载体推荐方法,则可以根据用户输入的核苷酸信息精准的向用户推荐用户可能所需要的载体。
47.由此,根据本发明实施例的载体推荐方法,通过预设载体库,然后对用户输入的信息进行判断和匹配,在初步判断出载体库中存在与用户输入的信息相对应的载体之后,可以快速从载体库中获取与用户输入的信息相对应的载体,并且让用户知道该载体是否有现货,从而大大提高了用户的使用体验。
48.根据本发明的一个实施例,所述第一条件包括:所述载体库中具有与所述基因相匹配的转录本。
49.进一步地,所述第一条件还包括:
50.所述基因的启动子为广泛性启动子,标记基因为常用标记基因,只有1个转录本;
51.所述基因的启动子为广泛性启动子,标记基因为常用标记基因,有1个转录本,有1个标准标签;
52.所述基因的启动子为广泛性启动子,标记基因为常用标记基因,有1个转录本,有两个或以上标准标签;
53.所述基因的启动子为广泛性启动子,标记基因为常用标记基因,有1个标准常用orf、1个常用连接子及1个转录本。
54.其中,pms库存放的载体可以是申请人生产过的所有的载体,有现货。其不是根据条件预设好载体在载体库,而是客户搜索基因后去判断有没有匹配搜索基因的refseq transcript以及符合abcd条件之一的载体。
55.筛选载体的条件如下:
56.a.启动子为广泛性启动子,标记基因为常用标记基因,只有1个refseq transcript;
57.b.启动子为广泛性启动子,标记基因为常用标记基因,有1个refseq transcript,有1个标准标签;
58.c.启动子为广泛性启动子,标记基因为常用标记基因,有1个refseq transcript,有两个或以上标准标签;
59.d.启动子为广泛性启动子,标记基因为常用标记基因,有1个标准常用orf+1个常用连接子+1个refseq transcript。
60.在本发明的一些具体实施方式中,在步骤s3中,通过elasticsearch数据库进行基因搜索,以得到与所述基因对应的基因信息。
61.也就是说,根据elasticsearch的数据库实现基因搜索,匹配到最符合的基因。通过elasticsearch的数据库得到基因的official gene symbol、ncbi gene id、gene type、
refseq transcript等相关的字段的数据,通过official gene symbol或者ncbi gene id或者refseq transcript等等都可以进行基因的匹配。
62.在步骤s5中,将所述转录本信息通过blast与所述载体库进行匹配。
63.具体地,根据基因的refseq transcript去blast pms的库存载体的序列。用户在搜索基因的时候,系统会根据基因的refseq transcript这个条件先使用blast(匹配序列工具)去pms匹配现有的载体的序列,从而找到匹配序列的载体。其中,携带不同转录本的基因会使用不同的载体。
64.例如,refseq transcript有一个:nm_007553.3序列如下:
65.atggtggccgggacccgctgtcttc标签tgttgctgcttccccaggtcctcctgggcggcgcggccggcctcattccagagctgggccgcaagaagttcgccgcggcatccagccgacccttgtcccggccttcggaagacgtcctcagcgaatttgagttgaggctgctcagcatgtttggcctgaagcagagacccacccccagcaaggacgtcgtggtgcccccctatatgc标签atctgtaccgcaggcactcaggccagccaggagcgcccgccccagaccaccggctggagagggcagccagccgcgccaacaccgtgcgcagcttccatcacgaagaagccgtggaggaacttccagagatgagtgggaaaacggcccggcgcttcttcttcaatttaagttctgtccccagtgacgagtttctcacatctgcagaactccagatcttccgggaacagatacaggaagctttgggaaacag标签tttccagcaccgaattaatatttatgaaattataaagcctgcagcagccaacttgaaatttcctgtgaccagactattggacaccaggt标签tgaatcagaacacaagtcagtgggagagcttcgacgtcaccccagctgtgatgcggtggaccacacagggacacaccaaccatgggtttgtggtggaagtggcccatt标签aggagaacccaggtgtctccaagagacatgtgaggat标签caggtctttgcaccaagatgaacacagctggtcacagataaggccattgc标签tgacttttggacatgatggaaaaggacatccgctccacaaacgagaaaagcgtcaagccaaacacaaacagcggaagcgcctcaagtccagctgcaagagacaccctttgtatgtggacttcagtgatgtggggtggaatgactggatcgtggcacctccgggctatcatgccttttactgccatggggagtgtccttttccccttgctgaccacctgaactccactaaccatgcca标签tgcagactctggtgaactctgtgaattccaaaatccctaaggcatgctgtgtccccacagagctcagcgcaatctccatgttgtacc标签atgaaaatgaaaaggttgtgctaaaaaattatcaggacatggttgtggagggctgcgggtgtcgt标签
66.遍历refseq transcript,获取对应的序列。
67.调用blast接口,传入获取的refseq transcript的序列,假如百分之百匹配,就返回相关内容,反之,返回空。
68.可选地,根据本发明的一个实施例,载体推荐方法还包括:
69.s7、根据用户选择,确认是否需要选择显示的所述匹配载体;
70.s8、对用户选择的所述匹配载体进行准确性检测。
71.也就是说,包含用户输入的基因序列且符合一定条件的载体展示在页面的premade vector模块中。通过premade vector的条件去判断匹配得到的载体,就可以获取符合premade vector条件的载体,搜索基因符合条件的载体就会展示在页面,不符合条件的该模块就不会显示。用户便可以根据自己的需求直接选择premade vector。
72.对于匹配载体的准确性检测,可以是由系统自动检测,也可以交由后台,由专人进行检测。
73.根据本发明实施例的载体推荐系统包括:载体库、信息识别模块、判断模块、搜索模块、第一匹配模块、第二匹配模块和显示模块。
74.其中,所述信息识别模块用于获取并识别用户的输入信息,所述判断模块用于判
断用户输入的基因是否符合第一条件,所述搜索模块根据所述基因的属性搜索并得到与所述基因对应的基因信息,所述第一匹配模块根据所述基因信息获取与所述基因信息相匹配的转录本信息,所述第二匹配模块将所述转录本信息与所述载体库进行匹配,获取与所述转录本信息相匹配的匹配载体,所述显示模块用于显示所述匹配载体。
75.可选地,根据本发明实施例的载体推荐系统还可以包括:选择模块和检测模块。
76.其中,所述选择模块用于确认是否需要选择显示的所述匹配载体,所述检测模块用于对用户选择的所述匹配载体进行准确性检测。
77.由此,根据本发明实施例的载体推荐系统,通过预设载体库,然后对用户输入的信息进行判断和匹配,在初步判断出载体库中存在与用户输入的信息相对应的载体之后,可以快速从载体库中获取与用户输入的信息相对应的载体,并且让用户知道该载体是否有现货,从而大大提高了用户的使用体验。
78.此外,本发明还提供一种计算机存储介质,计算机存储介质包括一条或多条计算机指令,一条或多条计算机指令在执行时实现上述任一的载体推荐方法。
79.也就是说,计算机存储介质存储有计算机程序,计算机程序被处理器运行时,使得处理器执行上述任一的载体推荐方法。
80.如图1所示,本发明实施例提供了一种电子设备300,包括存储器310和处理器320,所述存储器310用于存储一条或多条计算机指令,所述处理器320用于调用并执行所述一条或多条计算机指令,从而实现上述任一所述的方法。
81.也就是说,电子设备300包括:处理器320和存储器310,在所述存储器310中存储有计算机程序指令,其中,在所述计算机程序指令被所述处理器运行时,使得所述处理器320执行上述任一所述的方法。
82.进一步地,如图1所示,电子设备300还包括网络接口330、输入设备340、硬盘350、和显示设备360。
83.上述各个接口和设备之间可以通过总线架构互连。总线架构可以是可以包括任意数量的互联的总线和桥。具体由处理器320代表的一个或者多个中央处理器(cpu),以及由存储器310代表的一个或者多个存储器的各种电路连接在一起。总线架构还可以将诸如外围设备、稳压器和功率管理电路等之类的各种其它电路连接在一起。可以理解,总线架构用于实现这些组件之间的连接通信。总线架构除包括数据总线之外,还包括电源总线、控制总线和状态信号总线,这些都是本领域所公知的,因此本文不再对其进行详细描述。
84.所述网络接口330,可以连接至网络(如因特网、局域网等),从网络中获取相关数据,并可以保存在硬盘350中。
85.所述输入设备340,可以接收操作人员输入的各种指令,并发送给处理器320以供执行。所述输入设备340可以包括键盘或者点击设备(例如,鼠标,轨迹球(trackball)、触感板或者触摸屏等。
86.所述显示设备360,可以将处理器320执行指令获得的结果进行显示。
87.所述存储器310,用于存储操作系统运行所必须的程序和数据,以及处理器320计算过程中的中间结果等数据。
88.可以理解,本发明实施例中的存储器310可以是易失性存储器或非易失性存储器,或可包括易失性和非易失性存储器两者。其中,非易失性存储器可以是只读存储器(rom)、
可编程只读存储器(prom)、可擦除可编程只读存储器(eprom)、电可擦除可编程只读存储器(eeprom)或闪存。易失性存储器可以是随机存取存储器(ram),其用作外部高速缓存。本文描述的装置和方法的存储器310旨在包括但不限于这些和任意其它适合类型的存储器。
89.在一些实施方式中,存储器310存储了如下的元素,可执行模块或者数据结构,或者他们的子集,或者他们的扩展集:操作系统311和应用程序312。
90.其中,操作系统311,包含各种系统程序,例如框架层、核心库层、驱动层等,用于实现各种基础业务以及处理基于硬件的任务。应用程序312,包含各种应用程序,例如浏览器(browser)等,用于实现各种应用业务。实现本发明实施例方法的程序可以包含在应用程序312中。
91.本发明上述实施例揭示的方法可以应用于处理器320中,或者由处理器320实现。处理器320可能是一种集成电路芯片,具有信号的处理能力。在实现过程中,上述方法的各步骤可以通过处理器320中的硬件的集成逻辑电路或者软件形式的指令完成。上述的处理器320可以是通用处理器、数字信号处理器(dsp)、专用集成电路(asic)、现成可编程门阵列(fpga)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件,可以实现或者执行本发明实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合本发明实施例所公开的方法的步骤可以直接体现为硬件译码处理器执行完成,或者用译码处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器,闪存、只读存储器,可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器310,处理器320读取存储器310中的信息,结合其硬件完成上述方法的步骤。
92.可以理解的是,本文描述的这些实施例可以用硬件、软件、固件、中间件、微码或其组合来实现。对于硬件实现,处理单元可以实现在一个或多个专用集成电路(asic)、数字信号处理器dsp)、数字信号处理设备(dspd)、可编程逻辑设备(pld)、现场可编程门阵列(fpga)、通用处理器、控制器、微控制器、微处理器、用于执行本技术所述功能的其它电子单元或其组合中。
93.对于软件实现,可通过执行本文所述功能的模块(例如过程、函数等)来实现本文所述的技术。软件代码可存储在存储器中并通过处理器执行。存储器可以在处理器中或在处理器外部实现。
94.具体地,处理器320还用于读取所述计算机程序,执行上述任一所述的方法。
95.在本技术所提供的几个实施例中,应该理解到,所揭露方法和装置,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
96.另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理包括,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能单元的形式实现。
97.上述以软件功能单元的形式实现的集成的单元,可以存储在一个计算机可读取存
储介质中。上述软件功能单元存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述收发方法的部分步骤。而前述的存储介质包括:u盘、移动硬盘、只读存储器(read-only memory,简称rom)、随机存取存储器(random access memory,简称ram)、磁碟或者光盘等各种可以存储程序代码的介质。
98.以上所述是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明所述原理的前提下,还可以作出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1