信息处理程序、信息处理方法和信息处理装置与流程

文档序号:36504674发布日期:2023-12-28 09:27阅读:48来源:国知局
信息处理程序的制作方法

本发明涉及信息处理程序等。


背景技术:

1、正在不断进行人类基因组的碱基序列的研究,已知构成人类基因组的蛋白质的种类是3万种。另一方面,认为微生物等的蛋白质的种类是无限的,从目标碱基序列中发现大量重复表达的特异性密码子序列。例如,重复表达的特异性密码子序列被称为结构域、基序等,研究明白该特异性密码子序列是重要的。

2、结构域在蛋白质的序列、构造的一部分中相对于其他部分独立地进化,以承担功能的方式存在。基序的特征是具有对称性的密码子序列。图17是示出基序的一例的图。如图17所示,在基序中存在β发夹1a、希腊键1b、β桶1c(孔蛋白、脂质运载蛋白)等。折叠是如下的物理过程:蛋白质链通过迅速且具有再现性的方法获取其原本的三维构造,通常是生物学功能构象(立体构造)。

3、例如,作为从碱基序列中检索基序的技术,存在将具有汉明距离的置换碱基序列作为关键字来检索基序的现有技术。此外,存在如下现有技术:从dna(deoxyribonucleicacid:脱氧核糖核酸)序列的转录开始点的上游提取直向同源物候选的多个序列截面,对基序候选进行判定。

4、现有技术文献

5、专利文献

6、专利文献1:国际公开第2005/096208号

7、专利文献2:国际公开第2020/049748号

8、专利文献3:日本特开2014-112307号公报


技术实现思路

1、发明要解决的问题

2、然而,在上述现有技术中,存在如下问题:无法高效地进行重复表达的密码子序列的搜索。

3、这里,dna和rna(ribonucleic acid:核糖核酸)的碱基为4种,由“a”、“g”、“c”、“t”或“u”的记号表示。此外,3个碱基序列为一组而决定20种氨基酸。各个氨基酸由“a”~“y”的记号表示。图18是示出氨基酸与碱基及密码子之间的关系的图。1组3个碱基序列被称为“密码子”。通过各碱基排列而决定密码子,在决定了密码子时,氨基酸被决定。

4、如图18所示,一个氨基酸对应多种密码子。例如,氨基酸“丙氨酸(ala)”与密码子“gcu”、“gcc”、“gca”、“gcg”对应,密码子“gcu”、“gcc”、“gca”、“gcg”实质上是同一密码子。然而,在现有技术中,无法应对该密码子的特性,无法高效地进行重复表达的密码子序列的搜索。

5、在一个方面,目的在于,提供能够高效地进行重复表达的密码子序列的搜索的信息处理程序、信息处理方法和信息处理装置。

6、用于解决问题的手段

7、在第1方案中,使计算机执行如下处理。计算机针对表示同一氨基酸的碱基序列的不同的多个密码子,基于表示密码子文件上的多个密码子的位置的第1索引,运算表示密码子文件上的氨基酸的位置的第2索引。计算机基于第2索引,分别确定密码子文件中重复表达的氨基酸序列的位置。计算机确定与密码子文件中重复表达的各氨基酸序列的位置对应的各密码子序列,作为分别具有同源性的密码子序列。

8、发明的效果

9、能够高效地进行重复表达的密码子序列的搜索。



技术特征:

1.一种信息处理程序,其特征在于,使计算机执行如下处理:

2.根据权利要求1所述的信息处理程序,其特征在于,

3.根据权利要求1所述的信息处理程序,其特征在于,

4.根据权利要求1所述的信息处理程序,其特征在于,

5.一种信息处理方法,其是由计算机执行的信息处理方法,其特征在于,

6.根据权利要求5所述的信息处理方法,其特征在于,

7.根据权利要求5所述的信息处理方法,其特征在于,

8.根据权利要求5所述的信息处理方法,其特征在于,

9.一种信息处理装置,其特征在于,

10.根据权利要求9所述的信息处理装置,其特征在于,

11.根据权利要求9所述的信息处理装置,其特征在于,

12.根据权利要求9所述的信息处理装置,其特征在于,


技术总结
信息处理装置针对表示同一氨基酸的碱基序列的不同的多个密码子,基于表示密码子文件上的多个密码子的位置的第1索引,运算表示密码子文件上的氨基酸的位置的第2索引。信息处理装置基于第2索引,分别确定在密码子文件中重复表达的氨基酸序列的位置。信息处理装置确定与密码子文件中重复表达的各氨基酸序列的位置对应的各密码子序列,作为分别具有同源性的密码子序列。

技术研发人员:片冈正弘,永浦良平,茂栉薰
受保护的技术使用者:富士通株式会社
技术研发日:
技术公布日:2024/1/15
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1