1.一种预测sirna沉默效率的方法,其特征在于:在输入层设置特征提取模块对数据集进行特征提取和处理,使用词向量预训练模型获得序列词向量,并结合循环神经网络提取序列的潜在特征,再利用逻辑回归模块计算得到sirna沉默效率的预测结果。
2.根据权利要求1所述预测sirna沉默效率的方法,其特征在于:在输入层使用多模motif输入,所述词向量预训练模型至少为word2vec模型、glove模型、elmo模型、bert模型中的一种,且循环神经网络中引入有注意力模型。
3.根据权利要求1所述预测sirna沉默效率的方法,其特征在于包括步骤:
s1、在输入层将包含augct五种碱基、长度介于19bp至29bp之间且已知的sirna序列及对应的沉默效率整合构成数据集;
s2、将数据集中各个sirna序列分别提取特征,令一模motif为g、c、a、t或u的单个碱基,二模motif为双连续碱基,三模motif为三连续碱基,进行多模motif输入;
s3、在embedding层对提取的特征进行编码,并使用数据集训练word2vec模型,将前步训练模型的输入embedding权重作为后续模型的embedding编码值;
s4、在lstmattention层将编码好的sirna序列特征输入到lstm循环神经网络中进行模型训练,通过反向传播在训练阶段调整参数,并通过注意力模型更新每个位置的权重参数,逐一与sirna序列对应位置原始生成的隐状态相乘后累加,得到处理结果;
s5、将处理结果输入逻辑回归模块的多层感知机,得到sirna序列沉默效率的预测模型。
4.根据权利要求1或2所述预测sirna沉默效率的方法,其特征在于:得出sirna序列沉默效率的预测模型后,还包括s6、通过人机交互模块调用预测模型,将待预测sirna序列直接输入并返回得到预测结果。
5.根据权利要求3所述预测sirna沉默效率的方法,其特征在于:所述人机交互模块为web页面、android软件、微信小程序或pc端应用程序。
6.根据权利要求2所述预测sirna沉默效率的方法,其特征在于:步骤s3中对单个碱基、双连续碱基、三连续碱基分别按照固定顺序将序列转换成数字编码。
7.根据权利要求2所述预测sirna沉默效率的方法,其特征在于:步骤s3中训练word2vec模型可选为sikp-gram模型或cbow模型。
8.根据权利要求2所述预测sirna沉默效率的方法,其特征在于:所述lstm循环神经网络为单层lstm网络或多层lstm网络,且每层lstm网络单向或双向。
9.根据权利要求2所述预测sirna沉默效率的方法,其特征在于:所述注意力模型选为全局注意力,包含general,dot-product,concat-product三种模型,且全局注意力计算权重分数的公式为:
10.根据权利要求9所述预测sirna沉默效率的方法,其特征在于:所述全连接层之间还设有至少包括sigmoid,relu,leaky_relu,tanh,elu,maxout中的一种激活函数。