本技术实施例涉及计算机领域,具体而言,涉及一种缓存数据的预测方法和装置、存储介质及电子设备。
背景技术:
1、随着数据量的增长,数据存储系统的容量和性能也在快速的增长,特别是当前企业需要大规模的数据中心以支撑业务的数字化进行与企业数据存储,巨量的数据存储需求对于存储设备的性能和可靠性等方面都提出了更高的要求。由于固态硬盘在性能、可靠性和功耗等方面有着巨大优势,因而固态硬盘在数据存储领域中得到了广泛的应用。
2、在现有的固态硬盘技术中,需要通过关注用户访问数据的线性特征来预测未来可能需要的数据并提前将其加载到缓存中,而在实际缓存预测场景中,用户的访问模式可能是稀疏的并且处于长期的、动态变化的过程,故而用户所访问的数据会包含非线性的特征,而仅关注用户访问数据的线性特征无法全面的提取用户访问数据的特征,导致预测数据的精度受到限制,也就是说,相关技术中对缓存数据进行预测的过程中存在准确率低的问题。
3、针对上述的问题,目前尚未提出有效的解决方案。
技术实现思路
1、本技术实施例提供了一种缓存数据的预测方法和装置、存储介质及电子设备,以至少解决相关技术中对缓存数据进行预测的过程中存在的准确率低的问题。
2、根据本技术的一个实施例,提供了一种缓存数据的预测方法,包括:获取候选数据向量,其中,候选数据向量中包括的向量元素用于指示历史数据访问操作的数据对象;根据候选数据向量执行向量自回归操作,得到线性自回归矩阵和非线性自回归矩阵;将线性自回归矩阵和非线性自回归矩阵输入目标数据预测模型,其中,目标数据预测模型是一种深度神经网络模型,目标数据预测模型中包括多个依次堆叠的特征提取层,多个特征提取层中的第一特征提取层用于对非线性自回归矩阵进行处理,得到第一特征矩阵,多个特征提取层中的第二特征提取层用于对第二特征矩阵进行处理,得到待输入下一个特征提取层的第一特征矩阵,第一特征提取层为多个特征提取层中的第一个特征提取层,第二特征提取层为多个特征提取层中除第一特征提取层之外的其他特征提取层,第二特征矩阵为根据上一个特征提取层处输出的第一特征矩阵与线性自回归矩阵连接得到的;根据目标数据预测模型的输出结果,从候选数据向量中确定出目标向量元素,并将目标向量元素指示的数据对象确定为目标数据对象。
3、根据本技术实施例的另一个方面,还提供了一种缓存数据的预测装置,包括:向量获取单元,用于获取候选数据向量,其中,候选数据向量中包括的向量元素用于指示历史数据访问操作的数据对象;向量自回归单元,用于根据候选数据向量执行向量自回归操作,得到线性自回归矩阵和非线性自回归矩阵;特征处理单元,用于将线性自回归矩阵和非线性自回归矩阵输入目标数据预测模型,其中,目标数据预测模型是一种深度神经网络模型,目标数据预测模型中包括多个依次堆叠的特征提取层,多个特征提取层中的第一特征提取层用于对非线性自回归矩阵进行处理,得到第一特征矩阵,多个特征提取层中的第二特征提取层用于对第二特征矩阵进行处理,得到待输入下一个特征提取层的第一特征矩阵,第一特征提取层为多个特征提取层中的第一个特征提取层,第二特征提取层为多个特征提取层中除第一特征提取层之外的其他特征提取层,第二特征矩阵为根据上一个特征提取层处输出的第一特征矩阵与线性自回归矩阵连接得到的;确定单元,用于根据目标数据预测模型的输出结果,从候选数据向量中确定出目标向量元素,并将目标向量元素指示的数据对象确定为目标数据对象。
4、可选地,目标数据预测模型为双向长短时记忆网络,特征提取层中包括第一方向特征提取层和第二方向特征提取层,缓存数据的预测装置还包括矩阵获取单元,用于在当前特征提取层为第二特征提取层的情况下,根据第一方向特征提取层对第二特征矩阵中的矩阵元素按照第一方向进行处理,得到第一参考矩阵;根据第二方向特征提取层对第二特征矩阵中的矩阵元素按照第二方向进行处理,得到第二参考矩阵;将第一参考矩阵和第二参考矩阵进行拼接,得到第一特征矩阵。
5、可选地,向量自回归单元包括:第一矩阵获取模块,用于对候选数据向量执行向量自回归计算,获得第一参考矩阵;第二矩阵获取模块,用于将第一参考矩阵进行转置操作,得到第二参考矩阵;第三矩阵获取模块,用于从第二参考矩阵中获取线性自回归矩阵和非线性自回归矩阵,其中,非线性自回归矩阵指示多个数据对象之间的非线性关系,线性自回归矩阵指示多个数据对象之间的线性关系。
6、可选地,矩阵获取单元还用于:根据多个历史数据访问操作,获取数据对象集合,其中,数据对象集合中包括历史数据访问操作所对应的数据对象;根据数据对象集合中的数据对象各自对应的访问次数,从数据对象集合中确定出候选数据子集,其中,候选数据子集中包括的数据对象所对应的访问次数大于或等于目标次数;根据候选数据子集中多个数据对象,以及多个数据对象各自的历史数据访问操作的操作次序,确定候选数据向量。
7、可选地,缓存数据的预测装置还包括:样本获取单元,用于获取训练样本集,其中,训练样本集包括多个训练样本,训练样本中包括样本数据向量以及预测标签,样本数据向量和预测标签为根据样本数据访问操作对应的数据对象序列确定,样本数据向量中包括的样本向量元素用于指示数据对象序列中的前n-1个样本数据对象,预测标签用于指示数据对象序列中的第n个样本数据对象,n为大于1的整数;模型训练单元,用于:根据训练样本集对处于训练阶段的数据预测模型进行训练,其中,处于训练阶段的数据预测模型中包括多个依次堆叠的参考特征提取层,多个参考特征提取层中的第一参考特征提取层用于对非线性自回归样本矩阵进行处理,得到第一样本特征矩阵,多个参考特征提取层中的第二参考特征提取层用于对第二样本特征矩阵进行处理,得到待输入下一个参考特征提取层的第一样本特征矩阵,第一特征提取层为多个参考特征提取层中的第一个参考特征提取层,第二参考特征提取层为多个参考特征提取层中除第一参考特征提取层之外的其他参考特征提取层,第二样本特征矩阵为根据上一个参考特征提取层输出的第一参考特征矩阵与线性自回归样本矩阵连接得到的,线性自回归样本矩阵和非线性自回归样本矩阵为根据样本数据向量执行向量自回归操作得到的;确定单元,用于:在数据预测模型满足训练条件的情况下,将数据预测模型确定为目标数据预测模型。
8、可选地,模型训练单元还用于:获取处于训练阶段的数据预测模型多个样本数据向量输出的预测结果;根据多个预测结果以及与多个样本数据向量各自对应的预测标签确定处于训练阶段的数据预测模型的当前训练损失;在当前训练损失大于或等于目标损失阈值的情况下,对数据预测模型中的至少一个模型参数进行更新。
9、可选地,缓存数据的预测装置还包括:循环预测单元,用于循环执行以下步骤,直至目标数据对象与待读取数据对象不同,其中,待读取数据对象为目标终端所请求的数据对象序列中当前读取位次的数据对象:将目标数据对象添加至候选数据向量的末尾位置;对更新后的候选数据向量执行向量自回归操作,得到线性自回归矩阵与非线性自回归矩阵;将线性自回归矩阵和非线性自回归矩阵输入目标数据预测模型;将目标数据预测模型的输出结果确定为下一个目标数据对象。
10、可选地,缓存数据的预测装置还包括:发送单元,获取目标数据对象的目标参数值;将目标数据对象的目标参数值加载至缓存中;响应于目标终端发送的数据读取操作,在待读取数据对象与目标数据对象相同的情况下,将缓存中的目标参数值发送至目标终端。
11、根据本技术实施例的又一个方面,提供一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行如以上缓存数据的预测方法。
12、根据本技术实施例的又一方面,还提供了一种电子设备,包括存储器和处理器,上述存储器中存储有计算机程序,上述处理器被设置为通过计算机程序执行上述的缓存数据的预测方法。
13、通过本技术,先获取包括用户历史访问数据对象的候选数据向量,并对上述候选数据向量执行向量自回归操作,得到线性自回归矩阵和非线性自回归矩阵;并将上述线性自回归矩阵和上述非线性自回归矩阵输入目标数据预测模型中,上述目标数据预测模型中包括多个依次堆叠的特征提取层,第一个特征提取层对上述非线性自回归矩阵进行处理,得到第一特征矩阵,将上述第一特征矩阵与线性自回归矩阵进行连接,得到下一个特征提取层的输入(第二特征矩阵),且在上述目标数据预测模型中,除第一个特征提取层以外的其他提取层的输入均为上一特征提取层的输出(第一特征矩阵)与上述线性自回归矩阵的连接,因此,上述目标数据预测模型可以同时关注到用户数据中的非线性特征与线性特征,进而从线性特征与非线性特征两个方面对用户预取数据进行预测,使预测结果的准确度得到提升,解决了相关技术中存在的对缓存数据进行预测的准确率低的问题。