本发明涉及数据检索,特别是涉及一种哈希检索模型构建方法、系统、电子设备及存储介质。
背景技术:
1、随着互联网技术的高速发展图像、视频等多媒体数据急剧增长,这使得基于大规模数据的检索难度不断提升。目前,现有技术如公开号为cn111783033a,名称为一种数据稀疏投影算法、系统、电子装置及存储介质的专利中,公开了通过学习输入数据样本之间的相似度,对低维度数据进行升维再做稀疏二值的处理,求解离散的目标函数的最优解,从而获得最优的投影矩阵以取得到高维的数据稀疏二值编码的方法。但该方法未能有效的考虑数据样本之间的信息方差。具体来说,方差较大的输入数据维度包含更多的信息,而其他方差较小的维度包含的信息量较少。然而,大多数的工作都是将每个数据特征编码为具有相同权重的二值编码(1/0),这将不可避免的导致具有较大方差维度的数据的信息丢失,导致了数据的不均衡分布。并且该技术方案求解离散目标函数的算法的收敛性和唯一性无法保证。
2、又如公开号为cn114037055a,名称为数据处理系统、方法、装置、设备及存储介质的专利文件中,公开了通过神经网络生成算法,利用数据集训练分类网络以通过分类任务训练出通用的视觉表达。但技术方案中神经网络训练过程只局限于特定的图像分类任务,使得模型局限在基于图像特征的分类任务。无法实现有效的数据检索。
技术实现思路
1、本发明所要解决的技术问题是:提供一种基于哈希编码的检索方法、系统、电子设备及存储介质,提高数据检索效果。
2、为了解决上述技术问题,本发明采用的技术方案为:
3、一种哈希检索模型构建方法,包括:
4、获取输入数据以及初始投影矩阵;所述输入数据为多维数据,所述初始投影矩阵通过随机的方式生成,且与所述输入数据的维度相同;
5、根据所述初始投影矩阵构建初始哈希函数;
6、通过所述初始哈希函数对所述输入数据进行哈希处理,得到输出变量;
7、根据所述输入数据对应的输入相似度矩阵以及所述输出变量对应的输出相似度矩阵之间距离的最小值构建第一目标函数,并根据所述第一目标函数得到最优投影矩阵;
8、获取初始旋转矩阵,并根据所述初始旋转矩阵更新所述第一目标函数,得到第二目标函数;
9、根据所述第二目标函数分别得到第一子目标函数以及第二子目标函数,并依次求解所述第一子目标函数以及第二子目标函数得到最优旋转矩阵;
10、根据所述最优旋转矩阵以及最优投影矩阵得到哈希检索模型。
11、为了解决上述技术问题,本发明采用的另一技术方案为:
12、一种哈希检索系统,包括:
13、构建模块,用于根据如上述的一种哈希检索模型构建方法的各个步骤构建得到哈希检索模型;
14、检索模块,用于获取检索数据,并根据所述哈希检索模型对所述检索数据进行检索,得到与所述检索数据对应的相似数据。
15、为了解决上述技术问题,本发明采用的另一技术方案为:
16、一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如上述的一种哈希检索模型构建方法中的各个步骤。
17、为了解决上述技术问题,本发明采用的另一技术方案为:
18、一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现如上述的一种哈希检索模型构建方法各个步骤。
19、本发明的有益效果在于:由初始投影矩阵构建初始哈希函数后,对输入数据进行哈希处理得到输出变量,进而根据输入相似度矩阵以及输出相似度矩阵构建第一目标函数并求解得到最优投影矩阵,能够最大程度的保留数据间的相似性,再引入旋转矩阵构建第二目标函数,将第二目标函数分解成第一子目标函数以及第二子目标函数,分别求解最优输出变量以及最优旋转矩阵,使得通过训练旋转矩阵,能够学习到数据不同维度的特征以及数据各维度信息平衡的紧凑二值编码,解决现有技术中存在数据信息丢失以及数据不均匀分布的问题;同时,基于最优输出变量以及最优旋转矩阵得到哈希检索模型用于数据检索,利用哈希模型输出二值紧凑编码可以提高大规模检索任务的检索速度,方便检索问题进行扩展及应用到多种现实应用场景中,相较于基于神经网络的图像数据分类方法,能够针对不同的检索数据进行检索,从而数据提高检索效果。
1.一种哈希检索模型构建方法,其特征在于,包括:
2.根据权利要求1所述一种哈希检索模型构建方法,其特征在于,所述根据所述第一目标函数得到最优投影矩阵包括:
3.根据权利要求2所述一种哈希检索模型构建方法,其特征在于,所述第一目标函数包括:;
4.根据权利要求1所述一种哈希检索模型构建方法,其特征在于,所述根据所述第二目标函数分别得到第一子目标函数以及第二子目标函数,并依次求解所述第一子目标函数以及第二子目标函数得到最优旋转矩阵包括:
5.根据权利要求4所述一种哈希检索模型构建方法,其特征在于,所述根据所述第一子目标函数求解得到最优输出变量包括:
6.根据权利要求5所述一种哈希检索模型构建方法,其特征在于,所述根据所述最优旋转矩阵以及最优投影矩阵得到哈希检索模型包括:
7.根据权利要求5所述一种哈希检索模型构建方法,其特征在于,所述第一子目标函数包括:;
8.一种哈希检索系统,其特征在于,包括:
9.一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1-7任意一项所述的一种哈希检索模型构建方法中的各个步骤。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1-7任意一项所述的一种哈希检索模型构建方法各个步骤。