本发明涉及量子机器学习,具体涉及一种基于混合量子经典极深因子分解机的点击率预测方法。
背景技术:
1、推荐系统通过分析用户历史行为为用户建模,提高对用户信息推荐的准确性和个性化。点击率(click-through rate,ctr)预测是推荐系统的重要任务,传统的ctr模型经历了从经典机器学习到深度学习,再到引入自注意力机制的发展历程。量子计算作为一种新兴计算范式,在优化机器学习任务中具有优势,尤其在处理高维数据和复杂优化问题时表现突出。量子计算利用量子比特进行信息处理,能够提供在某些任务中指数级的加速。量子计算的核心特性,如量子叠加和量子纠缠,使其在处理大规模数据时具有天然的并行性和高效性。将量子计算的优势融入ctr模型中具有一定的可能性和可行性。
2、但是,传统的ctr模型经历了从经典机器学习到深度学习,再到引入自注意力机制的发展历程,在这一不断演进的研究历程中,随着数据量和计算量增加,传统ctr模型面临性能瓶颈。
技术实现思路
1、发明目的:本发明的目的是提供一种基于混合量子经典极深因子分解机的点击率预测方法,解决传统xdeepfm模型在高维数据处理和大规模数据训练中面临的计算瓶颈,提高点击率(ctr)预测任务的计算效率和精度。
2、技术方案:本发明所述的一种基于混合量子经典极深因子分解机的点击率预测方法,包括以下步骤:
3、(1)获取开源数据集并进行预处理,划分训练集、测试集;
4、(2)构建新型混合量子经典极深因子分解机hqcxdeepfm模型,并利用预处理后的数据集进行训练;
5、(3)利用sigmoid激活函数得到最终的预估结果。
6、进一步的,步骤(1)具体如下:使用两个开放的基准数据集criteo和avazu;设置数据记录的频率阈值;过滤掉低于阈值的记录;对于分类型特征,采用独热编码将属性转换为数字特征;对于连续型特征,进行归一化处理。
7、进一步的,步骤(2)中,hqcxdeepfm模型包括:量子压缩交叉网络qcin、量子深度神经网络qdnn和量子线性模型qlinear;量子压缩交叉网络用于处理稠密特征向量来学习显式高阶特征交叉关系,采用混合角度编码方案将高维数据映射到较低维的量子态上实现数据降维,同时设计变分量子电路构建量子一维卷积,对三维特征矩阵进行特征压缩;量子深度神经网络由多个隐藏层组成,用于处理稠密特征向量学习隐式高阶特征交叉关系,采用混合角度编码方案使用多层变分层的变分量子电路将传统深度神经网络量子化;量子线性模型采用混合角度编码方案,使用单层变分量子电路重新构建线性模型;用于利用原始特征进行线性组合,处理稀疏特征,学习低阶特征线性交叉关系。
8、进一步的,hqcxdeepfm模型具体处理过程如下:通过嵌入层的全连接神经网络获取数据集中的低维表示,即将数据集中的稀疏特征映射到连续向量空间中形成固定长度的稠密特征向量;将得到的固定长度的稠密特征向量分别输入到量子压缩交叉网络和量子深度神经网络中进行处理,原始输入特征输入到量子线性模型中进行处理。
9、进一步的,步骤(3)具体如下:叠加qcin、qdnn和qlinear三个模块的输出,并通过sigmoid激活函数得到最终的预估结果。
10、本发明所述的一种基于混合量子经典极深因子分解机的点击率预测系统,包括:
11、数据模块:用于获取开源数据集并进行预处理,划分训练集、测试集;
12、hqcxdeepfm模块:用于构建新型混合量子经典极深因子分解机hqcxdeepfm模型,并利用预处理后的数据集进行训练;
13、预估模块:用于利用sigmoid激活函数得到最终的预估结果。
14、进一步的,数据模块中,具体如下:使用两个开放的基准数据集criteo和avazu;设置数据记录的频率阈值;过滤掉低于阈值的记录;对于分类型特征,采用独热编码将属性转换为数字特征;对于连续型特征,进行归一化处理。
15、进一步的,hqcxdeepfm模块中,hqcxdeepfm模型包括:量子压缩交叉网络qcin、量子深度神经网络qdnn和量子线性模型qlinear;量子压缩交叉网络用于处理稠密特征向量来学习显式高阶特征交叉关系,采用混合角度编码方案将高维数据映射到较低维的量子态上实现数据降维,同时设计变分量子电路构建量子一维卷积,对三维特征矩阵进行特征压缩;量子深度神经网络由多个隐藏层组成,用于处理稠密特征向量学习隐式高阶特征交叉关系,采用混合角度编码方案使用多层变分层的变分量子电路将传统深度神经网络量子化;量子线性模型采用混合角度编码方案,使用单层变分量子电路重新构建线性模型;用于利用原始特征进行线性组合,处理稀疏特征,学习低阶特征线性交叉关系。
16、进一步的,hqcxdeepfm模块中,hqcxdeepfm模型具体处理过程如下:通过嵌入层的全连接神经网络获取数据集中的低维表示,即将数据集中的稀疏特征映射到连续向量空间中形成固定长度的稠密特征向量;将得到的固定长度的稠密特征向量分别输入到量子压缩交叉网络和量子深度神经网络中进行处理,原始输入特征输入到量子线性模型中进行处理。
17、进一步的,预估模块中,具体如下:叠加qcin、qdnn和qlinear三个模块的输出,并通过sigmoid激活函数得到最终的预估结果。
18、有益效果:与现有技术相比,本发明具有如下显著优点:本发明融合量子计算优势的hqcxdeepfm,利用混合角度编码方案(hae)将高维数据映射到较低维的量子态上实现数据降维,同时设计变分量子电路构建qcin、qdnn和qlinear,利用量子计算优势使得hqcxdeepfm点击率预测性能提升。与传统xdeepfm的性能对比,提升ctr模型的计算能力并降低模型复杂度,同时提高ctr预测性能。
1.一种基于混合量子经典极深因子分解机的点击率预测方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的一种基于混合量子经典极深因子分解机的点击率预测方法,其特征在于,步骤(1)具体如下:使用两个开放的基准数据集criteo和avazu;设置数据记录的频率阈值;过滤掉低于阈值的记录;对于分类型特征,采用独热编码将属性转换为数字特征;对于连续型特征,进行归一化处理。
3.根据权利要求1所述的一种基于混合量子经典极深因子分解机的点击率预测方法,其特征在于,步骤(2)中,hqcxdeepfm模型包括:量子压缩交叉网络qcin、量子深度神经网络qdnn和量子线性模型qlinear;量子压缩交叉网络用于处理稠密特征向量来学习显式高阶特征交叉关系,采用混合角度编码方案将高维数据映射到较低维的量子态上实现数据降维,同时设计变分量子电路构建量子一维卷积,对三维特征矩阵进行特征压缩;量子深度神经网络由多个隐藏层组成,用于处理稠密特征向量学习隐式高阶特征交叉关系,采用混合角度编码方案使用多层变分层的变分量子电路将传统深度神经网络量子化;量子线性模型采用混合角度编码方案,使用单层变分量子电路重新构建线性模型;用于利用原始特征进行线性组合,处理稀疏特征,学习低阶特征线性交叉关系。
4.根据权利要求3所述的一种基于混合量子经典极深因子分解机的点击率预测方法,其特征在于,hqcxdeepfm模型具体处理过程如下:通过嵌入层的全连接神经网络获取数据集中的低维表示,即将数据集中的稀疏特征映射到连续向量空间中形成固定长度的稠密特征向量;将得到的固定长度的稠密特征向量分别输入到量子压缩交叉网络和量子深度神经网络中进行处理,原始输入特征输入到量子线性模型中进行处理。
5.根据权利要求4所述的一种基于混合量子经典极深因子分解机的点击率预测方法,其特征在于,步骤(3)具体如下:叠加qcin、qdnn和qlinear三个模块的输出,并通过sigmoid激活函数得到最终的预估结果。
6.一种基于混合量子经典极深因子分解机的点击率预测系统,其特征在于,包括:
7.根据权利要求6所述的一种基于混合量子经典极深因子分解机的点击率预测系统,其特征在于,数据模块中,具体如下:使用两个开放的基准数据集criteo和avazu;设置数据记录的频率阈值;过滤掉低于阈值的记录;对于分类型特征,采用独热编码将属性转换为数字特征;对于连续型特征,进行归一化处理。
8.根据权利要求6所述的一种基于混合量子经典极深因子分解机的点击率预测系统,其特征在于,hqcxdeepfm模块中,hqcxdeepfm模型包括:量子压缩交叉网络qcin、量子深度神经网络qdnn和量子线性模型qlinear;量子压缩交叉网络用于处理稠密特征向量来学习显式高阶特征交叉关系,采用混合角度编码方案将高维数据映射到较低维的量子态上实现数据降维,同时设计变分量子电路构建量子一维卷积,对三维特征矩阵进行特征压缩;量子深度神经网络由多个隐藏层组成,用于处理稠密特征向量学习隐式高阶特征交叉关系,采用混合角度编码方案使用多层变分层的变分量子电路将传统深度神经网络量子化;量子线性模型采用混合角度编码方案,使用单层变分量子电路重新构建线性模型;用于利用原始特征进行线性组合,处理稀疏特征,学习低阶特征线性交叉关系。
9.根据权利要求8所述的一种基于混合量子经典极深因子分解机的点击率预测系统,其特征在于,hqcxdeepfm模块中,hqcxdeepfm模型具体处理过程如下:通过嵌入层的全连接神经网络获取数据集中的低维表示,即将数据集中的稀疏特征映射到连续向量空间中形成固定长度的稠密特征向量;将得到的固定长度的稠密特征向量分别输入到量子压缩交叉网络和量子深度神经网络中进行处理,原始输入特征输入到量子线性模型中进行处理。
10.根据权利要求9所述的一种基于混合量子经典极深因子分解机的点击率预测系统,其特征在于,预估模块中,具体如下:叠加qcin、qdnn和qlinear三个模块的输出,并通过sigmoid激活函数得到最终的预估结果。