本发明涉及电子商务,具体是一种结合用户行为数据的兴趣推荐算法。
背景技术:
1、随着移动互联网的快速发展,电商小程序作为新型的电商模式,凭借其轻量便捷的特点,成为了用户获取商品和服务的主要途径之一。商家为了提升用户体验,提高转化率,迫切需要精准推荐符合用户兴趣的商品,增强用户粘性和活跃度。
2、传统电商平台往往依靠商品分类和关键词匹配等简单的推荐方式,难以准确捕捉用户细致的兴趣需求。克服这一局限性,近年来,学者们不断探索基于用户行为数据的人工智能推荐算法。例如,基于协同过滤、基于内容过滤以及基于深度学习的推荐算法已广泛应用于电商平台,取得显著效果。
3、然而,现有推荐算法大多针对大型电商平台,缺乏考虑电商小程序特定场景下的用户行为特点和数据资源不足的针对性优化。针对电商小程序的用户价值获取场景,亟需开发一种能够高效利用用户行为数据,并综合考虑用户偏好、历史行为、商品特性等多方面因素的兴趣推荐算法,以实现精准化推荐、提升用户满意度和商家营收;
4、针对上述的技术缺陷,现提出一种结合用户行为数据的兴趣推荐算法解决方案。
技术实现思路
1、为解决上述问题,本发明提供如下技术方案:
2、一种结合用户行为数据的兴趣推荐算法,包括:
3、数据收集,对用户的行为数据进行收集,包括点击数据,用户点击的商品;浏览历史,用户浏览的商品类别和具体商品;购买历史,用户实际购买过的商品;搜索历史,用户在搜索框中输入的关键词;
4、数据处理,通过收集的行为数据,给不同的行为赋予不同的权重,购买行为权重大于点击行为,加入购物车的行为比单纯浏览的权重大;分析用户的兴趣会随着时间的变化,采用时间衰减模型对行为数据进行加权;
5、特征提取,提取用户行为数据中的重要特征,根据用户的行为数据,提取用户的偏好特征,根据商品的属性提取商品的关键特征;结合时间、地点因素,提取用户行为的上下文特征;
6、推荐算法,在结合行为数据和商品特征之后,采用算法进行推荐,基于协同过滤的推荐,用户与用户协同过滤,根据与当前用户有相似行为的其他用户的偏好,进行推荐;物品与物品协同过滤,根据用户浏览、购买的商品,推荐与商品相似的其他商品,根据用户过往行为和偏好,推荐相似属性的商品;基于深度学习的推荐,通过深度学习模型,从大量行为数据中学习到用户潜在的偏好模式,进行个性化推荐,构建用户与商品之间的图结构,利用图神经网络进行推荐,通过行为数据生成用户画像,并基于用户画像和用户群体的共同特征进行推荐。
7、进一步的,所述数据收集包括记录用户点击的具体时间,分析用户的活跃时段和行为习惯,记录用户浏览过的商品,包括浏览的时间和停留时长,用户浏览的商品类别,反映用户的兴趣领域,用户对购物车中的商品进行的修改,用户实际购买的商品信息,包括商品id、数量、价格;用户购买商品的时间,用于分析购买周期和趋势,用户在搜索框中输入的关键词,反映用户当前的需求和兴趣,用户点击的搜索结果,帮助了解用户对搜索结果的兴趣程度,用户收藏的商品信息,包括商品id和收藏时间,用户对商品的评价和评分,提供对商品的主观反馈,包括年龄、性别、地理位置等=基本信息,进行用户群体划分和个性化推荐,用户行为发生的时间分析行为的时间规律,用户将商品分享给朋友或在社交平台上的分享行为,用户对促销活动、折扣信息的点击和参与情况。
8、进一步的,所述数据处理包括检查并移除重复的记录,以确保数据的唯一性,填补缺失数据,常用的方法有均值填补、中位数填补、插值法,或者将含有缺失值的数据行删除,识别并修正数据中的错误,包括格式错误、不一致的值,将来自不同来源的数据合并为一个统一的数据集,确保不同数据来源中的字段和格式一致,方便后续分析和建模。
9、进一步的,所述数据处理还包括从原始数据中提取特征,记录用户点击某商品的频率,记录用户在商品页面上的停留时间,记录用户购买某类商品的次数,通过分析用户的点击、购买记录,提取用户对不同类别商品的偏好,通过上下文特征对用户行为发生的时间特征进行记录,对用户的地理位置,城市或地区进行记录,将数据缩放到一个特定范围内,以消除不同特征尺度的影响,将数据转换为均值为0、标准差为1的标准正态分布形式,使数据在不同尺度下具有相同的权重,选择对模型预测有显著影响的特征,去除冗余或无关特征,将高维数据降到较低维度,提高模型的计算效率,并减少过拟合的风险,将数据集分为训练集和测试集,训练集用于训练模型,测试集用于评估模型的性能,将数据分为训练集、验证集和测试集,验证集用于调优模型参数,测试集用于评估模型的性能。
10、进一步的,所述数据处理包括对数据集进行归一化处理,将数据集中数据进行缩放,归一化公式如下:
11、
12、其中,x'是归一化后的数据,x是原始数据,max(x)和min(x)是原始数据的最大值与最小值。
13、进一步的,所述数据处理包括对数据集中的数据对进行相关性判断,同一时间节点,同一数据集中的相关联的两个数据节点进行关联性计算,公式如下:
14、
15、其中,τ是相关系数,i为数据集中的数据节点,n为数据集中的数据对个数,xi和yi为数据集中相关联的数据对的观测值,和为数据集中相关联的数据对的平均值。
16、进一步的,所述特征提取包括数据清洗,处理缺失值、异常值和错误数据,将数据缩放到相同的范围,以消除不同特征的尺度影响,通过特征选择来识别并保留对模型有重要意义的特征,评估特征与目标变量之间的相关性,选择方差较大的特征,通常方差大的特征包含更多信息,使用特征重要性算法评分特征的重要性,创建新的特征或组合已有特征以增强模型的表达能力,对时间序列数据进行滑动窗口聚合,计算均值、最大值、最小值统计特征,计算基本统计量或使用高级方法提取频域特征,使用边缘检测、纹理分析、卷积神经网络方法提取图像特征,计算自相关性、滑动窗口统计量、傅里叶变换时间序列特征,通过选择最相关的特征和降维技术来减少特征空间的复杂性,选择对模型预测有显著影响的特征,去除冗余或无关特征,使用主成分分析、线性判别分析方法将数据降到较低维度,减少计算量和过拟合风险。
17、进一步的,所述特征提取包括信息增益,通过信息增益在决策树模型中用于选择最优划分属性,其公式为:
18、infogain(a)=info(d)-info(d|a),
19、其中,infogain(a)为给定特征a的信息增益,info(d)为选定数据集d的熵,info(d|a)为给定特征a的条件熵。
20、进一步的,所述特征提取包括线性判别分析,通过最大化类间散度和最小化类内散度提取特征,计算公式如下;
21、
22、其中,w为主成分的权重矩阵,det(sb)为类间散度矩阵,det(sw)为类内散度矩阵。
23、进一步的,所述推荐算法包括计算物品的特征向量,基于用户对物品特征的兴趣推荐相似物品,计算物品的tf-idf值、使用词嵌入表示文本特征,使用神经网络模型来建模用户和物品之间的复杂关系,根据需求选择适合的推荐算法和模型,使用训练数据对选择的推荐模型进行训练,优化模型参数,使用评估指标评估模型性能,通过交叉验证方法确保模型的泛化能力和稳定性,基于训练好的模型为用户生成推荐列表,对推荐结果进行排序和过滤,以确保推荐结果的相关性和多样性,将训练好的推荐模型部署到生产环境中,供用户使用,监控推荐系统的运行情况,收集用户反馈和新数据,定期更新模型和推荐算法,以适应用户行为和偏好的变化,获取用户对推荐结果的反馈,分析用户的满意度和偏好变化,根据用户反馈和新数据,优化推荐算法和模型,提升推荐系统的效果。
24、与现有技术相比,本发明的有益效果是:
25、本发明一种结合用户行为数据的兴趣推荐算法中,通过对用户的行为数据进行收集,包括点击数据,用户点击的商品;浏览历史,用户浏览的商品类别和具体商品;购买历史,用户实际购买过的商品;搜索历史,用户在搜索框中输入的关键词;通过收集的行为数据,给不同的行为赋予不同的权重,购买行为权重大于点击行为,加入购物车的行为比单纯浏览的权重大;分析用户的兴趣会随着时间的变化,采用时间衰减模型对行为数据进行加权,提取用户行为数据中的重要特征,根据用户的行为数据,提取用户的偏好特征,根据商品的属性提取商品的关键特征;结合时间、地点因素,提取用户行为的上下文特征;在结合行为数据和商品特征之后,采用算法进行推荐,基于协同过滤的推荐,用户与用户协同过滤,根据与当前用户有相似行为的其他用户的偏好,进行推荐;物品与物品协同过滤,根据用户浏览、购买的商品,推荐与商品相似的其他商品,根据用户过往行为和偏好,推荐相似属性的商品;基于深度学习的推荐,通过深度学习模型,从大量行为数据中学习到用户潜在的偏好模式,进行个性化推荐,构建用户与商品之间的图结构,利用图神经网络进行推荐,通过行为数据生成用户画像,并基于用户画像和用户群体的共同特征进行推荐,具有通过深度学习与个性化定制提升了购物效率与用户体验,也优化了电商平台的运营策略,实现了商业与用户体验的双重升级的效果。