本发明涉及数据处理技术领域,特别是涉及一种消息推送方法和一种消息推送系统。
背景技术:
随着互联网信息技术的发展,o2o(onlinetooffline,在线离线/线上到线下)商业模式逐渐兴起。其中,o2o是指将线下的商务机会与互联网结合,让互联网成为线下交易的平台。
在o2o领域,用户使用平台型应用程序app进行消费决策的途径主要有两种:一是用户主动发起浏览、筛选、搜索等操作,获取相关信息后进行决策;二是平台通过运营活动、个性化推荐等消息推送(push)的形式引导用户决策。
消息推送是app运营的重要手段,能够主动触达用户,目前大多数的推荐系统,主要针对个人的消费特征进行总结归纳,抽象出该个体的重点需求和购买倾向,结合大众普遍的行为趋势综合计算出用户潜在的消费动机,从而进行合理引导,达到精准推荐的目的。
然而,随着社交网络的普及,个性化的推荐往往忽略了一个群体的社交需求,而群体社交行为正逐渐演化为个体消费的主要部分。现有的能综合群体社交行为的推荐算法在对多人行为的机器学习和场景划分上往往具有一定局限性,如智能推荐的准确率过低而使群体过多干预推荐条件,场景元素单一无法顾及多元维度等等。
技术实现要素:
鉴于上述问题,提出了本发明实施例以便提供一种克服上述问题或者至少部分地解决上述问题的一种消息推送方法和相应的一种消息推送系统。
为了解决上述问题,本发明实施例公开了一种消息推送方法,包括:
确定与目标用户群组对应的至少一个相似用户群组;
基于所述相似用户群组,从指定的类目列表中选择多个候选类目;
基于目标用户群组当前的情境信息,从所述多个候选类目中确定用于进行推荐的目标类目。
优选地,在所述确定与目标用户群组对应的至少一个相似用户群组的步骤之前,还包括:
确定目标用户群组。
优选地,所述方法还包括:
基于所述目标类目进行消息推送。
优选地,所述确定与目标用户群组对应的至少一个相似用户群组的步骤包括:
获取所述目标用户群组针对所述类目列表中所有类目的第一画像分数;
分别计算所述第一画像分数与预设画像库中多个第二画像分数的相似度系数,其中,所述预设画像库中存储了预先采集的多个候选用户群组及每个候选用户群组针对所述类目列表中所有类目的第二画像分数;
基于所述相似度系数,从所述多个候选用户群组中筛选出至少一个相似用户群组。
优选地,所述获取所述目标用户群组针对所述类目列表中所有类目的第一画像分数的步骤包括:
获取所述目标用户群组中每个成员在预设时间段内的历史行为数据;
基于所述每个成员的历史行为数据,分别确定每个成员针对所述类目列表中所有类目的画像分数;
采用每个成员针对所述类目列表中所有类目的画像分数构建所述目标用户群组针对所述类目列表中所有类目的第一画像分数。
优选地,所述历史行为数据至少包括浏览行为数据以及交易行为数据;所述基于所述每个成员的历史行为数据,分别确定每个成员针对所述类目列表中所有类目的画像分数的步骤包括:
以所述目标用户群组中单个成员为维度,针对所述类目列表中的每个类目,从所述历史行为数据中提取预设时间段内所述成员针对所述类目的浏览行为数据以及交易行为数据;
计算预设时间段内所述浏览行为数据的浏览量以及所述交易行为数据的交易量;
分别对所述浏览量以及所述交易量配置第一权重以及第二权重,并进行求和运算,获得所述成员对所述类目的画像分数;
对所述类目的画像分数进行标准化处理以及归一化处理。
优选地,所述第一权重以及所述第二权重采用如下方式确定:
采集样本数据;
从所述样本数据中提取行为特征信息,所述特征信息至少包括浏览行为信息以及交易行为信息;
采用预设的机器学习算法对所述浏览行为信息以及所述交易行为信息进行训练;
在训练的过程中,当达到预设的损失函数的最小值时,得到所述浏览行为信息对应的第一权重以及所述交易行为信息对应的第二权重。
优选地,所述采用每个成员针对所述类目列表中所有类目的画像分数构建所述目标用户群组针对所述类目列表中所有类目的第一画像分数的步骤包括:
基于所述目标用户群组的每个成员针对所述类目列表中所有类目的画像分数,生成候选画像矩阵;
确定所述候选画像矩阵中的异常值,其中,所述异常值包括某个成员对某个类目的画像分数低于预设的异常门限的画像分数;
将所述候选画像矩阵中的异常值替换为预设阈值,得到所述目标用户群组针对所述类目列表中所有类目的第一画像分数。
优选地,所述基于所述相似度系数,从所述多个候选用户群组中筛选出至少一个相似用户群组的步骤包括:
从所述多个候选用户群组中筛选出相似度系数大于预设相似度门限的候选用户群组,作为相似用户群组。
优选地,所述基于所述相似用户群组,从指定的类目列表中选择多个候选类目的步骤包括:
基于所述相似用户群组的第二画像分数以及对应的相似度系数,分别计算所述类目列表中每个类目的最终画像分数;
基于所述最终画像分数,从所有类目中选取多个类目作为候选类目。
优选地,所述情境信息包括如下信息的至少一种:
所述目标用户群组中每个成员的地理位置;
实时的时间信息;
实时的气候信息。
本发明实施例还公开了一种消息推送系统,包括:
相似群组确定模块,用于确定与目标用户群组对应的至少一个相似用户群组;
候选类目选取模块,用于基于所述相似用户群组,从指定的类目列表中选择多个候选类目;
目标类目确定模块,用于基于目标用户群组当前的情境信息,从所述多个候选类目中确定用于进行推荐的目标类目。
优选地,所述系统还包括:
目标群组确定模块,用于确定目标用户群组。
优选地,还包括:消息推送模块,用于基于所述目标类目进行消息推送。
优选地,所述相似群组确定模块包括:
第一画像分数获取子模块,用于获取所述目标用户群组针对所述类目列表中所有类目的第一画像分数;
相似度系数计算子模块,用于分别计算所述第一画像分数与预设画像库中多个第二画像分数的相似度系数,其中,所述预设画像库中存储了预先采集的多个候选用户群组及每个候选用户群组针对所述类目列表中所有类目的第二画像分数;
相似群组筛选子模块,用于基于所述相似度系数,从所述多个候选用户群组中筛选出至少一个相似用户群组。
优选地,所述第一画像分数获取子模块包括:
历史数据获取单元,用于获取所述目标用户群组中每个成员在预设时间段内的历史行为数据;
成员画像确定单元,用于基于所述每个成员的历史行为数据,分别确定每个成员针对所述类目列表中所有类目的画像分数;
群组画像构建单元,用于采用每个成员针对所述类目列表中所有类目的画像分数构建所述目标用户群组针对所述类目列表中所有类目的第一画像分数。
优选地,所述历史行为数据至少包括浏览行为数据以及交易行为数据;所述成员画像确定单元包括:
行为筛选子单元,用于以所述目标用户群组中单个成员为维度,针对所述类目列表中的每个类目,从所述历史行为数据中提取预设时间段内所述成员针对所述类目的浏览行为数据以及交易行为数据;
计算子单元,用于计算预设时间段内所述浏览行为数据的浏览量以及所述交易行为数据的交易量;
权重配置子单元,用于分别对所述浏览量以及所述交易量配置第一权重以及第二权重,并进行求和运算,获得所述成员对所述类目的画像分数;
处理子单元,用于对所述类目的画像分数进行标准化处理以及归一化处理。
优选地,所述第一权重以及所述第二权重采用如下方式确定:
采集样本数据;
从所述样本数据中提取行为特征信息,所述特征信息至少包括浏览行为信息以及交易行为信息;
采用预设的机器学习算法对所述浏览行为信息以及所述交易行为信息进行训练;
在训练的过程中,当达到预设的损失函数的最小值时,得到所述浏览行为信息对应的第一权重以及所述交易行为信息对应的第二权重。
优选地,所述群组画像构建单元包括:
候选画像矩阵生成子单元,用于基于所述目标用户群组的每个成员针对所述类目列表中所有类目的画像分数,生成候选画像矩阵;
异常值确定子单元,用于确定所述候选画像矩阵中的异常值,其中,所述异常值包括某个成员对某个类目的画像分数低于预设的异常门限的画像分数;
异常值处理子单元,用于将所述候选画像矩阵中的异常值替换为预设阈值,得到所述目标用户群组针对所述类目列表中所有类目的第一画像分数。
优选地,所述相似群组筛选子模块还用于:
从所述多个候选用户群组中筛选出相似度系数大于预设相似度门限的候选用户群组,作为相似用户群组。
优选地,所述候选类目选取模块包括:
最终画像计算子模块,用于基于所述相似用户群组的第二画像分数以及对应的相似度系数,分别计算所述类目列表中每个类目的最终画像分数;
候选类目确定子模块,用于基于所述最终画像分数,从所有类目中选取多个类目作为候选类目。
优选地,所述情境信息包括如下信息的至少一种:
所述目标用户群组中每个成员的地理位置;
实时的时间信息;
实时的气候信息。
本发明实施例还公开了一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现上述方法的步骤。
本发明实施例还公开了一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现上述方法的步骤。
本发明实施例包括以下优点:
在本发明实施例中,能够结合实时的环境信息以及相似用户群组,为目标用户群组推荐较为匹配的目标类目,具有较高的准确性,并较少依赖人工干预。
本发明实施例适用于特定群体的类目推荐,针对群体行为特征推荐出其感兴趣的类目,在一定程度上增强了群体的社交属性。
附图说明
图1是本发明的一种消息推送方法实施例一的步骤流程图;
图2是本发明的一种消息推送方法实施例二的步骤流程图;
图3是本发明的一种消息推送方法实施例二的衰减函数曲线示意图;
图4是本发明的一种消息推送系统实施例的结构框图。
具体实施方式
为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本发明作进一步详细的说明。
本发明实施例的核心构思之一在于,通过目标用户群组的历史行为数据,构建目标用户群组的第一画像分数,并基于协同过滤算法找到相似的多个相似用户群组,选取topn个类目作为候选类目集合。同时综合时间、地点、天气等因素从候选类目集合中选取目标类目进行相关商户的推荐,很好的增强了用户团体的社交属性,提升用户体验度。
参照图1,示出了本发明的一种消息推送方法实施例一的步骤流程图,具体可以包括如下步骤:
步骤101,确定与目标用户群组对应的至少一个相似用户群组;
步骤102,基于所述相似用户群组,从指定的类目列表中选择多个候选类目;
步骤103,基于目标用户群组当前的情境信息,从所述多个候选类目中确定用于进行推荐的目标类目。
在本发明实施例中,当确定与目标用户群组对应的至少一个相似用户群组以后,可以基于该相似用户群组确定候选类目,并结合目标用户群组当前的情境信息,从多个候选类目中确定用于进行推荐的目标类目,在类目推送上,考虑了相似用户群组以及实时的情境信息,提高了推荐的准确率。
参照图2,示出了本发明的一种消息推送方法实施例二的步骤流程图,具体可以包括如下步骤:
步骤201,确定目标用户群组;
在具体实现中,本发明实施例可以应用于指定应用程序中,该指定应用程序可以具备建立群组的功能,当用户登录该应用程序以后,可以通过建立群组的功能建立群组,并将多个好友用户拉入群组,得到目标用户群组。
目标用户群组即需要进行消息推荐的目标用户群体。作为一种示例,目标用户群组可以包括但不限于每个成员的登录账号、昵称、位置信息等信息。
步骤202,确定与所述目标用户群组对应的至少一个相似用户群组;
当得到目标用户群组以后,本发明实施例可以进一步确定该目标用户群组对应的一个或多个相似用户群组。
在本发明实施例的一种优选实施例中,步骤202进一步可以包括如下子步骤:
子步骤s11,获取所述目标用户群组针对所述类目列表中所有类目的第一画像分数;
具体的,画像是根据用户的社会属性、生活习惯和消费行为等信息而抽象出的一个标签化的用户模型。在本发明实施例中,第一画像分数可以指根据上述用户模型得到的目标用户群组对指定的类目列表进行分析后的数值。
在实际中,指定的类目列表中可以包括多种类目,该多种类目可以为一级类目,也可以是二级类目,例如,该类目列表可以包括美食品类下所有的二级类目,例如西餐、中餐、火锅、烧烤、料理、自助餐等。
在本发明实施例的一种优选实施例中,子步骤s11进一步可以包括如下子步骤:
子步骤s111,获取所述目标用户群组中每个成员在预设时间段内的历史行为数据;
在具体实现中,可以从目标用户群组内各个成员对应的日志记录中获取每个成员的历史行为数据。
作为一种示例,该历史行为数据可以包括但不限于浏览行为数据(pageview,简称pv)、点击行为数据、交易行为数据等。
需要说明的是,预设时间段可以根据实际需求设定,例如,可以将预设时间段设定为最近30天,本发明实施例对此不作限定。
子步骤s112,基于所述每个成员的历史行为数据,分别确定每个成员针对所述类目列表中所有类目的画像分数;
当采集到目标用户群组中每个成员的历史行为数据以后,可以对该历史行为数据进行分析,以确定每个成员针对所述类目列表中所有类目的画像分数,即每个成员对指定的类目列表中每个类目进行行为分析后得到的数值的汇总。
在本发明实施例的一种优选实施例中,子步骤s112进一步可以包括如下子步骤:
子步骤s1121,以所述目标用户群组中单个成员为维度,针对所述类目列表中的每个类目,从所述历史行为数据中提取预设时间段内所述成员针对所述类目的浏览行为数据以及交易行为数据;
具体的,当采集到目标用户群组中每个成员的历史行为数据以后,可以以单个成员为维度,针对每个类目,从该历史行为数据中筛选出该成员对每个类目的浏览行为数据以及交易行为数据。
子步骤s1122,计算预设时间段内所述浏览行为数据的浏览量以及所述交易行为数据的交易量;
在子步骤s1121确定单个成员对每个类目的浏览行为数据以及交易行为数据以后,可以进一步对该浏览行为数据以及交易行为数据进行统计,得到该成员在该预设时间段内针对每个类目的浏览量以及交易量。
在实现中,浏览量可以采用如下公式计算:
其中,pi表示距离今天i天的pv量,i可以为预设时间段的数值,例如,i=30。
交易量可以采用如下公式计算:
其中,oi表示距离今天i天的交易量,i可以为预设时间段的数值,例如,i=30。
子步骤s1123,分别对所述浏览量以及所述交易量配置第一权重以及第二权重,并进行求和运算,获得所述成员对所述类目的画像分数;
获得单个成员对每个类目的浏览量以及交易量以后,可以对浏览量配置第一权重,以及,为交易量配置第二权重,随后,对配置权重后的浏览量和交易量进行求和运算,得到该成员对该类目的画像分数。
在一种实施方式中,第一权重以及第二权重可以采用如下方式确定:
采集样本数据;从所述样本数据中提取行为特征信息,所述特征信息至少包括浏览行为信息以及交易行为信息;采用预设的机器学习算法对所述浏览行为信息以及所述交易行为信息进行训练;在训练的过程中,当达到预设的损失函数的最小值时,得到所述浏览行为信息对应的第一权重以及所述交易行为信息对应的第二权重。
具体的,可以采集指定应用程序的一个时间段内的日志记录作为样本数据。
当采集样本数据以后,可以从该样本数据中提取行为特征信息。
作为一种示例,该特征信息至少可以包括浏览行为信息以及交易行为信息等。
在具体实现中,该样本数据可以包括正样本以及负样本,假如自样本选取日起的未来一段时间内用户基于某个类目的访问次数大于为该类目设定的访问阈值,则认为该样本为正样本,反之,如果访问次数小于或等于访问阈值,则认为该样本为负样本。
根据用户的行为特征信息,分别设定浏览行为信息以及交易行为信息的初始经验值系数(初始权重);例如,设定浏览行为信息的初始经验值系数为0.8,设定交易行为信息的初始经验值系数为0.2。
设定时间衰减函数为f(x)=e-ax;
其中,a为时间衰减系数,x表示自样本选取日的一段时间内,每天距离时间段最新日期的日期差,当
采集样本以后,可以基于lr(logisticregression,逻辑回归)算法进行机器学习,得到第一权重以及第二权重。
其中,lr算法可以表示为:
其中,
在权重模型的训练过程中,可以设定损失函数为
其中,yi表示样本的真实值,即真实情况下,该样本数据是正样本数据还是负样本数据;hθ(x)表示样本的预测值,即根据lr算法得到该样本是正样本数据还是负样本数据。
根据算法学习使得损失函数为最小值,最终得到浏览行为信息对应的第一权重以及交易行为信息对应的第二权重。
例如,最终确定的第一权重为0.7、第二权重为0.3。
需要说明的是,本发明实施例并不限于上述确定第一权重以及第二权重的方式,本领域技术人员根据实际需求采用其他方式设定或计算第一权重和第二权重均是可以的。
确定第一权重以及第二权重以后,在一种实施方式中,可以采用线性加和的方式确定用户对某个类目的画像分数。
例如,当第一权重为0.7、第二权重为0.3时,可以采用如下公式计算用户对某个类目的画像分数:
子步骤s1124,对所述类目的画像分数进行标准化处理以及归一化处理。
在得到用户对某个类目的画像分数以后,还可以对该分数进行标准化以及归一化处理。
具体的,由于线性加和存在一定程度上的极值问题,因此可以将其进行标准化处理以将数据按比例缩放,使之落入一个较小的特定区间。
在一种实施方式中,可以采用如下公式进行标准化处理:
其中,x表示上述各个类目的线性加和结果,
标准化处理后得到的结果,可以进一步进行归一化处理,使其落在[0,10]范围内。
在一种实施方式中,可以采用sigmoid函数进行归一化处理,sigmoid函数表示如下:
经过上述的处理过程得到的最终结果,可以作为用户对每个类目的最终分数。
当得到用户对每个类目的画像分数以后,可以将用户对所有类目的画像分数组织起来,得到用户针对所述类目列表中所有类目的画像分数。
例如,类目包括“自助餐”、“日本料理”、“西餐”三种,用户对这三种类目的画像分数分别为2、4、7。则该用户的画像分数为(2,4,7)。
子步骤s113,采用每个成员针对所述类目列表中所有类目的画像分数构建所述目标用户群组针对所述类目列表中所有类目的第一画像分数。
具体的,得到每个成员针对所述类目列表中所有类目的画像分数以后,可以构建“类目-成员”的二维矩阵。
在本发明实施例的一种优选实施例中,子步骤s113进一步可以包括如下子步骤:
子步骤s1131,基于所述目标用户群组的每个成员针对所述类目列表中所有类目的画像分数,生成候选画像矩阵;
在具体实现中,候选画像矩阵可以表示如下:
其中,
子步骤s1132,确定所述候选画像矩阵中的异常值,其中,所述异常值包括某个成员对某个类目的画像分数低于预设的异常门限的画像分数;
在具体实现中,对于所有的类目,目标用户群组中可能存在某个成员对某个类目偏好较低的情况,此时,该成员对该类目的画像分数通常比较低(通常该画像分数会远低于候选画像矩阵的平均值水平),在本发明实施例中,可以将该成员对这个类目的画像分数当作异常值进行处理,以使得最终的第一画像分数满足目标用户群组中大多数人的喜好需求。
在一种实施方式中,异常值可以包括某个成员对某个类目的画像分数低于预设的异常门限的画像分数。
作为一种示例,预设的异常门限可以采用如下公式计算:
其中,
子步骤s1133,将所述候选画像矩阵中的异常值替换为预设阈值,得到所述目标用户群组针对所述类目列表中所有类目的第一画像分数。
确定候选画像矩阵中的异常值以后,可以将该异常值替换为预设阈值,并将异常值替换后得到的画像矩阵作为目标用户群组针对所述类目列表中所有类目的第一画像分数。
在一种实施方式中,该预设阈值可以设定为数值0,则对应的异常处理算法可以为:
子步骤s12,分别计算所述第一画像分数与预设画像库中多个第二画像分数的相似度系数;
在本发明实施例中,还可以预先采集已建立的用户群组作为候选用户群组,并采集该候选用户群组的第二画像分数,建立画像库,即该画像库可以包括预先采集的多个候选用户群组及每个候选用户群组针对所述类目列表中所有类目的第二画像分数。
其中,第二画像分数可以为候选用户群组中每个成员分别对指定的类目列表中所有类目的画像分数,第二画像分数的确定方式与第一画像分数的确定方式相同,可以参考上述第一画像分数的获取方法,在此不再赘述了。
获得画像库中的候选用户群组以及其对应的第二画像分数以后,本发明实施例可以分别计算第一画像分数与画像库中每个第二画像分数的相似度系数。
在一种实施方式中,可以采用协同过滤算法计算第一画像分数与画像库中每个第二画像分数的相似度系数,其中一种协同过滤算法示例如下:
其中,sim(i,j)为目标用户群组i的第一画像分数与候选用户群组j的第二画像分数的相似度系数,值越大,表示其相似度越高。pik表示目标用户群组i中类目k的画像分数(即目标用户群组i中所有用户对类目k的画像分数的总和),
子步骤s13,基于所述相似度系数,从所述多个候选用户群组中筛选出一个或多个相似用户群组。
获得第一画像分数与画像库中多个第二画像分数的相似度系数以后,可以根据该相似度系数,寻找画像库中与目标用户群组类似的候选用户群组,即寻找最佳邻域。
在一种实施方式中,可以按相似度系数将画像库中所有第二画像分数进行排序,并选取排序在前(相似度系数从大到小排序)或排序到后(相似度系数从小到大排序)的第二画像分数对应的候选用户群组,作为相似用户群组。
在另一种实施方式中,可以设定相似度门限,并将相似度系数大于相似度门限的第二画像分数对应的候选用户群组,作为相似用户群组。
步骤203,基于所述相似用户群组,从指定的类目列表中选择多个候选类目;
确定相似用户群组以后,可以基于相似用户群组的第二画像分数,从所有指定的类目列表中选取多个候选类目。
在本发明实施例的一种优选实施例中,步骤203可以包括如下子步骤:
子步骤s21,基于所述一个或多个相似用户群组的第二画像分数以及对应的相似度系数,分别计算所述类目列表中每个类目的最终画像分数;
在一种实施方式中,确定相似用户群组以后,可以根据该相似用户群组对应的第二画像分数以及相似度系数,采用如下算法计算每个类目的最终画像分数:
其中,pjk为相似用户群组j中k类目的画像分数,sim(i,j)为目标用户群组i的第一画像分数与相似用户群组j的第二画像分数之间的相似度系数。
子步骤s22,基于所述最终画像分数,从所有类目中选取多个类目作为候选类目。
在一种实施方式中,得到类目列表中所有类目的最终画像分数以后,可以将该最终画像分数按降序或升序进行排序,并选取排序在前(降序)或排序在后(升序)的多个类目,作为候选类目。
在另一种实施方式中,可以设定分数阈值,将最终画像分数大于该分数阈值的类目作为候选类目。
步骤204,基于目标用户群组当前的情境信息,从所述多个候选类目中确定用于进行推荐的目标类目。
在实际中,该候选类目可以为多个。在本发明实施例中,当确定多个候选类目以后,可以加入情景感知因素,根据当前特定场景对目标用户群组完成个性化的类目推荐。
该情景感知因素可以包括实时获取的当前环境的情境信息。
作为本发明实施例的一种示例,该情境信息可以包括如下信息的至少一种:
(1)所述目标用户群组中每个成员的地理位置;
在具体实现中,可以通过定位功能,获得目标用户群组中每个成员的地理位置。
(2)实时的时间信息;
在具体实现中,该时间信息可以确定当前时间是早、中、晚以及工作日、节假日等时间类型。
(3)实时的气候信息。
具体的,气候信息可以包括温度信息、晴雨信息等。
获得实时的情境信息以后,可以根据该情境信息,从多个候选类目中选择目标类目,并将目标类目通过指定应用程序生成推送消息推送到目标用户群组中。
在实际中,得到目标类目以后,本发明实施例可以确定该目标类目对应的商户进行消息推送。
例如,可以通过目标用户群组中每个成员的地理位置基于lbs(locationbasedservice,基于位置的服务)服务进行商圈推荐;又如,通过早中晚以及工作日节假日等时间因素推荐不同类型的商户;或者,根据当前的时令、天气等因素推荐商户。
在本发明实施例中,能够结合实时的情境信息以及相似用户群组,为目标用户群组推荐较为匹配的目标类目,具有较高的准确性,并较少依赖人工干预。
本发明实施例适用于特定群体的类目推荐,针对群体行为特征推荐出其感兴趣的类目,在一定程度上增强了群体的社交属性。
需要说明的是,对于方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本发明实施例并不受所描述的动作顺序的限制,因为依据本发明实施例,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作并不一定是本发明实施例所必须的。
参照图4,示出了本发明的一种消息推送系统实施例的结构框图,具体可以包括如下模块:
相似群组确定模块401,用于确定与目标用户群组对应的至少一个相似用户群组;
候选类目选取模块402,用于基于所述相似用户群组,从指定的类目列表中选择多个候选类目;
目标类目确定模块403,用于基于目标用户群组当前的情境信息,从所述多个候选类目中确定确定用于进行推荐的目标类目。
在本发明实施例的一种优选实施例中,所述系统还可以包括如下模块:
目标群组确定模块,用于确定目标用户群组。
在本发明实施例的一种优选实施例中,所述系统还可以包括如下模块:
消息推送模块,用于基于所述目标类目进行消息推送。
在本发明实施例的一种优选实施例中,所述相似群组确定模块302可以包括如下子模块:
第一画像分数获取子模块,用于获取所述目标用户群组针对所述类目列表中所有类目的第一画像分数;
相似度系数计算子模块,用于分别计算所述第一画像分数与预设画像库中多个第二画像分数的相似度系数,其中,所述预设画像库中存储了预先采集的多个候选用户群组及每个候选用户群组针对所述类目列表中所有类目的第二画像分数;
相似群组筛选子模块,用于基于所述相似度系数,从所述多个候选用户群组中筛选出至少一个相似用户群组。
在本发明实施例的一种优选实施例中,所述第一画像分数获取子模块可以包括如下单元:
历史数据获取单元,用于获取所述目标用户群组中每个成员在预设时间段内的历史行为数据;
成员画像确定单元,用于基于所述每个成员的历史行为数据,分别确定每个成员针对所述类目列表中所有类目的画像分数;
群组画像构建单元,用于采用每个成员针对所述类目列表中所有类目的画像分数构建所述目标用户群组针对所述类目列表中所有类目的第一画像分数。
在本发明实施例的一种优选实施例中,所述历史行为数据至少包括浏览行为数据以及交易行为数据;所述成员画像确定单元可以包括如下子单元:
行为筛选子单元,用于以所述目标用户群组中单个成员为维度,针对所述类目列表中的每个类目,从所述历史行为数据中提取预设时间段内所述成员针对所述类目的浏览行为数据以及交易行为数据;
计算子单元,用于计算预设时间段内所述浏览行为数据的浏览量以及所述交易行为数据的交易量;
权重配置子单元,用于分别对所述浏览量以及所述交易量配置第一权重以及第二权重,并进行求和运算,获得所述成员对所述类目的画像分数;
处理子单元,用于对所述类目的画像分数进行标准化处理以及归一化处理。
在本发明实施例的一种优选实施例中,所述第一权重以及所述第二权重采用如下方式确定:
采集样本数据;
从所述样本数据中提取行为特征信息,所述特征信息至少包括浏览行为信息以及交易行为信息;
采用预设的机器学习算法对所述浏览行为信息以及所述交易行为信息进行训练;
在训练的过程中,当达到预设的损失函数的最小值时,得到所述浏览行为信息对应的第一权重以及所述交易行为信息对应的第二权重。
在本发明实施例的一种优选实施例中,所述群组画像构建单元可以包括如下子单元:
候选画像矩阵生成子单元,用于基于所述目标用户群组的每个成员针对所述类目列表中所有类目的画像分数,生成候选画像矩阵;
异常值确定子单元,用于确定所述候选画像矩阵中的异常值,其中,所述异常值包括某个成员对某个类目的画像分数低于预设的异常门限的画像分数;
异常值处理子单元,用于将所述候选画像矩阵中的异常值替换为预设阈值,得到所述目标用户群组针对所述类目列表中所有类目的第一画像分数。
在本发明实施例的一种优选实施例中,所述相似群组筛选子模块还用于:
从所述多个候选用户群组中筛选出相似度系数大于预设相似度门限的候选用户群组,作为相似用户群组。
在本发明实施例的一种优选实施例中,所述候选类目选取模块303可以包括如下子模块:
最终画像计算子模块,用于基于所述相似用户群组的第二画像分数以及对应的相似度系数,分别计算所述类目列表中每个类目的最终画像分数;
候选类目确定子模块,用于基于所述最终画像分数,从所有类目中选取多个类目作为候选类目。
在本发明实施例的一种优选实施例中,所述情境信息包括如下信息的至少一种:
所述目标用户群组中每个成员的地理位置;
实时的时间信息;
实时的气候信息。
对于图3的系统实施例而言,由于其与图1的方法实施例基本相似,所以描述的比较简单,相关之处参见图1的方法实施例的部分说明即可。
本发明实施例还公开了一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现图1和/或图2所述方法的步骤。
本发明实施例还公开了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现图1和/或图2所述方法的步骤。
本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。
本领域内的技术人员应明白,本发明实施例的实施例可提供为方法、装置、或计算机程序产品。因此,本发明实施例可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明实施例可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、cd-rom、光学存储器等)上实施的计算机程序产品的形式。
本发明实施例是参照根据本发明实施例的方法、终端设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理终端设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理终端设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理终端设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理终端设备上,使得在计算机或其他可编程终端设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程终端设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
尽管已描述了本发明实施例的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例做出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本发明实施例范围的所有变更和修改。
最后,还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者终端设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者终端设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者终端设备中还存在另外的相同要素。
以上对本发明所提供的一种消息推送方法和一种消息推送系统,进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。