信息推送方法、装置、电子设备和可读介质与流程

文档序号:28447303发布日期:2022-01-12 04:04阅读:133来源:国知局
信息推送方法、装置、电子设备和可读介质与流程

1.本技术涉及计算机技术领域,尤其涉及一种信息推送荐方法、装置、电子设备和可读介质。


背景技术:

2.一个产品完整的生命周期一般包括:初创阶段、成长阶段、成熟阶段、衰退阶段、退出阶段这五个阶段。对应着五个阶段,所涉及到的业务场景通常包括:拉新活动、流失预警活动、流失挽回活动、付费拉新活动、付费回流活动等营销方案活动。
3.在相关技术中,企业对于产品生命周期管理的营销方案,一般采用根据单个场景中的单个业务进行的营销干预。
4.然而,有很多用户存在于产品的多个业务以及多个场景中,目前的方案中每个场景的每个业务会对用户给出各自的营销干预,导致用户受到多个营销干预的影响,容易对用户造成骚扰,降低了用户对产品营销活动的用户体验。


技术实现要素:

5.基于上述技术问题,本技术提供一种信息推送方法、装置、电子设备和可读介质,以减少不必要的信息推送,从而避免推送的信息对用户的骚扰,提升用户对信息推送的用户体验。
6.本技术的其他特性和优点将通过下面的详细描述变得显然,或部分地通过本技术的实践而习得。
7.根据本技术实施例的一个方面,提供一种信息推送方法,包括:获取用户集合的用户特征数据,所述用户集合中的每个用户对应于至少一个业务类型,每个业务类型对应于至少一个业务场景;根据所述用户特征数据,对各个业务类型对应的各个业务场景进行预测,得到协同数据矩阵,其中,所述协同数据矩阵中包括各个业务类型对应的各个业务场景对应的概率得分;根据所述用户集合对应的各个业务类型下的用户数量和各个业务场景下的用户数量,构建卷积核;根据所述卷积核对所述协同数据矩阵进行卷积计算,得到所述用户集合中每个用户的综合矩阵,所述综合矩阵包括用户对应于各个业务类型对应的各个业务场景的概率得分;根据各个用户的综合矩阵确定对应的推荐业务场景,向所述各个用户推送所述推荐业务场景对应的推荐信息。
8.根据本技术实施例的一个方面,提供一种信息推送装置,包括:数据获取模块,用于获取用户集合的用户特征数据,所述用户集合中的每个用户对应于至少一个业务类型,每个业务类型对应于至少一个业务场景;
矩阵预测模块,用于根据所述用户特征数据,对各个业务类型对应的各个业务场景进行预测,得到协同数据矩阵,其中,所述协同数据矩阵中包括各个业务类型对应的各个业务场景对应的概率得分;卷积核构建模块,用于根据所述用户集合对应的各个业务类型下的用户数量和各个业务场景下的用户数量,构建卷积核;卷积计算模块,用于根据所述卷积核对所述协同数据矩阵进行卷积计算,得到所述用户集合中每个用户的综合矩阵,所述综合矩阵包括用户对应于各个业务类型对应的各个业务场景的概率得分;信息推送模块,用于根据各个用户的综合矩阵确定对应的推荐业务场景,向所述各个用户推送所述推荐业务场景对应的推荐信息。
9.在本技术的一些实施例中,基于以上技术方案,所述用户特征数据包含历史特征数据和样本特征数据;所述矩阵预测模块,包括:权重计算子模块,用于根据所述历史特征数据,利用对应于各个业务场景的权重模型计算各个业务场景对应的权重向量;概率预测子模块,用于根据所述样本特征数据和所述权重向量进行概率预测,得到各个业务场景对应的概率得分向量;用户分组子模块,用于根据所述概率得分向量和所述用户集合进行用户分组,得到对应于所述用户集合的协同数据矩阵。
10.在本技术的一些实施例中,基于以上技术方案,所述信息推送模块,包括:卷积计算子模块,用于根据所述卷积核对所述权重向量进行卷积计算,得到所述用户集合中每个用户的权重向量,所述权重向量包括用户对应于各个业务类型对应的各个业务场景的权重值;用户确定子模块,用于根据每个用户的综合矩阵,确定各个业务场景的目标用户;配置结果确认子模块,用于根据所述目标用户的权重向量,确定所述目标用户的推荐配置结果,所述推荐配置结果中包括推荐业务类型和对应的推荐业务场景;推送子模块,用于根据所述推荐配置结果中的推荐业务类型和对应的推荐业务场景,向所述目标用户推送推荐信息。
11.在本技术的一些实施例中,基于以上技术方案,所述权重计算子模块,包括:训练样本确定单元,用于根据所述历史特征数据,确定对应于各个业务类型的各个业务场景的训练样本集合和测试样本集合;权重模型获取单元,用于获取所述各个业务类型的各个业务场景对应的权重模型;权重模型训练单元,用于将对应于所述各个业务场景的训练样本集合和测试样本集合分别输入到对应的权重模型进行计算和测试,得到对应于各个业务场景的权重向量。
12.在本技术的一些实施例中,基于以上技术方案,所述权重模型训练单元,包括:迭代训练子单元,用于将对应于各个业务场景的训练样本集合和所述测试样本集合分别输入待训练模型中进行迭代训练;权重模型确定子单元,用于当达到迭代结束条件时,获取训练过的待训练模型作为权重模型;
权项向量获取子单元,用于获取各个权重模型输出的预测结果作为对应于各个业务场景的权重向量。
13.在本技术的一些实施例中,基于以上技术方案,所述训练样本确定单元包括:业务场景确定子单元,用于根据所述历史特征数据,确定所述用户集合中各个用户对应的业务场景;历史数据分组子单元,用于根据所述各个用户对应业务类型和业务场景,对所述历史特征数据进行分组,得到对应于各个业务类型对应的各个业务场景的历史数据分组;特征划分子单元,用于将所述历史数据分组中的数据划分成稀疏特征数据集合和稠密特征数据集合;数据组合子单元,用于按照预设的数据组合比例对所述稀疏特征数据集合和稠密特征数据集合中的数据进行组合,得到对应于各个业务场景的训练样本集合和测试样本集合。
14.在本技术的一些实施例中,基于以上技术方案,所述业务场景确定子单元配置成:基于所述历史特征数据,对于各个业务类型,确定各个用户在第k-1个时间周期的消费特征数据和活跃特征数据,其中,所述第k-1个时间周期为当前时间周期的上一个时间周期,k为大于2的整数;根据各个用户的所述消费特征数据和活跃特征数据确定各个用户的业务场景;若用户在第k个时间周期之前未进行过登陆,确定所述用户对应的业务场景为拉新场景;若用户在第k-1个时间周期进行过登陆,在所述第k个时间周期未进行登录,确定所述用户对应的业务场景为流失预警场景;若用户在第k-2个时间周期进行过登陆,在所述第k-1个时间周期未进行登录,在所述第k个时间周期进行登录,确定所述用户对应的业务场景为流失挽回场景;若用户在第k个时间周期之前进行过登陆但未消费,在第k个时间周期进行登录并消费,确定所述用户对应的业务场景为付费新增场景;若用户在第k-2个时间周期进行过登陆并消费,在第k-1个时间周期进行登录未消费,在第k个时间周期进行登录并消费,确定所述用户对应的业务场景为付费回流场景。
15.在本技术的一些实施例中,基于以上技术方案,所述概率预测子模块,包括:概率模型获取单元,用于获取所述业务场景对应的概率预测模型;得分向量计算单元,用于根据所述权重向量对应的业务场景,将所述样本特征数据和所述权重向量输入到对应的概率预测模型中,得到对应于各个业务场景的概率得分向量。
16.在本技术的一些实施例中,基于以上技术方案,所述用户分组子模块,包括:概率矩阵构建单元,用于基于所述用户集合中的用户在各个业务类型对应的各个业务场景下的概率得分向量,构建带有缺失值的概率矩阵,所述概率矩阵的第i行第j列为用户i在业务场景j的概率得分向量,所述缺失值表示用户与所述缺失值对应的业务场景之间没有对应关系;缺失值预测单元,用于将所述概率矩阵输入到协同过滤模型中进行缺失值预测,得到协同概率矩阵。
17.在本技术的一些实施例中,基于以上技术方案,所述卷积核构建模块,包括:用户数量确定子模型,用于根据所述用户特征数据,确定各个业务类型的用户数量以及各个业务类型对应的业务场景的用户数量;卷积权重子模型,用于根据各个业务场景的用户数量与对应的业务类型的用户数量的比值,确定各个业务场景的卷积权重;卷积核构建子模型,用于根据所述各个业务场景的卷积权重以及对应的业务场景,构建卷积核。
18.根据本技术实施例的一个方面,提供一种电子设备,该电子设设备包括:处理器;以及存储器,用于存储处理器的可执行指令;其中,该处理器配置为经由执行可执行指令来执行如以上技术方案中的信息推送方法。
19.根据本技术实施例的一个方面,提供一种计算机可读存储介质,其上存储有计算机程序,当该计算机程序被处理器执行时实现如以上技术方案中的信息推送方法。
20.根据本技术实施例的一个方面,提供了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行上述各种可选实现方式中提供信息推送方法。
21.在本技术的实施例中,由于在计算过程中,将各个业务类型对应的业务场景的得分与用户分布综合进行计算得到综合得分,再根据用户的综合得分进行推送,从而能够综合各个业务类型和业务场景的推送情况,减少不必要的信息推送,从而避免信息推送活动对用户的骚扰,提升用户对信息推送活动的用户体验。
22.应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本技术。
附图说明
23.此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本技术的实施例,并与说明书一起用于解释本技术的原理。显而易见地,下面描述中的附图仅仅是本技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
24.图1示意性地示出了本技术技术方案在一个应用场景中的示例性系统构架示意图。
25.图2为本技术实施例中一种信息推送方法的整体流程图。
26.图3为本技术实施例中的一种信息推送方法的里程示意图。
27.图4为本技术实施例中的一种具体流程的示意图。
28.图5示意性地示出了本技术实施例中信息推送装置的组成框图。
29.图6示出了适于用来实现本技术实施例的电子设备的计算机系统的结构示意图。
具体实施方式
30.现在将参考附图更全面地描述示例实施方式。然而,示例实施方式能够以多种形式实施,且不应被理解为限于在此阐述的范例;相反,提供这些实施方式使得本技术将更加
全面和完整,并将示例实施方式的构思全面地传达给本领域的技术人员。
31.此外,所描述的特征、结构或特性可以以任何合适的方式结合在一个或更多实施例中。在下面的描述中,提供许多具体细节从而给出对本技术的实施例的充分理解。然而,本领域技术人员将意识到,可以实践本技术的技术方案而没有特定细节中的一个或更多,或者可以采用其它的方法、组元、装置、步骤等。在其它情况下,不详细示出或描述公知方法、装置、实现或者操作以避免模糊本技术的各方面。
32.附图中所示的方框图仅仅是功能实体,不一定必须与物理上独立的实体相对应。即,可以采用软件形式来实现这些功能实体,或在一个或多个硬件模块或集成电路中实现这些功能实体,或在不同网络和/或处理器装置和/或微控制器装置中实现这些功能实体。
33.附图中所示的流程图仅是示例性说明,不是必须包括所有的内容和操作/步骤,也不是必须按所描述的顺序执行。例如,有的操作/步骤还可以分解,而有的操作/步骤可以合并或部分合并,因此实际执行的顺序有可能根据实际情况改变。
34.当本技术以上实施例运用到具体产品或技术中时,其均需获得用户许可或者同意,且相关数据的收集、使用和处理遵守国家相关法律法规。
35.可以理解,本技术实施例可应用于车联网、出行领域,本技术可以应用于软件应用的信息推送功能中,并且具体应用于车辆出行软件的营销信息推送系统中。车辆的车主在应用出行软件的过程中,可能会处在多个业务的多个场景中,例如加油业务的拉新场景和付费拉新场景、洗车业务的流失预警场景和付费回流场景等。应用本技术的方案,根据车主在出行软件中的数据进行跨业务跨场景的综合分析计算,可以对车主在出行软件中的各个业务类型下的各个业务场景中是否要进行信息推送活动来进行分析和确认,从而能够避免各个业务和各个场景独立计算各自的推送活动,从而造成车主接收到大量的信息推送而受到骚扰,影响用户体验。
36.图1示意性地示出了本技术技术方案在一个应用场景中的示例性系统构架示意图。如图1所示,该应用场景中包括终端110和服务器120。
37.终端110可以是智能手机、平板电脑、笔记本电脑、台式计算机、智能音箱、智能手表、车载终端等,但并不局限于此。终端110安装和运行用于进行应用或者插件开发的应用程序,或者通过远程连接的方式连接到服务器120上来进行开发工作。终端110可以泛指多个终端中的一个,本实施例仅以终端110来举例说明。
38.服务器120可以是独立的物理服务器,也可以是多个物理服务器构成的服务器集群或者分布式系统,还可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、cdn(content delivery network,内容分发网络)、以及大数据和人工智能平台等基础云计算服务的云服务器。可以理解的是,在本技术的实施例中,服务器120所处的环境构成了应用所在的本地环境,即,在只有单个服务器的情况下,单个服务器本身即本地环境,在具有多个服务器的情况下,相互之间通过物理设备直接连接的环境构成本地环境。与此相对应的,远程环境指的是与服务器120之间通过互联网等公共网络连接的环境。服务器120用于为终端110提供应用的开发和运行环境。
39.终端110可以访问服务器120,并且在服务器120上构建用于进行插件或者应用开发的开发环境,终端110自身也可以直接配置成开发环境而不依赖于服务器120。在服务器120作为被配置的生产环境时,终端110与服务器120之间可以通过有线或无线通信方式进
行直接或间接地连接,本技术实施例对此不作限定。
40.本领域技术人员可以知晓,上述终端的数量可以更多或更少。比如上述终端可以仅为一个,或者上述终端为几十个或几百个,或者更多数量。本技术实施例对终端的数量和设备类型不加以限定。
41.以出行应用为例,应用安装在终端110中,用户使用终端110与服务器120进行通信来访问应用的各类功能。服务器120根据用户的访问数据,通过本技术的方案来确定需要发送的推送信息,来向终端110进行推送。
42.本技术的方案可以采用人工智能的方式来实现。人工智能(artificial intelligence,ai)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。换句话说,人工智能是计算机科学的一个综合技术,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器。人工智能也就是研究各种智能机器的设计原理与实现方法,使机器具有感知、推理与决策的功能。
43.人工智能技术是一门综合学科,涉及领域广泛,既有硬件层面的技术也有软件层面的技术。人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互系统、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。
44.本技术主要涉及机器学习的方向。机器学习(machine learning,ml)是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。机器学习是人工智能的核心,是使计算机具有智能的根本途径,其应用遍及人工智能的各个领域。机器学习和深度学习通常包括人工神经网络、置信网络、强化学习、迁移学习、归纳学习、式教学习等技术。
45.本技术的方案中的总体流程请参阅图2。图2为本技术实施例中一种信息推送方法的整体流程图。如图2所示出的,用户群在不同业务类型的各个场景下进行操作的数据会输入待业务类型对应的协同过滤模型中进行处理,得到协同过滤结果。各个业务场景的协同过滤的结果再共同输入到卷积神经网络中进行卷积处理,从而得出各个用户在各个业务的场景下的概率,最后再根据概率来确定是否对用户进行营销干预,即推送相关的业务信息。
46.下面结合具体实施方式对本技术提供的技术方案做出详细说明。为了便于介绍,请参阅图3,图3为本技术实施例中的一种信息推送方法的里程示意图。该方法可以应用于上述服务器,服务器可以视为一种计算机设备,在本技术实施例中,以计算机设备作为执行主体对该信息推送方法进行介绍,该信息推送方法可以包括以下步骤:步骤s310,获取用户集合的用户特征数据,所述用户集合中的每个用户对应于至少一个业务类型,每个业务类型对应于至少一个业务场景。
47.具体地,用户特征数据是基于用户的历史操作进行分类和特征提取得到的信息。具体地,用户特征数据主要可以包括车主性别、年龄、地域等基础属性数据;活跃天数、活跃时长、活跃功能数量、注册时间距离当前时间天数间隔等活跃属性数据;充值金额、消费金额、充值次数、充值天数、首次充值距离当前时间天数间隔等充值属性数据;车主功能点击、车主领取礼包/礼券类型(数量、次数、价值)、使用礼包/礼券类型(数量、价值)、过期礼包/
礼券类型(数量、价值)等优惠券属性。
48.业务类型指的是用户使用的应用软件中所包括的业务分类。业务类型具体可以对应于一种软件功能或者一种服务业务,以出行应用为例,业务类型可以包括加油、洗车、代驾和保养等业务类型。业务场景针对于用户的使用情况规定的用户状态,主要包括拉新场景、流失预警场景和流失挽回场景等。每个业务类型都对应于至少一个业务场景。可以理解的是,不同的业务类型对应的业务场景可以是相同的,即,加油业务和洗车业务中都会存在拉新场景和流失预警场景等。每个用户可以存在于多个业务类型的多个业务场景中。例如,车主可以同时存在于洗车业务的拉新付费场景中以及保养业务的付费回流场景中。在一个实施例中,用户集合中包括两个或者两个以上的用户,并且每个用户对应于至少两个业务类型,每个业务类型对应于至少两个业务场景。
49.步骤s320,根据所述用户特征数据,对各个业务类型对应的各个业务场景进行预测,得到协同数据矩阵,其中,所述协同数据矩阵中包括各个业务类型对应的各个业务场景对应的概率得分。
50.其中,协同数据矩阵包括在各个业务的各个场景下的用户的概率得分。概率得分用于表示用于处于该场景的可能性。
51.协同数据矩阵可以由各个业务类型对应的概率向量组成。具体地,可以通过机器学习模型来对于各个业务类型预测用户属于该业务类型下各个业务场景的概率分值,从而得到业务类型对应的向量,再按照业务类型和用户来组合成协同数据矩阵。
52.步骤s330,根据所述用户集合对应的各个业务类型下的用户数量和各个业务场景下的用户数量,构建卷积核。
53.具体地,卷积核采用矩阵的形式,其矩阵的具体大小根据业务类型和业务场景的对应关系而定。例如,存在4种业务类型和3种业务场景,则卷积核为4
×
3的矩阵。矩阵中的各个分量根据各个业务类型下的用户数量和各个业务场景下的用户数量来计算。具体地,可以按照用户比值、差值、均值等方式计算。
54.步骤s340,根据所述卷积核对所述协同数据矩阵进行卷积计算,得到所述用户集合中每个用户的综合矩阵,所述综合矩阵包括用户对应于各个业务类型对应的各个业务场景的概率得分。
55.卷积计算的步长可以预先确定。具体地,步长可以根据业务类型的数量来确定。卷积计算可以采用卷积神经网络的方式来进行计算,利用预先训练好的卷积神经网络,输入确定好的卷积核和协同数据矩阵作为输入来得到每个用户的综合矩阵。综合矩阵中包括该用户在各个业务的各个场景下的概率得分。
56.步骤s350,根据各个用户的综合矩阵确定对应的推荐业务场景,向所述各个用户推送所述推荐业务场景对应的推荐信息。
57.具体地,可以将综合矩阵中对于各个业务类型下各个业务场景的概率得分与预设的阈值来进行比较,如果概率得分大于预设的阈值,则表示用户是在该概率得分对应的业务场景下的目标用户,则可以向用户推送该业务场景对应的推送信息。
58.在本技术的一些实施例中,基于以上技术方案,上述步骤s350,根据各个用户的综合矩阵确定对应的推荐业务场景,向所述各个用户推送所述推荐业务场景对应的推荐信息,包括:
根据所述卷积核对所述权重向量进行卷积计算,得到所述用户集合中每个用户的权重向量,所述权重向量包括用户对应于各个业务类型对应的各个业务场景的权重值;根据每个用户的综合矩阵,确定各个业务场景的目标用户;根据所述目标用户的权重向量,确定所述目标用户的推荐配置结果,所述推荐配置结果中包括推荐业务类型和对应的推荐业务场景;根据所述推荐配置结果中的推荐业务类型和对应的推荐业务场景,向所述目标用户推送推荐信息。
59.在本技术的实施例中,由于在计算过程中,将各个业务类型对应的业务场景的得分与用户分布综合进行计算得到综合得分,再根据用户的综合得分进行推送,从而能够综合各个业务类型和业务场景的推送情况,减少不必要的信息推送,从而避免信息推送活动对用户的骚扰,提升用户对信息推送活动的用户体验。
60.在本技术的一些实施例中,基于以上技术方案,所述用户特征数据包含历史特征数据和样本特征数据;上述步骤s320,根据所述用户特征数据,对各个业务类型对应的各个业务场景进行预测,得到协同数据矩阵,包括如下步骤:根据所述历史特征数据,利用对应于各个业务场景的权重模型计算各个业务场景对应的权重向量;根据所述样本特征数据和所述权重向量进行概率预测,得到各个业务场景对应的概率得分向量;根据所述概率得分向量和所述用户集合进行用户分组,得到对应于所述用户集合的协同数据矩阵。
61.具体地,历史特征数据和样本特征数据根据时间周期来划分的。当前的时间周期为第k个周期,则历史特征数据是1至k-1个周期中的数据,而样本特征数据是第k个周期中的数据。例如,时间周期为一个月,当前时间在12月,则历史特征数据可以是1月到11月的数据,而样本特征数据为12月的数据。
62.服务器根据所述历史特征数据,利用对应于各个业务场景的权重模型计算各个业务场景对应的权重向量。其中,各个业务类型下的各个业务场景都会存在对应的权重模型,各个权重模型可以采用相同的模型结构,但是相互独立地进行训练。因此,若有4种业务类型和3种业务场景,则可以存在12个权重模型。将历史特征数据输入到各个业务场景的权重模型中,从而得到对应于各个业务场景的权重向量。
63.根据权重向量和样本特征数据,基于逻辑回归算法进行预测,可以得到各个业务场景下的概率得分向量,表示第i个业务类型下的第j个场景的概率得分向量。
64.最后,对于用户集合中的各个用户来将概率得分向量组合成更高维度的协同数据矩阵,该协同数据矩阵为u*m*n阶的矩阵,其中u表示是用户的数量,m表示业务类型的数量,n表示业务场景的数量。该协同数据矩阵通常可以是一个含有缺失值的矩阵。缺失值表示有部分车主在某些业务或者场景下没有得分或者没有出现在该业务或场景下或者该车主并不是该业务或者场景的目标车主。
65.在本技术的一些实施例中,基于以上技术方案,所述根据所述历史特征数据,利用
对应于各个业务场景的权重模型计算各个业务场景对应的权重向量的步骤可以包括如下步骤:根据所述历史特征数据,确定对应于各个业务类型的各个业务场景的训练样本集合和测试样本集合;获取所述各个业务类型的各个业务场景对应的权重模型;将对应于所述各个业务场景的训练样本集合和测试样本集合分别输入到对应的权重模型进行计算和测试,得到对应于各个业务场景的权重向量。
66.在本技术的一些实施例中,基于以上技术方案,所述将对应于所述各个业务场景的训练样本集合和测试样本集合分别输入到对应的权重模型进行计算和测试,得到对应于各个业务场景的权重向量的步骤可以包括如下步骤:将对应于各个业务场景的训练样本集合和所述测试样本集合分别输入待训练模型中进行迭代训练;当达到迭代结束条件时,获取训练过的待训练模型作为权重模型;获取各个权重模型输出的预测结果作为对应于各个业务场景的权重向量。
67.在本技术的一些实施例中,基于以上技术方案,所述根据所述历史特征数据,确定对应于各个业务类型的各个业务场景的训练样本集合和测试样本集合的步骤可以包括如下步骤:根据所述历史特征数据,确定所述用户集合中各个用户对应的业务场景;根据所述各个用户对应业务类型和业务场景,对所述历史特征数据进行分组,得到对应于各个业务类型对应的各个业务场景的历史数据分组;将所述历史数据分组中的数据划分成稀疏特征数据集合和稠密特征数据集合;按照预设的数据组合比例对所述稀疏特征数据集合和稠密特征数据集合中的数据进行组合,得到对应于各个业务场景的训练样本集合和测试样本集合。
68.在本技术的一些实施例中,基于以上技术方案,根据所述历史特征数据,确定所述用户集合中各个用户对应的业务场景的步骤可以包括如下步骤:基于所述历史特征数据,对于各个业务类型,确定各个用户在第k-1个时间周期的消费特征数据和活跃特征数据,其中,所述第k-1个时间周期为当前时间周期的上一个时间周期,k为大于2的整数;根据各个用户的所述消费特征数据和活跃特征数据确定各个用户的业务场景;若用户在第k个时间周期之前未进行过登陆,确定所述用户对应的业务场景为拉新场景;若用户在第k-1个时间周期进行过登陆,在所述第k个时间周期未进行登录,确定所述用户对应的业务场景为流失预警场景;若用户在第k-2个时间周期进行过登陆,在所述第k-1个时间周期未进行登录,在所述第k个时间周期进行登录,确定所述用户对应的业务场景为流失挽回场景;若用户在第k个时间周期之前进行过登陆但未消费,在第k个时间周期进行登录并消费,确定所述用户对应的业务场景为付费新增场景;若用户在第k-2个时间周期进行过登陆并消费,在第k-1个时间周期进行登录未消费,在第k个时间周期进行登录并消费,确定所述用户对应的业务场景为付费回流场景。
69.具体地,以优惠加油功能模块为例进行介绍。拉新场景标签构建如下:k期之前车主从没有登录过优惠加油功能模块,k期登录该模块,表示该车主为优惠加油模块的新增车主,标记为1;否则,标记为0。
70.流失预警场景标签构建如下:k-1期车主登录优惠加油功能模块,k期没有登录该模块,表示该车主为第k期在优惠加油模块的流失车主,标记为1;否则,k-1期车主登录优惠加油功能模块,k期也登录该模块,表示该车主为第k期在优惠加油模块的留存车主,标记为0。
71.流失挽回场景标签构建如下:k-2期车主登录优惠加油功能模块,k-1期没有登录该模块,k期登录该模块,表示该车主为第k期在优惠加油模块的回流车主,标记为1;否则,k-2期车主登录优惠加油功能模块,k-1期没有登录该模块,k期也没有登录该模块,表示该车主为第k期在优惠加油模块的流失车主,标记为0。
72.付费拉新场景标签构建如下:k期之前车主登录优惠加油功能模块但没有支付订单,k期登录该模块且有支付订单,表示该车主为优惠加油模块的付费新增车主,标记为1;否则,标记为0。
73.付费回流场景标签构建如下:k-2期车主登录优惠加油功能模块且有支付订单,k-1期登录该模块但没有支付订单,k期登录该模块且支付订单,表示该车主为第k期在优惠加油模块的付费回流车主,标记为1;否则,k-2期车主登录优惠加油功能模块且有支付订单,k-1期登录该模块但没有支付订单,k期登录该模块但没支付订单,表示该车主为第k期在优惠加油模块的付费流失车主,标记为0。
74.在本技术的一些实施例中,基于以上技术方案,所述根据所述样本特征数据和所述权重向量进行概率预测,得到各个业务场景对应的概率得分向量可以包括如下步骤:获取所述业务场景对应的概率预测模型;根据所述权重向量对应的业务场景,将所述样本特征数据和所述权重向量输入到对应的概率预测模型中,得到对应于各个业务场景的概率得分向量。
75.具体地,概率预测模型可以采用逻辑回归模型来实现。每种业务类型的业务场景对应于一个概率预测模型。该概率预测模型的输出为权重模型根据历史特征数据计算得到的权重向量以及要预测的样本特征数据,输出则为各个业务场景的概率得分向量。
76.在本技术的一些实施例中,基于以上技术方案,根据所述概率得分向量和所述用户集合进行用户分组,得到对应于所述用户集合的协同数据矩阵的步骤可以包括如下的步骤:基于所述用户集合中的用户在各个业务类型对应的各个业务场景下的概率得分向量,构建带有缺失值的概率矩阵,所述概率矩阵的第i行第j列为用户i在业务场景j的概率得分向量,所述缺失值表示用户与所述缺失值对应的业务场景之间没有对应关系;将所述概率矩阵输入到协同过滤模型中进行缺失值预测,得到协同概率矩阵。
77.具体地,在本实施例中,在构建协同数据矩阵时,可以首先构造出含有缺失值的概率矩阵,概率矩阵的第i行第j列为用户i在业务场景j的概率得分向量,所述缺失值表示用户与所述缺失值对应的业务场景之间没有对应关系,例如用户未使用过该业务功能或者不属于对应的业务场景,诸如拉新场景的用户不会存在于回流或者流失场景。
78.随后,通过训练好的协同过滤模型来预测概率矩阵中的缺失值,输出的结果是不
含有缺失值的矩阵,并且将不含有缺失值的矩阵作为协同概率矩阵。
79.在本技术的一些实施例中,基于以上技术方案,所述根据所述用户集合对应的各个业务类型下的用户数量和各个业务场景下的用户数量,构建卷积核的步骤可以包括如下的步骤:根据所述用户特征数据,确定各个业务类型的用户数量以及各个业务类型对应的业务场景的用户数量;根据各个业务场景的用户数量与对应的业务类型的用户数量的比值,确定各个业务场景的卷积权重;根据所述各个业务场景的卷积权重以及对应的业务场景,构建卷积核。
80.在本实施例中,卷积核根据业务场景的用户数量与业务类型的用户数量的比值来确定。用户数量通过对用户数据特征进行统计来确定。具体地,分别统计各个业务类型的用户数量及各个业务类型下每个业务场景的车主数量。从而得到各个业务场景的权重,其中表示第i个业务中第j个场景的用户占比,从而得到非对称卷积核: 。
81.下面,以车辆出行应用的营销推广为例,介绍本技术的方案的具体应用过程。为了便于介绍,请参阅图4,图4为本技术实施例中的一种具体流程的示意图。如图4所示,车辆出行应用中包括加油、洗车、代驾和保养四种业务类型,并且每种业务类型中存在活跃拉新、流失预警和流失挽回三种业务场景。
82.首先,对于应用收集到的数据进行处理。收集的数据可以车主使用应用的系统日志。通过将数据分别处理成车主特征数据并且标记对应的场景标签,从而构建各个场景下的训练样本、测试样本、预测样本。具体地,以加油为例,场景标签标记的方式如下,其他的场景标签的标记是类似的:对于拉新场景标签,k期之前车主从没有登录过优惠加油功能模块,k期登录该模块,表示该车主为优惠加油模块的新增车主,标记为1;否则,标记为0。
83.对于流失预警场景标签,k-1期车主登录优惠加油功能模块,k期没有登录该模块,表示该车主为第k期在优惠加油模块的流失车主,标记为1;否则,k-1期车主登录优惠加油功能模块,k期也登录该模块,表示该车主为第k期在优惠加油模块的留存车主,标记为0。
84.对于流失挽回场景标签,k-2期车主登录优惠加油功能模块,k-1期没有登录该模块,k期登录该模块,表示该车主为第k期在优惠加油模块的回流车主,标记为1;否则,k-2期车主登录优惠加油功能模块,k-1期没有登录该模块,k期也没有登录该模块,表示该车主为第k期在优惠加油模块的流失车主,标记为0。
85.对于付费拉新场景标签,k期之前车主登录优惠加油功能模块但没有支付订单,k期登录该模块且有支付订单,表示该车主为优惠加油模块的付费新增车主,标记为1;否则,标记为0。
86.对于付费回流场景标签,k-2期车主登录优惠加油功能模块且有支付订单,k-1期
登录该模块但没有支付订单,k期登录该模块且支付订单,表示该车主为第k期在优惠加油模块的付费回流车主,标记为1;否则,k-2期车主登录优惠加油功能模块且有支付订单,k-1期登录该模块但没有支付订单,k期登录该模块但没支付订单,表示该车主为第k期在优惠加油模块的付费流失车主,标记为0。
87.随后,根据车主特征数据和场景标签们,构建出训练样本、测试样本和预测样本。具体地,使用k-1时期的车主特征数据和对应的场景标签构建车主样本数据,并将整体样本(训练+测试)进行区分为稀疏型特征和稠密型特征。其中,稀疏型特征进行onehot处理,稠密型特征进行去相关性处理、归一化(标准化)处理、特征离散化处理等。将处理后的稀疏特征和稠密特征及车主分类标签,并按一定比例随机切分为训练样本(比例为а)和测试样本(比例为1-а),例如,可以按8:2的比例将车主样本数据随机切分训练样本和测试样本。预测样本则使用k时期的车主特征数据和对应的场景标签构建预测样本数据,并将预测样本进行区分为稀疏型特征和稠密型特征,处理方式与测试样本相同。
88.在得到训练样本、测试样本和预测样本后,首先将训练样本、测试样本。采用lr(逻辑归回,logistic regression)二分类模型对每个场景的训练和测试样本进行模型训练和测试,如果测评指标(查全率和查准率等指标)达到测评效果,则分别保存模型输出的模型权重向量。其中,表示第i个业务第j个场景的模型权重向量。
89.然后,将所得到的模型权重向量和对应的预测样本通过lr算法进行预测,得到各个场景下的概率得分向量。其中,表示第i个业务第j个场景的概率得分向量。
90.根据所得到的概率得分向量,可以构建基于“车主-业务-场景”三维带缺失数据的协同过滤矩阵。具体地,构建的过程可以通过协同过滤模型来进行。该矩阵每一行表示每个车主在各个业务的各个场景下的得分向量,每一列表示该场景下所有车主的得分向量,缺失值表示有部分车主在某些业务或者场景下没有得分或者没有出现在该业务或场景下或者该车主并不是该业务或者场景的目标车主。
91.在各个场景的场景标签数据之后,就可以构建卷积核。具体地,通过统计各个业务类型的车主数量和各个业务场景的车主数量,计算各个业务场景的车主数量与对应业务类型的车主数量的比例,可以得到卷积核,例如,。
92.根据卷积核和之前计算得到的概率得分矩阵和权重向量,可以计算每个车主的综合得分矩阵和权重矩阵。具体地,对概率得分矩阵按照非对称卷积核进行步长为4的卷积得到每个车主的综合得分矩阵,根据对权重向量按照非对称卷积核进行步长为4的卷积得到每个车主在各个业务及对应场景下的权重矩阵。
93.基于综合得分矩阵和权重矩阵进行营销推荐。具体地,基于综合得分矩阵,给定阈
值,对于得分高于阈值的记为1,即表示目标推荐车主;否则记为0,即表示非推荐车主。根据权重矩阵,得到每个车主在各个业务及对应场景的活动配置比例。然后,根据各个配置比例对多业务多场景中的各个业务进行营销活动配置,并且向目标推荐车主进行营销推荐。
94.在本技术的具体实施方式中,涉及到用户信息、区块中的交易数据等相关的数据,当本技术以上实施例运用到具体产品或技术中时,需要获得用户许可或者同意,且相关数据的收集、使用和处理需要遵守相关国家和地区的相关法律法规和标准。
95.应当注意,尽管在附图中以特定顺序描述了本技术中方法的各个步骤,但是,这并非要求或者暗示必须按照该特定顺序来执行这些步骤,或是必须执行全部所示的步骤才能实现期望的结果。附加的或备选的,可以省略某些步骤,将多个步骤合并为一个步骤执行,以及/或者将一个步骤分解为多个步骤执行等。
96.以下介绍本技术的装置实施,可以用于执行本技术上述实施例中的信息推送方法。图5示意性地示出了本技术实施例中信息推送装置的组成框图。如图5所示,信息推送装置500主要可以包括:数据获取模块510,用于获取用户集合的用户特征数据,所述用户集合中的每个用户对应于至少一个业务类型,每个业务类型对应于至少一个业务场景;矩阵预测模块520,用于根据所述用户特征数据,对各个业务类型对应的各个业务场景进行预测,得到协同数据矩阵,其中,所述协同数据矩阵中包括各个业务类型对应的各个业务场景对应的概率得分;卷积核构建模块530,用于根据所述用户集合对应的各个业务类型下的用户数量和各个业务场景下的用户数量,构建卷积核;卷积计算模块540,用于根据所述卷积核对所述协同数据矩阵进行卷积计算,得到所述用户集合中每个用户的综合矩阵,所述综合矩阵包括用户对应于各个业务类型对应的各个业务场景的概率得分;信息推送模块550,用于根据各个用户的综合矩阵确定对应的推荐业务场景,向所述各个用户推送所述推荐业务场景对应的推荐信息。
97.在本技术的一些实施例中,基于以上技术方案,所述用户特征数据包含历史特征数据和样本特征数据;所述矩阵预测模块520,包括:权重计算子模块,用于根据所述历史特征数据,利用对应于各个业务场景的权重模型计算各个业务场景对应的权重向量;概率预测子模块,用于根据所述样本特征数据和所述权重向量进行概率预测,得到各个业务场景对应的概率得分向量;用户分组子模块,用于根据所述概率得分向量和所述用户集合进行用户分组,得到对应于所述用户集合的协同数据矩阵。
98.在本技术的一些实施例中,基于以上技术方案,所述信息推送模块550,包括:卷积计算子模块,用于根据所述卷积核对所述权重向量进行卷积计算,得到所述用户集合中每个用户的权重向量,所述权重向量包括用户对应于各个业务类型对应的各个业务场景的权重值;
用户确定子模块,用于根据每个用户的综合矩阵,确定各个业务场景的目标用户;配置结果确认子模块,用于根据所述目标用户的权重向量,确定所述目标用户的推荐配置结果,所述推荐配置结果中包括推荐业务类型和对应的推荐业务场景;推送子模块,用于根据所述推荐配置结果中的推荐业务类型和对应的推荐业务场景,向所述目标用户推送推荐信息。
99.在本技术的一些实施例中,基于以上技术方案,所述权重计算子模块,包括:训练样本确定单元,用于根据所述历史特征数据,确定对应于各个业务类型的各个业务场景的训练样本集合和测试样本集合;权重模型获取单元,用于获取所述各个业务类型的各个业务场景对应的权重模型;权重模型训练单元,用于将对应于所述各个业务场景的训练样本集合和测试样本集合分别输入到对应的权重模型进行计算和测试,得到对应于各个业务场景的权重向量。
100.在本技术的一些实施例中,基于以上技术方案,所述权重模型训练单元,包括:迭代训练子单元,用于将对应于各个业务场景的训练样本集合和所述测试样本集合分别输入待训练模型中进行迭代训练;权重模型确定子单元,用于当达到迭代结束条件时,获取训练过的待训练模型作为权重模型;权项向量获取子单元,用于获取各个权重模型输出的预测结果作为对应于各个业务场景的权重向量。
101.在本技术的一些实施例中,基于以上技术方案,所述训练样本确定单元包括:业务场景确定子单元,用于根据所述历史特征数据,确定所述用户集合中各个用户对应的业务场景;历史数据分组子单元,用于根据所述各个用户对应业务类型和业务场景,对所述历史特征数据进行分组,得到对应于各个业务类型对应的各个业务场景的历史数据分组;特征划分子单元,用于将所述历史数据分组中的数据划分成稀疏特征数据集合和稠密特征数据集合;数据组合子单元,用于按照预设的数据组合比例对所述稀疏特征数据集合和稠密特征数据集合中的数据进行组合,得到对应于各个业务场景的训练样本集合和测试样本集合。
102.在本技术的一些实施例中,基于以上技术方案,所述业务场景确定子单元配置成:基于所述历史特征数据,对于各个业务类型,确定各个用户在第k-1个时间周期的消费特征数据和活跃特征数据,其中,所述第k-1个时间周期为当前时间周期的上一个时间周期,k为大于2的整数;根据各个用户的所述消费特征数据和活跃特征数据确定各个用户的业务场景;若用户在第k个时间周期之前未进行过登陆,确定所述用户对应的业务场景为拉新场景;若用户在第k-1个时间周期进行过登陆,在所述第k个时间周期未进行登录,确定所述用户对应的业务场景为流失预警场景;若用户在第k-2个时间周期进行过登陆,在所述第k-1个时间周期未进行登录,在
所述第k个时间周期进行登录,确定所述用户对应的业务场景为流失挽回场景;若用户在第k个时间周期之前进行过登陆但未消费,在第k个时间周期进行登录并消费,确定所述用户对应的业务场景为付费新增场景;若用户在第k-2个时间周期进行过登陆并消费,在第k-1个时间周期进行登录未消费,在第k个时间周期进行登录并消费,确定所述用户对应的业务场景为付费回流场景。
103.在本技术的一些实施例中,基于以上技术方案,所述概率预测子模块,包括:概率模型获取单元,用于获取所述业务场景对应的概率预测模型;得分向量计算单元,用于根据所述权重向量对应的业务场景,将所述样本特征数据和所述权重向量输入到对应的概率预测模型中,得到对应于各个业务场景的概率得分向量。
104.在本技术的一些实施例中,基于以上技术方案,所述用户分组子模块,包括:概率矩阵构建单元,用于基于所述用户集合中的用户在各个业务类型对应的各个业务场景下的概率得分向量,构建带有缺失值的概率矩阵,所述概率矩阵的第i行第j列为用户i在业务场景j的概率得分向量,所述缺失值表示用户与所述缺失值对应的业务场景之间没有对应关系;缺失值预测单元,用于将所述概率矩阵输入到协同过滤模型中进行缺失值预测,得到协同概率矩阵。
105.在本技术的一些实施例中,基于以上技术方案,所述卷积核构建模块530,包括:用户数量确定子模型,用于根据所述用户特征数据,确定各个业务类型的用户数量以及各个业务类型对应的业务场景的用户数量;卷积权重子模型,用于根据各个业务场景的用户数量与对应的业务类型的用户数量的比值,确定各个业务场景的卷积权重;卷积核构建子模型,用于根据所述各个业务场景的卷积权重以及对应的业务场景,构建卷积核。
106.需要说明的是,上述实施例所提供的装置与上述实施例所提供的方法属于同一构思,其中各个模块执行操作的具体方式已经在方法实施例中进行了详细描述,此处不再赘述。
107.图6示出了适于用来实现本技术实施例的电子设备的计算机系统的结构示意图。
108.需要说明的是,图6示出的电子设备的计算机系统600仅是一个示例,不应对本技术实施例的功能和使用范围带来任何限制。
109.如图6所示,计算机系统600包括中央处理单元(central processing unit,cpu)601,其可以根据存储在只读存储器(read-only memory,rom)602中的程序或者从储存部分608加载到随机访问存储器(random access memory,ram)603中的程序而执行各种适当的动作和处理。在ram 603中,还存储有系统操作所需的各种程序和数据。cpu 601、rom 602以及ram 603通过总线604彼此相连。输入/输出(input /output,i/o)接口605也连接至总线604。
110.以下部件连接至i/o接口605:包括键盘、鼠标等的输入部分606;包括诸如阴极射线管(cathode ray tube,crt)、液晶显示器(liquid crystal display,lcd)等以及扬声器等的输出部分607;包括硬盘等的储存部分608;以及包括诸如lan(local area network,局
域网)卡、调制解调器等的网络接口卡的通信部分609。通信部分609经由诸如因特网的网络执行通信处理。驱动器610也根据需要连接至i/o接口605。可拆卸介质611,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器610上,以便于从其上读出的计算机程序根据需要被安装入储存部分608。
111.特别地,根据本技术的实施例,各个方法流程图中所描述的过程可以被实现为计算机软件程序。例如,本技术的实施例包括一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信部分609从网络上被下载和安装,和/或从可拆卸介质611被安装。在该计算机程序被中央处理单元(cpu)601执行时,执行本技术的系统中限定的各种功能。
112.需要说明的是,本技术实施例所示的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(ram)、只读存储器(rom)、可擦式可编程只读存储器(erasable programmable read only memory,eprom)、闪存、光纤、便携式紧凑磁盘只读存储器(compact disc read-only memory,cd-rom)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本技术中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本技术中,计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:无线、有线等等,或者上述的任意合适的组合。
113.附图中的流程图和框图,图示了按照本技术各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,上述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图或流程图中的每个方框、以及框图或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
114.应当注意,尽管在上文详细描述中提及了用于动作执行的设备的若干模块或者单元,但是这种划分并非强制性的。实际上,根据本技术的实施方式,上文描述的两个或更多模块或者单元的特征和功能可以在一个模块或者单元中具体化。反之,上文描述的一个模块或者单元的特征和功能可以进一步划分为由多个模块或者单元来具体化。
115.通过以上的实施方式的描述,本领域的技术人员易于理解,这里描述的示例实施方式可以通过软件实现,也可以通过软件结合必要的硬件的方式来实现。因此,根据本技术实施方式的技术方案可以以软件产品的形式体现出来,该软件产品可以存储在一个非易失性存储介质(可以是cd-rom,u盘,移动硬盘等)中或网络上,包括若干指令以使得一台计算设备(可以是个人计算机、服务器、触控终端、或者网络设备等)执行根据本技术实施方式的方法。
116.本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本技术的其它实施方案。本技术旨在涵盖本技术的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本技术的一般性原理并包括本技术未公开的本技术领域中的公知常识或惯用技术手段。
117.应当理解的是,本技术并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本技术的范围仅由所附的权利要求来限制。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1