本发明涉及服务器数据处理技术领域,尤其涉及一种消息推送装置及方法。
背景技术:
目前,服务器在消息推送的过程中,一般是将推送消息推送至所有与服务器保存长连接的移动终端,而由于有些用户对某些消息并不感兴趣,即使移动终端接收到这类推送消息,用户也不会点开进行查看,因此这样的推送方式达不到预期的效果。或者是,服务器根据收集到用户行为数据有针对性地进行消息推送,但是服务器收集到的用户行为数据,仅仅是对移动终端上报的数据进行简单的累计而得到的,得到的该用户行为数据并不能代表用户对某些消息感兴趣,可靠性较低,导致服务器推送消息的效率较低。
技术实现要素:
本发明的主要目的在于提供一种消息推送装置及方法,旨在提高服务器进行消息推送的可靠性及效率。
为实现上述目的,本发明提供了一种消息推送装置,应用于服务器端,所述消息推送装置包括:
设定模块,用于在接收到移动终端上报的数据后,获取所述数据中包含的用户信息及物品信息,对所述用户信息设定用户标签,以及对所述物品信息设定物品标签;
获取模块,用于将所述用户信息、所述用户标签、所述物品信息和/或所述物品标签,输入预置的数学模型获取用户兴趣数据;
推送模块,用于根据自定义规则对所述用户兴趣数据进行筛选,确定目标推送消息及对应的目标移动终端,将所述目标推送消息推送至所述目标移动终端。
可选地,所述获取模块包括:
第一获取单元,用于根据所述用户信息及所述物品信息获取时间指标;
计算单元,用于根据所述时间指标、所述用户标签及所述物品标签通过所述数学模型计算用户兴趣数据。
可选地,当物品信息为阅读文章的信息时,所述第一获取单元还用于,根据所述用户信息包含的阅读所有文章所花费的总时间与对应阅读所有文章总量,确定平均阅读速度;
根据所述平均阅读速度,及所述用户信息包含的对指定文章的阅读时间、所述指定文章的内容字数,计算阅读所述指定文章的时间指标。
可选地,所述推送模块包括:
第一确定单元,用于根据自定义规则对所述用户兴趣数据进行筛选,确定目标推送消息及对应的第一目标移动终端;
第二获取单元,用于获取与第一目标移动终端的用户兴趣数据的相似度大于预设阈值的第二移动终端;
第一推送单元,用于将所述目标推送消息推送至所述第一移动终端,当侦测到所述第一移动终端对所述目标推送消息进行浏览时,将所述目标推送消息推送至所述第二移动终端。
可选地,所述推送模块还包括:
第二确定单元,用于根据自定义规则对所述用户兴趣数据进行筛选,确定第一目标推送消息及对应的目标移动终端;
第三获取单元,用于获取与所述第一目标推送消息的相似度大于预设相似值的第二目标推送消息;
第二推送单元,用于将第一目标推送消息推送至所述目标移动终端,当侦测到所述目标移动终端对所述第一目标推送消息进行浏览时,将所述第二目标推送消息推送至所述目标移动终端。
此外,为实现上述目的,本发明还提供了一种消息推送方法,应用于服务器端,所述消息推送方法包括:
在接收到移动终端上报的数据后,获取所述数据中包含的用户信息及物品信息,对所述用户信息设定用户标签,以及对所述物品信息设定物品标签;
将所述用户信息、所述用户标签、所述物品信息和/或所述物品标签,输入预置的数学模型获取用户兴趣数据;
根据自定义规则对所述用户兴趣数据进行筛选,确定目标推送消息及对应的目标移动终端,将所述目标推送消息推送至所述目标移动终端。
可选地,所述将所述用户信息、所述用户标签、所述物品信息和/或所述物品标签,输入预置的数学模型获取用户兴趣数据包括:
根据所述用户信息及所述物品信息获取时间指标;
根据所述时间指标、所述用户标签及所述物品标签通过所述数学模型计算用户兴趣数据。
可选地,当物品信息为阅读文章的信息时,所述根据所述用户信息及所述物品信息获取时间指标包括:
根据所述用户信息包含的阅读所有文章所花费的总时间与对应阅读所有文章总量,确定平均阅读速度;
根据所述平均阅读速度,及所述用户信息包含的对指定文章的阅读时间、所述指定文章的内容字数,计算阅读所述指定文章的时间指标。
可选地,所述根据自定义规则对所述用户兴趣数据进行筛选,确定目标推送消息及对应的目标移动终端,将所述目标推送消息推送至所述目标移动终端包括:
根据自定义规则对所述用户兴趣数据进行筛选,确定目标推送消息及对应的第一目标移动终端;
获取与第一目标移动终端的用户兴趣数据的相似度大于预设阈值的第二移动终端;
将所述目标推送消息推送至所述第一移动终端,当侦测到所述第一移动终端对所述目标推送消息进行浏览时,将所述目标推送消息推送至所述第二移动终端。
可选地,所述根据自定义规则对所述用户兴趣数据进行筛选,确定目标推送消息及对应的目标移动终端,将所述目标推送消息推送至所述目标移动终端还包括:
根据自定义规则对所述用户兴趣数据进行筛选,确定第一目标推送消息及对应的目标移动终端;
获取与所述第一目标推送消息的相似度大于预设相似值的第二目标推送消息;
将第一目标推送消息推送至所述目标移动终端,当侦测到所述目标移动终端对所述第一目标推送消息进行浏览时,将所述第二目标推送消息推送至所述目标移动终端。
本发明实施例服务器在接收到移动终端上报的数据后,获取数据中包含的用户信息及物品信息,对用户信息设定用户标签,以及对物品信息设定物品标签;将用户信息、用户标签、物品信息和/或物品标签,输入预置的数学模型获取用户兴趣数据。然后根据自定义规则对用户兴趣数据进行筛选,确定目标推送消息及对应的目标移动终端,将目标推送消息推送至目标移动终端。使得通过对移动终端上报的数据进行分类及设定标签后,通过数学模型获取用户兴趣数据来确定目标推送消息推送至目标移动终端,提高了服务器进行消息推送的可靠性及效率。
附图说明
图1为本发明消息推送装置第一实施例的模块示意图;
图2为本发明消息推送装置第四实施例的模块示意图;
图3为本发明消息推送装置第五实施例的模块示意图;
图4为本发明消息推送方法第二实施例的流程示意图;
图5为本发明消息推送方法第四实施例的流程示意图;
图6为本发明消息推送方法第五实施例的流程示意图。
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
如图1所示,示出了本发明一种消息推送装置第一实施例。该实施例的消息推送装置包括:
设定模块100,用于在接收到移动终端上报的数据后,获取所述数据中包含的用户信息及物品信息,对所述用户信息设定用户标签,以及对所述物品信息设定物品标签;
本实施例中,消息推送装置应用于服务器,服务器在接收到移动终端上报的数据后,需要对数据进行预处理。该移动终端的类型可根据实际需要进行设置,例如,该移动终端包括手机、电脑等。
具体地,设定模块100对数据进行预处理的过程中,可将数据进行分类,获取数据中包含的用户信息及物品信息。该用户信息包括用户编号(即用户ID)、工作、年龄、性别、地址等。该用户信息还包括用户行为信息,例如,所在位置、所使用的网络、浏览新闻的时长、新闻部分浏览页面数、各个页面停留时长、总页面数、相关阅读的浏览时长、点击个数、评论浏览时长、评论点赞个数、点赞、分享、评论(评论包括评价内容、不喜欢等),用户信息包括还包括用户负反馈信息等。
然后设定模块100为用户信息设定用户标签,该用户标签可以通过一开始上报的数据、第三方社交网络爬取的数据、以及后续的用户阅读的资讯新闻等方面反馈生成。例如,提取用户的具体属性,例如对年龄分段,分为0~20、20~50、>50等年龄段,以将这些属性数字化。即用户标签包括用户编号、通过的特征信息、权重等。用户标签还包括浏览到第几个页面、开始时间、结束时间、持续时间、是否点赞、不喜欢的理由、是否分享等。
该物品信息包括新闻编号、新闻标题、新闻时间、是否热点数据、点击次数、评论个数、文章长度、文章标题、热点文章、文章的来源、文章发布的时间、浏览次数、下载次数等。以及设定模块100为物品信息设定物品标签,该物品标签可以通过新闻资讯的上报的标签信息,以及服务器对新闻资讯的爬取获取得到的标签。例如,物品标签包括新闻编号、新闻特征等,新闻特征是指新闻所属的类别;或者物品标签包括应用编号、应用特征等,应用特征是应用所属的类别。
用户标签亦即用户信息标签化,例如某用户的标签为女、31岁、已婚、收入1万以上、爱美食、团购达人等。物品标签亦即物品信息标签化。为用户信息及物品信息打标签的重要目的之一是为了方便服务器对数据进行处理,例如,可以做分类统计:喜欢红酒的用户有多少、喜欢红酒的人群中男女比例是多少;也可以做数据挖掘工作:利用关联规则计算喜欢红酒的人通常喜欢什么运动品牌、利用聚类算法分析喜欢红酒的人年龄段分布情况,等等。用户标签和物品标签能够提升精准度,提高信息获取的效率。
获取模块200,用于将所述用户信息、所述用户标签、所述物品信息和/或所述物品标签,输入预置的数学模型获取用户兴趣数据;
本实施例中,服务器预先设置有数学模型,该数学模型用于对用户兴趣数据进行计算,该用户兴趣数据可以是用户对物品的兴趣度,以下实施例将进行详细说明。在得到用户信息、用户标签、物品信息和物品标签后,获取模块200可将用户信息、用户标签、物品信息和/或物品标签输入预置的数学模型,通过该数学模型输出用户兴趣数据。
推送模块300,用于根据自定义规则对所述用户兴趣数据进行筛选,确定目标推送消息及对应的目标移动终端,将所述目标推送消息推送至所述目标移动终端。
在得到用户兴趣数据后,可根据各个业务的自定义规则对用户兴趣数据进行筛选,可以是进行排序筛选、或者是综合筛选等,以得到满足一定条件的用户兴趣数据。例如,筛选出用户兴趣数据中兴趣度最高的前3个。
然后推送模块300根据筛选后的用户兴趣数据确定目标推送消息及对应的目标移动终端,将目标推送消息推送至目标移动终端。该推送方式可以是离线推荐、在线推荐、实时推荐等,后续服务器还可以对推荐结果进行评价。服务器还可以将推送消息以邮件、弹窗、短信等形式推送至目标移动终端,目标移动终端在接收到服务器推送的消息后,用户可以选择进行查看、下载或删除等。从而实现了有效利用移动终端上报的数据,进行用户特征挖掘,为应用中心、浏览器、视界等提供推荐服务。
需要说明的是,为了提高服务器对消息进行推送的可靠性,服务器还可以在接收到多个移动终端上报的数据后,将多个移动终端上报的数据随机分为A组和B组,然后分别对A组和B组中的数据进行预处理。对A组得到的用户信息、用户标签、物品信息和/或物品标签输入第一数学模型获取用户兴趣数据,根据用户兴趣数据将推送消息推送至第一移动终端,并对推荐结果进行评价,得到第一评价数据,该评价数据即为用户对消息的兴趣度。以及对B组得到的用户信息、所述用户标签、物品信息和/或物品标签输入第二数学模型获取用户兴趣数据,根据用户兴趣数据将推送消息推送至第二移动终端,并推荐结果进行评价,得到第二评价数据。当第一评价数据的评价值大于第二评价数据的评价值时,将第一数学模型设置为目标数学模型,否则将第二数学模型设置为目标数学模型,以便通过目标数学模型获取用户兴趣数据是对推送消息进行推送。
本发明实施例服务器在接收到移动终端上报的数据后,获取数据中包含的用户信息及物品信息,对用户信息设定用户标签,以及对物品信息设定物品标签;将用户信息、用户标签、物品信息和/或物品标签,输入预置的数学模型获取用户兴趣数据。然后根据自定义规则对用户兴趣数据进行筛选,确定目标推送消息及对应的目标移动终端,将目标推送消息推送至目标移动终端。使得通过对移动终端上报的数据进行分类及设定标签后,通过数学模型获取用户兴趣数据来确定目标推送消息推送至目标移动终端,提高了服务器进行消息推送的可靠性及效率。
进一步地,基于上述消息推送装置第一实施例,提出了本发明消息推送装置第二实施例,本实施例与本发明消息推送装置第一实施例的区别是,本实施例中上述获取模块200包括:
第一获取单元,用于根据所述用户信息及所述物品信息获取时间指标;
计算单元,用于根据所述时间指标、所述用户标签及所述物品标签通过所述数学模型计算用户兴趣数据。
本实施例中,服务器在根据数学模型对用户兴趣数据进行计算的过程中,首先由第一获取单元根据用户信息及所述物品信息获取时间指标,以下实施例将进行详细说明。然后由计算单元根据时间指标、用户标签及物品标签通过所述数学模型计算用户兴趣数据,用户兴趣数据即为用户兴趣度。
以下将进行举例说明,当物品信息为新闻时,可通过权重对数据进行量化,来计算用户对物品的兴趣度,计算的数学模型如下:
UC表示用户兴趣数据,1表示偏移,NCi表示第i篇新闻资讯的分类(即物品标签),n表示用户看的新闻数量,α表示时间指标的权重系数,β表示评论指标的权重系数,γ为点赞分享的权重系数,α、β、γ系数可根据具体情况而灵活设置。time表示时间指标,comment表示评论指标,share表示点赞分享,unlike表示不喜欢指标(即用户标签)。
本实施例服务器根据用户信息及物品信息获取时间指标,然后根据时间指标、用户标签及物品标签通过数学模型计算用户兴趣数据,提高了对用户兴趣数据获取的可靠性。
进一步地,基于上述消息推送装置第二实施例,提出了本发明消息推送装置第三实施例,本实施例与本发明消息推送装置第二实施例的区别是,本实施例中上述当物品信息为阅读文章的信息时,第一获取单元还用于,根据所述用户信息包含的阅读所有文章所花费的总时间与对应阅读所有文章总量,确定平均阅读速度;
根据所述平均阅读速度,及所述用户信息包含的对指定文章的阅读时间、所述指定文章的内容字数,计算阅读所述指定文章的时间指标。
本实施例中,当物品信息为阅读文章的信息时,第一获取单元在根据用户信息及物品信息获取时间指标的过程中,为了分别后续离线层具体针对特征的计算,可进行一些数据的统计,如针对浏览时间的量化统计。首先根据用户信息包含的阅读所有文章所花费的总时间t(i)与对应阅读所有文章总量size(i),确定平均阅读速度Ri,该文章以新闻为例,计算公式如下所示:
其中,Ri表示用户i的平均阅读速度,t(i)表示用户阅读过的所有新闻中用时介于(5%-95%)的文档所花费的时间之和,size(i)为用户i所有阅读满足t(i)条件的新闻文档大小之和(即新闻总量)。
然后根据平均阅读速度,及用户信息包含的对指定文章的阅读时间、指定文章的内容字数,计算阅读指定文章的时间指标,该文章以新闻为例,计算公式如下所示:
其中,ti,j表示用户i对新闻j的阅读时间,Ri表示用户i的平均阅读速度,size(j)表示新闻文档的大小(即新闻j的内容字数),timei,j表示用户浏览新闻的时间指标。
本实施例当阅读文章时,服务器可根据阅读所有文章所花费的总时间与对应阅读所有文章总量来确定平均阅读速度,然后根据平均阅读速度、对指定文章的阅读时间及指定文章的内容字数,计算阅读指定文章的时间指标。提高了服务器对时间指标进行确定的灵活性及准确性。
进一步地,如图2所示,基于上述消息推送装置第一、第二或第三实施例,提出了本发明消息推送装置第四实施例,本实施例与本发明消息推送装置第一、第二或第三实施例的区别是,本实施例中上述推送模块300包括:
第一确定单元310,用于根据自定义规则对所述用户兴趣数据进行筛选,确定目标推送消息及对应的第一目标移动终端;
第二获取单元320,用于获取与第一目标移动终端的用户兴趣数据的相似度大于预设阈值的第二移动终端;
第一推送单元330,用于将所述目标推送消息推送至所述第一移动终端,当侦测到所述第一移动终端对所述目标推送消息进行浏览时,将所述目标推送消息推送至所述第二移动终端。
本实施例中,服务器可根据用户兴趣数据的相似度来推送消息,具体地,首先由第一确定单元310根据自定义规则对用户兴趣数据进行筛选,确定目标推送消息及对应的第一目标移动终端,并且由第二获取单元320获取与第一目标移动终端的用户兴趣数据的相似度大于预设阈值的第二移动终端。该用户兴趣数据的相似度即为用户相似度,用户相似度可通过皮尔逊相关系数(Pearson correlation coefficient)来获取。皮尔逊相关系数用来度量两个变量X和Y之间的相互关系(线性相关)的,取值范围在[-1,+1]之间,皮尔逊积矩相关系数用来度量两个变量线性相关性的强弱。该预设阈值可根据具体情况而灵活设置。
然后第一推送单元330将目标推送消息推送至第一移动终端,并侦测第一移动终端是否对目标推送消息进行浏览。当侦测到第一移动终端对目标推送消息进行浏览时,说明第一移动终端对应的用户对该目标推送消息感兴趣,而由于第一移动终端对应的用户与第二移动终端对应的用户之间的用户兴趣数据的相似度大于预设阈值,说明可能第二移动终端对应的用户也会对该目标推送消息感兴趣,此时第一推送单元330将目标推送消息推送至第二移动终端。
例如,第一移动终端对应的用户1兴趣数据中,用户1喜欢物品A、物品B、物品C,第二移动终端对应的用户2兴趣数据中,用户2也喜欢物品A、物品B、物品C,此时说明第一移动终端对应的用户1与第二移动终端对应的用户2之间的相似度大于预设阈值。当服务器将推送消息a推送至第一移动终端后,用户1查看了该推送消息a,此时服务器将推送消息a推送至第二移动终端。
本实施例服务器确定目标推送消息及对应的第一目标移动终端,及与第一目标移动终端的用户兴趣数据的相似度大于预设阈值的第二移动终端后,将目标推送消息推送至第一移动终端,并当第一移动终端对该目标推送消息进行浏览时,将目标推送消息推送至第二移动终端。使得服务器可根据用户兴趣数据的相似度来推送消息,提高了服务器对消息进行推送的灵活性。
进一步地,如图3所示,基于上述消息推送装置第第一、第二或第三实施例,提出了本发明消息推送装置第五实施例,本实施例与本发明消息推送装置第一、第二或第三实施例的区别是,本实施例中上述推送模块300还包括:
第二确定单元340,用于根据自定义规则对所述用户兴趣数据进行筛选,确定第一目标推送消息及对应的目标移动终端;
第三获取单元350,用于获取与所述第一目标推送消息的相似度大于预设相似值的第二目标推送消息;
第二推送单元360,用于将第一目标推送消息推送至所述目标移动终端,当侦测到所述目标移动终端对所述第一目标推送消息进行浏览时,将所述第二目标推送消息推送至所述目标移动终端。
本实施例中,服务器可根据目标推送消息的相似度来推送消息,具体地,首先由第二确定单元340根据自定义规则对所述用户兴趣数据进行筛选,确定第一目标推送消息及对应的目标移动终端,并且由第三获取单元350获取与第一目标推送消息的相似度大于预设相似值的第二目标推送消息。该目标推送消息的相似度即为物品相似度,该物品相似度通过皮尔逊相关系数(Pearson correlation coefficient)来获取。该预设相似值可根据具体情况而灵活设置。
然后第二推送单元360将第一目标推送消息推送至目标移动终端,并侦测目标移动终端是否对第一目标推送消息进行浏览。当侦测到目标移动终端对第一目标推送消息进行浏览时,说明目标移动终端对应的用户对该第一目标推送消息感兴趣,而由于第一目标推送消息与第二目标推送消息之间的相似度大于预设相似值,说明目标移动终端对应的用户可能对第二目标推送消息也会感兴趣,此时第二推送单元360将第二目标推送消息推送至目标移动终端。
例如,推送消息a与推送消息b之间的相似度大于预设相似值,当服务器将推送消息a推送至目标移动终端后,目标移动终端对应的用户查看了该推送消息a,此时服务器将推送消息b也推送至第二移动终端。
本实施例服务器确定第一目标推送消息及对应的目标移动终端,及与第一目标推送消息的相似度大于预设相似值的第二目标推送消息后,将第一目标推送消息推送至目标移动终端,并当目标移动终端对第一目标推送消息进行浏览时,将第二目标推送消息推送至目标移动终端,使得服务器可根据目标推送消息的相似度来推送消息,提高了服务器对消息进行推送的灵活性及效率。
对应地,如图4所示,提出本发明一种消息推送方法第一实施例。本实施例消息推送方法与上述消息推送装置第一实施例对应,该实施例的消息推送方法包括:
步骤S10、在接收到移动终端上报的数据后,获取所述数据中包含的用户信息及物品信息,对所述用户信息设定用户标签,以及对所述物品信息设定物品标签;
本实施例中,消息推送方法应用于服务器,服务器在接收到移动终端上报的数据后,需要对数据进行预处理。该移动终端的类型可根据实际需要进行设置,例如,该移动终端包括手机、电脑等。
具体地,服务器对数据进行预处理的过程中,可将数据进行分类,获取数据中包含的用户信息及物品信息。该用户信息包括用户编号(即用户ID)、工作、年龄、性别、地址等。该用户信息还包括用户行为信息,例如,所在位置、所使用的网络、浏览新闻的时长、新闻部分浏览页面数、各个页面停留时长、总页面数、相关阅读的浏览时长、点击个数、评论浏览时长、评论点赞个数、点赞、分享、评论(评论包括评价内容、不喜欢等),用户信息包括还包括用户负反馈信息等。
然后为用户信息设定用户标签,该用户标签可以通过一开始上报的数据、第三方社交网络爬取的数据、以及后续的用户阅读的资讯新闻等方面反馈生成。例如,提取用户的具体属性,例如对年龄分段,分为0~20、20~50、>50等年龄段,以将这些属性数字化。即用户标签包括用户编号、通过的特征信息、权重等。用户标签还包括浏览到第几个页面、开始时间、结束时间、持续时间、是否点赞、不喜欢的理由、是否分享等。
该物品信息包括新闻编号、新闻标题、新闻时间、是否热点数据、点击次数、评论个数、文章长度、文章标题、热点文章、文章的来源、文章发布的时间、浏览次数、下载次数等。以及为物品信息设定物品标签,该物品标签可以通过新闻资讯的上报的标签信息,以及服务器对新闻资讯的爬取获取得到的标签。例如,物品标签包括新闻编号、新闻特征等,新闻特征是指新闻所属的类别;或者物品标签包括应用编号、应用特征等,应用特征是应用所属的类别。
用户标签亦即用户信息标签化,例如某用户的标签为女、31岁、已婚、收入1万以上、爱美食、团购达人等。物品标签亦即物品信息标签化。为用户信息及物品信息打标签的重要目的之一是为了方便服务器对数据进行处理,例如,可以做分类统计:喜欢红酒的用户有多少、喜欢红酒的人群中男女比例是多少;也可以做数据挖掘工作:利用关联规则计算喜欢红酒的人通常喜欢什么运动品牌、利用聚类算法分析喜欢红酒的人年龄段分布情况,等等。用户标签和物品标签能够提升精准度,提高信息获取的效率。
步骤S20、将所述用户信息、所述用户标签、所述物品信息和/或所述物品标签,输入预置的数学模型获取用户兴趣数据;
本实施例中,服务器预先设置有数学模型,该数学模型用于对用户兴趣数据进行计算,该用户兴趣数据可以是用户对物品的兴趣度,以下实施例将进行详细说明。在得到用户信息、用户标签、物品信息和物品标签后,可将用户信息、用户标签、物品信息和/或物品标签输入预置的数学模型,通过该数学模型输出用户兴趣数据。
步骤S30、根据自定义规则对所述用户兴趣数据进行筛选,确定目标推送消息及对应的目标移动终端,将所述目标推送消息推送至所述目标移动终端。
在得到用户兴趣数据后,可根据各个业务的自定义规则对用户兴趣数据进行筛选,可以是进行排序筛选、或者是综合筛选等,以得到满足一定条件的用户兴趣数据。例如,筛选出用户兴趣数据中兴趣度最高的前3个。
然后根据筛选后的用户兴趣数据确定目标推送消息及对应的目标移动终端,将目标推送消息推送至目标移动终端。该推送方式可以是离线推荐、在线推荐、实时推荐等,后续服务器还可以对推荐结果进行评价。服务器还可以将推送消息以邮件、弹窗、短信等形式推送至目标移动终端,目标移动终端在接收到服务器推送的消息后,用户可以选择进行查看、下载或删除等。从而实现了有效利用移动终端上报的数据,进行用户特征挖掘,为应用中心、浏览器、视界等提供推荐服务。
需要说明的是,为了提高服务器对消息进行推送的可靠性,服务器还可以在接收到多个移动终端上报的数据后,将多个移动终端上报的数据随机分为A组和B组,然后分别对A组和B组中的数据进行预处理。对A组得到的用户信息、用户标签、物品信息和/或物品标签输入第一数学模型获取用户兴趣数据,根据用户兴趣数据将推送消息推送至第一移动终端,并对推荐结果进行评价,得到第一评价数据,该评价数据即为用户对消息的兴趣度。以及对B组得到的用户信息、所述用户标签、物品信息和/或物品标签输入第二数学模型获取用户兴趣数据,根据用户兴趣数据将推送消息推送至第二移动终端,并推荐结果进行评价,得到第二评价数据。当第一评价数据的评价值大于第二评价数据的评价值时,将第一数学模型设置为目标数学模型,否则将第二数学模型设置为目标数学模型,以便通过目标数学模型获取用户兴趣数据是对推送消息进行推送。
本发明实施例服务器在接收到移动终端上报的数据后,获取数据中包含的用户信息及物品信息,对用户信息设定用户标签,以及对物品信息设定物品标签;将用户信息、用户标签、物品信息和/或物品标签,输入预置的数学模型获取用户兴趣数据。然后根据自定义规则对用户兴趣数据进行筛选,确定目标推送消息及对应的目标移动终端,将目标推送消息推送至目标移动终端。使得通过对移动终端上报的数据进行分类及设定标签后,通过数学模型获取用户兴趣数据来确定目标推送消息推送至目标移动终端,提高了服务器进行消息推送的可靠性及效率。
进一步地,基于上述消息推送方法第一实施例,提出了本发明消息推送方法第二实施例,本实施例消息推送方法与上述消息推送装置第二实施例对应。本实施例与本发明消息推送方法第一实施例的区别是,本实施例中上述步骤S20可包括:
根据所述用户信息及所述物品信息获取时间指标;
根据所述时间指标、所述用户标签及所述物品标签通过所述数学模型计算用户兴趣数据。
本实施例中,服务器在根据数学模型对用户兴趣数据进行计算的过程中,首先根据用户信息及所述物品信息获取时间指标,以下实施例将进行详细说明。然后根据时间指标、用户标签及物品标签通过所述数学模型计算用户兴趣数据,用户兴趣数据即为用户兴趣度。
以下将进行举例说明,当物品信息为新闻时,可通过权重对数据进行量化,来计算用户对物品的兴趣度,计算的数学模型如下:
UC表示用户兴趣数据,1表示偏移,NCi表示第i篇新闻资讯的分类(即物品标签),n表示用户看的新闻数量,α表示时间指标的权重系数,β表示评论指标的权重系数,γ为点赞分享的权重系数,α、β、γ系数可根据具体情况而灵活设置。time表示时间指标,comment表示评论指标,share表示点赞分享,unlike表示不喜欢指标(即用户标签)。
本实施例服务器根据用户信息及物品信息获取时间指标,然后根据时间指标、用户标签及物品标签通过数学模型计算用户兴趣数据,提高了对用户兴趣数据获取的可靠性。
进一步地,基于上述消息推送方法第二实施例,提出了本发明消息推送方法第三实施例,本实施例消息推送方法与上述消息推送装置第三实施例对应。本实施例与本发明消息推送方法第二实施例的区别是,本实施例中上述当物品信息为阅读文章的信息时,所述根据所述用户信息及所述物品信息获取时间指标包括:
根据所述用户信息包含的阅读所有文章所花费的总时间与对应阅读所有文章总量,确定平均阅读速度;
根据所述平均阅读速度,及所述用户信息包含的对指定文章的阅读时间、所述指定文章的内容字数,计算阅读所述指定文章的时间指标。
本实施例中,当物品信息为阅读文章的信息时,服务器在根据用户信息及物品信息获取时间指标的过程中,为了分别后续离线层具体针对特征的计算,可进行一些数据的统计,如针对浏览时间的量化统计。首先根据用户信息包含的阅读所有文章所花费的总时间t(i)与对应阅读所有文章总量size(i),确定平均阅读速度Ri,该文章以新闻为例,计算公式如下所示:
其中,Ri表示用户i的平均阅读速度,t(i)表示用户阅读过的所有新闻中用时介于(5%-95%)的文档所花费的时间之和,size(i)为用户i所有阅读满足t(i)条件的新闻文档大小之和(即新闻总量)。
然后根据平均阅读速度,及用户信息包含的对指定文章的阅读时间、指定文章的内容字数,计算阅读指定文章的时间指标,该文章以新闻为例,计算公式如下所示:
其中,ti,j表示用户i对新闻j的阅读时间,Ri表示用户i的平均阅读速度,size(j)表示新闻文档的大小(即新闻j的内容字数),timei,j表示用户浏览新闻的时间指标。
本实施例当阅读文章时,服务器可根据阅读所有文章所花费的总时间与对应阅读所有文章总量来确定平均阅读速度,然后根据平均阅读速度、对指定文章的阅读时间及指定文章的内容字数,计算阅读指定文章的时间指标。提高了服务器对时间指标进行确定的灵活性及准确性。
进一步地,如图5所示,基于上述消息推送方法第一、第二或第三实施例,提出了本发明消息推送方法第四实施例,本实施例消息推送方法与上述消息推送装置第四实施例对应。本实施例与本发明消息推送方法第一、第二或第三实施例的区别是,本实施例中上述步骤S30可包括:
步骤S31、根据自定义规则对所述用户兴趣数据进行筛选,确定目标推送消息及对应的第一目标移动终端;
步骤S32、获取与第一目标移动终端的用户兴趣数据的相似度大于预设阈值的第二移动终端;
步骤S33、将所述目标推送消息推送至所述第一移动终端,当侦测到所述第一移动终端对所述目标推送消息进行浏览时,将所述目标推送消息推送至所述第二移动终端。
本实施例中,服务器可根据用户兴趣数据的相似度来推送消息,具体地,首先服务器根据自定义规则对用户兴趣数据进行筛选,确定目标推送消息及对应的第一目标移动终端,并且获取与第一目标移动终端的用户兴趣数据的相似度大于预设阈值的第二移动终端。该用户兴趣数据的相似度即为用户相似度,用户相似度可通过皮尔逊相关系数(Pearson correlation coefficient)来获取。皮尔逊相关系数用来度量两个变量X和Y之间的相互关系(线性相关)的,取值范围在[-1,+1]之间,皮尔逊积矩相关系数用来度量两个变量线性相关性的强弱。该预设阈值可根据具体情况而灵活设置。
然后服务器将目标推送消息推送至第一移动终端,并侦测第一移动终端是否对目标推送消息进行浏览。当侦测到第一移动终端对目标推送消息进行浏览时,说明第一移动终端对应的用户对该目标推送消息感兴趣,而由于第一移动终端对应的用户与第二移动终端对应的用户之间的用户兴趣数据的相似度大于预设阈值,说明可能第二移动终端对应的用户也会对该目标推送消息感兴趣,此时将目标推送消息推送至第二移动终端。
例如,第一移动终端对应的用户1兴趣数据中,用户1喜欢物品A、物品B、物品C,第二移动终端对应的用户2兴趣数据中,用户2也喜欢物品A、物品B、物品C,此时说明第一移动终端对应的用户1与第二移动终端对应的用户2之间的相似度大于预设阈值。当服务器将推送消息a推送至第一移动终端后,用户1查看了该推送消息a,此时服务器将推送消息a推送至第二移动终端。
本实施例服务器确定目标推送消息及对应的第一目标移动终端,及与第一目标移动终端的用户兴趣数据的相似度大于预设阈值的第二移动终端后,将目标推送消息推送至第一移动终端,并当第一移动终端对该目标推送消息进行浏览时,将目标推送消息推送至第二移动终端。使得服务器可根据用户兴趣数据的相似度来推送消息,提高了服务器对消息进行推送的灵活性。
进一步地,如图6所示,基于上述消息推送方法第一、第二或第三实施例,提出了本发明消息推送方法第五实施例,本实施例消息推送方法与上述消息推送装置第五实施例对应。本实施例与本发明消息推送方法第一、第二或第三实施例的区别是,本实施例中上述步骤S30可包括:
步骤S34、根据自定义规则对所述用户兴趣数据进行筛选,确定第一目标推送消息及对应的目标移动终端;
步骤S35、获取与所述第一目标推送消息的相似度大于预设相似值的第二目标推送消息;
步骤S36、将第一目标推送消息推送至所述目标移动终端,当侦测到所述目标移动终端对所述第一目标推送消息进行浏览时,将所述第二目标推送消息推送至所述目标移动终端。
本实施例中,服务器可根据目标推送消息的相似度来推送消息,具体地,首先服务器根据自定义规则对所述用户兴趣数据进行筛选,确定第一目标推送消息及对应的目标移动终端,并且获取与第一目标推送消息的相似度大于预设相似值的第二目标推送消息。该目标推送消息的相似度即为物品相似度,该物品相似度通过皮尔逊相关系数(Pearson correlation coefficient)来获取。该预设相似值可根据具体情况而灵活设置。
然后服务器将第一目标推送消息推送至目标移动终端,并侦测目标移动终端是否对第一目标推送消息进行浏览。当侦测到目标移动终端对第一目标推送消息进行浏览时,说明目标移动终端对应的用户对该第一目标推送消息感兴趣,而由于第一目标推送消息与第二目标推送消息之间的相似度大于预设相似值,说明目标移动终端对应的用户可能对第二目标推送消息也会感兴趣,此时将第二目标推送消息推送至目标移动终端。
例如,推送消息a与推送消息b之间的相似度大于预设相似值,当服务器将推送消息a推送至目标移动终端后,目标移动终端对应的用户查看了该推送消息a,此时服务器将推送消息b也推送至第二移动终端。
本实施例服务器确定第一目标推送消息及对应的目标移动终端,及与第一目标推送消息的相似度大于预设相似值的第二目标推送消息后,将第一目标推送消息推送至目标移动终端,并当目标移动终端对第一目标推送消息进行浏览时,将第二目标推送消息推送至目标移动终端,使得服务器可根据目标推送消息的相似度来推送消息,提高了服务器对消息进行推送的灵活性及效率。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,空调器,或者网络设备等)执行本发明各个实施例所述的方法。
以上仅为本发明的可选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。