专利名称:一种基于无线网络的数据业务推送系统和方法
技术领域:
本发明涉及一种通过用户行为和浏览网页的文本内容发现用户当前兴趣偏好,并结合用户当前位置推送数据的系统和方法,特别适用于无线网络。
背景技术:
数据业务推送在2011年开始了全面的绽放,行业内涌现出众多机构,数据业务推送也从第一阶段的网站组合(媒体选择很重要,根据媒体的受众特点进行组合和选择),到第二阶段上下文定向(内容优化很重要,根据内容吸引受众的类型进行组合),再到现在第三个阶段以人群定向技术为核心的人群定向推送方式转变,更着重于对人群的识别。此外,基于位置的数据业务推送在另外一个维度上发展和成熟。本发明的目的在于建立一种数据业务推送的新模式,跟踪每个用户的行为习惯,并对其行为和浏览内容进行分析,预测其兴趣偏好,将接受信息的对象集中于感兴趣且有需要的用户,实现数据业务的定向推送。本发明的意义在于按照用户的兴趣喜好,有针对性的发送用户需要的信息,提高数据业务推送的可信度,提高用户喜好度,能更好地降低数据噪声。
发明内容
本发明提供一种基于无线网络的数据业务推送系统,其通过无线网关获得用户使用如手机的移动终端的日志信息后,对当前一段时间范围内用户使用手机行为进行过滤处理,获得用户行为特征,使用户对内容的兴趣和行为习惯结合形成用户的兴趣偏好,并与移动终端的位置信息实时关联起来,向移动终端进行信息推送,所述系统包括时间窗口调节和网页数据分类统计模块、用户兴趣提取模块、数据业务推送模块和位置分析模块,其中:时间窗口调节和网页数据分类统计模块从无线网关接收浏览页面的URL,对当前一段时间范围内用户浏览网页进行过滤处理,获得用户感兴趣的相关网页和用户行为特征;用户兴趣提取模块用于根据用户感兴趣的相关网页和用户行为特征获取用户当前兴趣;位置分析模块通过GMLC网关获得用户当前的浏览位置信息;数据业务推送模块根据用户兴趣提取模块输出的当前用户兴趣,利用规则关联策略,判断是否可以进行本地化信息推送服务;对不符合本地化服务特点的当前用户兴趣,服务推送模块将其与对应的预推送信息进行匹配,根据匹配结果选取匹配度最高的推送信息;对符合本地化服务特点的当前用户兴趣,根据来自位置分析模块的用户当前的浏览位置信息,获得位置关联信息,再利用匹配策略,将用户当前兴趣与位置关联信息进行匹配,并根据匹配结果选择匹配度最高的位置关联信息作为推送信息,向移动终端进行推送。此外,时间窗口调节和网页数据分类统计模块包括时间窗口调节子模块和网页数据分类统计子模块,时间窗口调节子模块用于自动调整时间窗口范围,以使系统对此时间窗口内的用户浏览网页进行处理;网页数据分类统计子模块包括行为信息统计子模块和网页分类子模块,行为信 息统计子模块用于获得用户行为特征,网页分类子模块用于获得用户感兴趣的相关网页。还有,用户兴趣提取模块包括行为信息分析子模块、内容信息分析子模块和集成学习子模块,行为信息分析子模块根据用户行为特征,对时间序列进行统计和筛选、降维,形成用户行为兴趣,输出为用户当前行为兴趣,内容信息分析子模块根据用户感兴趣的相关网页的URL地址,对网页内容进行文本处理,提取网页主题,并根据所述的网页主题和网页其他属性信息,形成用户内容兴趣,输出为用户当前内容兴趣,集成学习子模块根据用户当前行为兴趣和当前内容兴趣,使用集成学习技术,形成用户兴趣,输出为用户当前兴趣。另外,网页分类子模块包括网页文本获取子模块、网页文本分类子模块、访问频度统计子模块、以及用户当前内容兴趣确定子模块,网页文本获取子模块对上述时间窗口内,用户浏览的网页进行过滤处理,得到一组相关网页,根据访问网页的URL地址,获得页面的文本内容,网页文本分类子模块对文本内容进行分类处理;访问频度统计子模块对每个类进行访问频度统计,用户当前内容兴趣确定子模块以访问频度值最高的网页集为用户感兴趣的相关网页。本发明还提供一种基于无线网络的数据业务推送方法,其通过无线网关获得用户使用如手机的移动终端的日志信息后,对当前一段时间范围内用户使用手机行为进行过滤处理,获得用户行为特征, 使用户对内容的兴趣和行为习惯结合形成用户的兴趣偏好,并与移动终端的位置信息实时关联起来,向移动终端进行信息推送,包括:从无线网关接收浏览页面的URL,对当前一段时间范围内用户浏览网页进行过滤处理,获得用户感兴趣的相关网页和用户行为特征;根据用户感兴趣的相关网页和用户行为特征获取用户当前兴趣;通过GMLC网关获得用户当前的浏览位置信息;根据用户兴趣提取模块输出的当前用户兴趣,利用规则关联策略,判断是否可以进行本地化信息推送服务;对不符合本地化服务特点的当前用户兴趣,服务推送模块将其与对应的预推送信息进行匹配,根据匹配结果选取匹配度最高的推送信息;对符合本地化服务特点的当前用户兴趣,根据来自位置分析模块的用户当前的浏览位置信息,获得位置关联信息,再利用匹配策略,将用户当前兴趣与位置关联信息进行匹配,并根据匹配结果选择匹配度最高的位置关联信息作为推送信息,向移动终端进行推送。该系统能够自动调整时间窗口范围,以使系统对此时间窗口内的用户浏览网页进行处理。进一步,获取用户当前兴趣步骤包括:根据用户行为特征,对时间序列进行统计和筛选、降维,形成用户行为兴趣,输出为用户当前行为兴趣,根据用户感兴趣的相关网页的URL地址,对网页内容进行文本处理,提取网页主题,并根据所述的网页主题和网页其他属性信息,形成用户内容兴趣,输出为用户当前内容兴趣,根据用户当前行为兴趣和当前内容兴趣,使用集成学习技术,形成用户兴趣,输出为用户当前兴趣。再有,获得用户感兴趣的相关网页步骤包括:对上述时间窗口内,用户浏览的网页进行过滤处理,得到一组相关网页,根据访问网页的URL地址,获得页面的文本内容,对文本内容进行分类处理;对每个类进行访问频度统计,以访问频度值最高的网页集为用户感兴趣的相关网页。
图1是一种移动终端通过无线网关浏览页面的系统结构图;图2是一种在移动服务器上通过无线网关实时获取移动终端用户兴趣偏好的方法;图3是本发明时间窗口调节和网页数据分类统计模块的操作流程图;图4是本发明网页分类/内容信息处理子模块的操作流程图;图5a是本发明构建网页文本分类器的方法;图5b是本发明网页文本分类器的使用方法;图6是本发明用户内容兴趣提取子模块操作流程图;图7是本发明的用户兴趣偏好的示例性树状结构;图8为数据业务推送模块操作流程图;图9是本发明位置分析模块操作流程图;图10是本发明位置信息关联流程图。
具体实施例方式以下参照附图1 10进一步说明本发明的优选实施例。图1是移动终端通过如WAP网关的无线网关浏览页面的系统结构图。本发明提供一种基于无线网络的数据业务推送系统,其通过无线网关获得用户使用如手机的移动终端的日志信息后,对当前一段时间范围内用户使用手机行为进行过滤处理,获得用户行为特征,使用户对内容的兴趣和行为习惯结合形成用户的兴趣偏好,并与移动终端的位置信息实时关联起来,向移动终端进行信息推送,所述系统由图1中虚线框所标记的部分示出,包括时间窗口调节和网页数据分类统计模块、用户兴趣提取模块、数据业务推送模块和位置分析模块,其中:时间窗口调节和网页数据分类统计模块从无线网关接收浏览页面的URL,对当前一段时间范围内用户浏览网页进行过滤处理,获得用户感兴趣的相关网页和用户行为特征;用户兴趣提取模块包括行为信息分析子模块、内容信息分析子模块和集成学习子模块,行为信息分析子模块根据用户行为特征,对时间序列进行统计和筛选、降维,形成用户行为兴趣,输出为用户当前行为兴趣,内容信息分析子模块根据用户感兴趣的相关网页的URL地址,对网页内容进行文本处理,提取网页主题,并根据所述的网页主题和网页其他属性信息,形成用户内容兴趣,输出为用户当前内容兴趣,集成学习子模块根据用户当前行为兴趣和当前内容兴趣,使用集成学习技术,形成用户兴趣,输出为用户当前兴趣;位置分析模块通过GMLC网关获得用户当前的浏览位置信息;数据业务推送模块根据用户兴趣提取模块输出的当前用户兴趣,利用规则关联策略,判断是否可以进行本地化信息推送服务;对不符合本地化服务特点的当前用户兴趣,服务推送模块将其与对应的预推送信息进行匹配,根据匹配结果选取匹配度最高的推送信息;对符合本地化服务 特点的当前用户兴趣,根据来自位置分析模块的用户当前的浏览位置信息,获得位置关联信息,再利用匹配策略,将用户当前兴趣与位置关联信息进行匹配,并根据匹配结果选择匹配度最高的位置关联信息作为推送信息,向移动终端进行推送。其中所述无线网关包括WAP GW、增强GGSN、独立综合网关等设备,在后面的说明中,以常见的WAP GW为例介绍整个发明的内容。其中浏览页面由网络中的sp/cp服务器提供,移动终端通过无线网关访问这些页面。本发明提供一种基于无线网络的数据业务推送方法,如图2所示,其通过无线网关获得用户使用如手机的移动终端的日志信息后,对当前一段时间范围内用户使用手机行为进行过滤处理,获得用户行为特征,使用户对内容的兴趣和行为习惯结合形成用户的兴趣偏好,并与移动终端的位置信息实时关联起来,向移动终端进行信息推送,包括:从无线网关接收浏览页面的URL,对当前一段时间范围内用户浏览网页进行过滤处理,获得用户感兴趣的相关网页和用户行为特征;根据用户行为特征,对时间序列进行统计和筛选、降维,形成用户行为兴趣,作为用户当前行为兴趣,根据用户感兴趣的相关网页的URL地址,对网页内容进行文本处理,提取网页主题,并根据所述的网页主题和网页其他属性信息,形成用户内容兴趣,作为用户当前内容兴趣,根据上述用户当前行为兴趣和当前内容兴趣,使用集成学习技术,形成用户兴趣,作为用户当前兴趣;通过GMLC网关获得用户当前的浏览位置信息;根据当前用户兴趣,利用规则关联策略,判断是否可以进行本地化信息推送服务;对不符合本地化服务特点的当前用户兴趣,将其与对应的预推送信息进行匹配,根据匹配结果选取匹配度最高的推送信息;对符合本地化服务特点的当前用户兴趣,根据用户当前的浏览位置信息,获得位置关联信息,再利用匹配策略,将用户当前兴趣与位置关联信息进行匹配,并根据匹配结果·选择匹配度最高的位置关联信息作为推送信息,向移动终端进行推送。时间窗口调节和网页数据分类统计模块包括时间窗口调节子模块和网页数据分类统计子模块,网页数据分类统计子模块包括行为信息统计子模块和网页分类子模块。图3是时间窗口调节和网页数据分类统计模块的操作流程图。时间窗口调节子模块执行时间窗口调节方法,根据用户的上网速度和习惯,确定和调节时间窗口,反映用户当前时间段的集中兴趣。为了获得用户感兴趣的相关网页和用户行为特征,所述系统需要对当前一段时间范围内用户浏览网页进行过滤处理,现有技术中需要统计处理的时间范围区间通常是固定值,如对用户在一个较长时间段内的兴趣偏好做处理,如一天、一月甚至一年,这样的处理虽然在分析用户兴趣方面比较全面和准确,但是分析的网页内容庞大,实时性较差,或以单个上网行为或者单个浏览网页为触发条件,上一次网或浏览一个网页做一次推荐,这样虽然是实时推荐,但是系统会返回太多的推荐内容,增加了无线通信网络的负担,也降低了用户体验的趣味。基于现有技术的上述问题,本发明采用了一中时间窗口的调节方法,能够兼顾用户长期兴趣偏好和短时兴趣偏好,在两者间进行调节和控制,通过调节时间窗口来控制获取网页的数量,调节时间窗口的大小达到实时的效果,更为及时和准确。
所述时间窗口的调节方法可由时间窗口调节子模块执行。该方法的目的是以用户当前上网时间为开始,以一个符合用户上网速度和习惯的时间范围为基准,分析在该时间范围内用户通过上网反映出来的兴趣类别。所述时间窗口的调节方法根据用户不同的上网速度和习惯,设定时间窗口的初始设定时间值,之后时间窗口的设定时间随着用户的上网习惯而进行自动调节,步骤为:统计用户历史上网密度
权利要求
1.一种基于无线网络的数据业务推送系统,其特征在于:包括时间窗口调节和网页数据分类统计模块、用户兴趣提取模块、数据业务推送模块和位置分析模块, 时间窗口调节和网页数据分类统计模块从无线网关接收浏览页面的URL,对当前一段时间范围内用户浏览网页进行过滤处理,获得用户感兴趣的相关网页和用户行为特征; 用户兴趣提取模块用于根据用户感兴趣的相关网页和用户行为特征获取用户当前兴趣; 位置分析模块通过GMLC网关获得用户当前的浏览位置信息; 数据业务推送模块根据用户兴趣提取模块输出的当前用户兴趣,利用规则关联策略,判断是否可以进行本地化信息推送服务;对不符合本地化服务特点的当前用户兴趣,服务推送模块将其与对应的预推送信息进行匹配,根据匹配结果选取匹配度最高的推送信息;对符合本地化服务特点的当前用户兴趣,根据来自位置分析模块的用户当前的浏览位置信息,获得位置关联信息,再利用匹配策略,将用户当前兴趣与位置关联信息进行匹配,并根据匹配结果选择匹配度最高的位置关联信息作为推送信息,向移动终端进行推送。
2.如权利要求1所述的一种基于无线网络的数据业务推送系统,其特征在于:时间窗口调节和网页数据分类统计模块包括时间窗口调节子模块和网页数据分类统计子模块, 时间窗口调节子模块用于自动调整时间窗口范围,以使系统对此时间窗口内的用户浏览网页进行处理; 网页数据分类统计子模块包括行为信息统计子模块和网页分类子模块,行为信息统计子模块用于获得用户行为特征,网页分类子模块用于获得用户感兴趣的相关网页。
3.如权利要求1所述的一种基于无线网络的数据业务推送系统,其特征在于:用户兴趣提取模块包括行为信息分析子模块、内容信息分析子模块和集成学习子模块, 行为信息分析子模块根据用户行为特征,对时间序列进行统计和筛选、降维,形成用户行为兴趣,输出为用户当前行为兴趣, 内容信息分析子模块根据用户感兴趣的相关网页的URL地址,对网页内容进行文本处理,提取网页主题,并根据所述的网页主题和网页其他属性信息,形成用户内容兴趣,输出为用户当前内容兴趣, 集成学习子模块根据用户当前行为兴趣和当前内容兴趣,使用集成学习技术,形成用户兴趣,输出为用户当前兴趣。
4.如权利要求3所述的一种基于无线网络的数据业务推送系统,其特征在于:网页分类子模块包括网页文本获取子模块、网页文本分类子模块、访问频度统计子模块、以及用户当前内容兴趣确定子模块,网页文本获取子模块对上述时间窗口内,用户浏览的网页进行过滤处理,得到一组相关网页,根据访问网页的URL地址,获得页面的文本内容,网页文本分类子模块对文本内容进行分类处理;访问频度统计子模块对每个类进行访问频度统计,用户当前内容兴趣确定子模块以访问频度值最高的网页集为用户感兴趣的相关网页。
5.一种基于无线网络的数据业务推送方法,其特征在于包括步骤: 从无线网关接收浏览页面的URL,对当前一段时间范围内用户浏览网页进行过滤处理,获得用户感兴趣的相关网页和用户行为特征; 根据用户感兴趣的相关网页和用户行为特征获取用户当前兴趣; 通过GMLC网关获得用户当前的浏览位置信息;根据用户兴趣提取模块输出的当前用户兴趣,利用规则关联策略,判断是否可以进行本地化信息推送服务;对不符合本地化服务特点的当前用户兴趣,服务推送模块将其与对应的预推送信息进行匹配,根据匹配结果选取匹配度最高的推送信息;对符合本地化服务特点的当前用户兴趣,根据来自位置分析模块的用户当前的浏览位置信息,获得位置关联信息,再利用匹配策略,将用户当前兴趣与位置关联信息进行匹配,并根据匹配结果选择匹配度最高的位置关联信息作为推送信息,向移动终端进行推送。
6.如权利要求5所述的一种基于无线网络的数据业务推送方法,其特征在于: 能够自动调整时间窗口范围,以使系统对此时间窗口内的用户浏览网页进行处理。
7.如权利要求5所述的一种基于无线网络的数据业务推送方法,其特征在于:获取用户当前兴趣步骤包括: 根据用户行为特征,对时间序列进行统计和筛选、降维,形成用户行为兴趣,输出为用户当前行为兴趣, 根据用户感兴趣的相关网页的URL地址,对网页内容进行文本处理,提取网页主题,并根据所述的网页主题和网页其他属性信息,形成用户内容兴趣,输出为用户当前内容兴趣, 根据用户当前行为兴趣和当前内容兴趣,使用集成学习技术,形成用户兴趣,输出为用户当前兴趣。
8.如权利要求7所述的一种基于无线网络的数据业务推送方法,其特征在于:获得用户感兴趣的相关网页步骤包括:对上述时间窗口内,用户浏览的网页进行过滤处理,得到一组相关网页,根据访问网页的URL地址,获得页面的文本内容,对文本内容进行分类处理;对每个类进行访问频度统计,以访问频度值最高的网页集为用户感兴趣的相关网页。
全文摘要
本发明提供一种基于无线网络的数据业务推送系统,其通过无线网关获得用户使用如手机的移动终端的日志信息后,对当前一段时间范围内用户使用手机行为进行过滤处理,获得用户行为特征,使用户对内容的兴趣和行为习惯结合形成用户的兴趣偏好,并与移动终端的位置信息实时关联起来,向移动终端进行信息推送。本发明能够有针对性的发送用户需要的信息,提高数据业务推送的可信度,提高用户喜好度,能更好地降低数据噪声。
文档编号G06F17/30GK103246725SQ201310168218
公开日2013年8月14日 申请日期2013年5月6日 优先权日2013年5月6日
发明者刘臻, 吕琳媛, 肖思源, 刘润然, 佘莉 申请人:上海河广信息科技有限公司