专利名称:基于3g网络的个性化手机智能搜索系统的制作方法
技术领域:
本发明涉及一种基于3G网络的个性化手机智能搜索系统领域
背景技术:
因为手机配置较低,手机上网具有很大的局限性,大多数手机不能访问传统互联网(web页面)。这主要是因为以下原因I、大多数手机浏览器为单纯的wap浏览器,不支持访问传统web页面;
2、传统互联网页面信息量大,一般一个页面容量达到几百K,而手机单机处理传统页面时压力很大、速度较慢甚至不能处理;3、传统互联网页面是针对pc终端设计,对手机终端小屏幕而言,页面效果差,可读性很不好。
发明内容
本发明为可克服上述缺点,而提供一种基于3G网络的个性化手机智能搜索系统。具体实现为基于用户行为分析模型、网页特征分析模型、动态变量分析模型等模型的基础上,自主开发了 “改进型pagerank搜索算法”,提供以用户为中心的个性化手机搜索服务,显著提高了手机搜索结果满意率。包括如下步骤。1,基于传统搜索引擎技术建立数据源库,就是首先以客观、公正的网页重要性对网页进数据分析处理;2,引入“网页特征分析模型”“网页特征分析模型”是通过对网页大量分析后,用一组具有特征描述的关键词组成多维阵列,如“所属行业”可以作为一个网页一级特征,而“旅游”、“汽车”都可以看作这一特征下的子级描述,网页特征的判断和各级特征之间的逻辑关系都符合固定规则和算法。3,引入“用户行为分析模型”每个用户都有自己的行为特征,反映在网络上就是他们会有不同的操作习惯和网页访问习惯。我们通过对用户较长时间操作行为进行记录,通过数据挖掘中“神经网络聚类分析方法”对用户的行为进行分析,建立“用户行为分析模型”。这个模型反映了一个用户较长时期的行为习惯,且这种行为习惯具有连续性和惯性。4,引入“动态因素分析模型”“动态因素”主要是采集分析某时间段内的变量,如最近十分钟内用户的搜索关键词、武汉的手机号码目前出现在杭州等。动态因素发生是在短期内的,是变化的,但是“动态因素分析模型”则是根据对众多“动态因素”分析,运用数据挖掘中“神经网络聚”中的分类(Classification)、估值(Estimation)、预言(Prediction)等算法推演出“动态因素”导致的变化趋势。对用户某一个“动态因素”,可以通过“动态因素分析模型”分析其行为的最大可能性。
本发明有益的结果是1,更符合用户需求通过对用户行为模型的分析,考虑用户“移动”的特性,提供更符合用户习惯和需求的搜索结果。2,成长性“用户行为分析模型”需要长期记录、分析用户的行为习惯,随着时间的增加,“用户行为分析模型”将更有权威性,更接近真实。3,兼容性改进手机搜索实在传统pc搜索的基础上发展而来,与传统搜索兼容。
图I实施例中本发明方法得以实现的原理流程2实施例中功能效果3实施例中手机页面截4实施例中手机手机搜索结果截图
具体实施例方式目前手机访问传统互联网一直存在较大障碍,只有少数高端手机才能够自主访问。这里边的主要障碍包括基于手机终端的无线搜索是“面向3G网络的手机上网和搜索的支持系统”中最重要的应用功能,我们在对以google、baidu为代表的传统pc搜索引擎技术进行深入研究后,认为目前的搜索技术直接移植到无线搜索领域有较大局限性I,目前的搜索原理主要是基于PageRank算法,pagerank根据网站的外部链接和内部链接的数量和质量来衡量网站的价值,它对网页主要评价标准就是“重要性”(PR值),但是对网页自身文本的语义逻辑重视不够,这就相当于了解一个人主要听第三方的介绍而没有直接与本人沟通;2,客观、公正是pagerank为代表的传统pc搜索算法的特点和优点,但是这种排名在某种角度考虑就是死板、生硬。比如对不同人搜索同一个关键词的搜索结果是固定的,从简单逻辑角度分析,我们就知道有人对这个结果排序比较满意,肯定也有人不太满意,这就说明客观、公正的pagerank算法忽略了 “人”这一动态变量在搜索中的影响;3,目前搜索追求的是搜索的速度和数量,一个关键词搜索结果常常数十万数百万条,而人们可能会看的往往是前几页的搜索结果。对以手机终端的无线搜索来说,因为屏幕单页显示数量有限(一般不超过5条搜索结果)而且翻页不便,更追求搜索结果的首页命中率,也就是在前5条搜索结果中找到需要的链接。4,手机终端有其特性,如私密性(一部手机只有一个用户)、移动性、可监控(获取手机号码)等,在搜索上需要更独特的设计。针对以上传统pc搜索引擎的不足,基于用户行为分析模型、网页特征分析模型、动态变量分析模型等模型的基础上,自主开发了 “改进型pagerank搜索算法”,改进算法主要有以下特征5,基于传统搜索引擎技术建立数据源库,就是首先以客观、公正的网页重要性对网页进数据分析处理;6,引入“网页特征分析模型”“网页特征分析模型”是通过对网页大量分析后,用一组具有特征描述的关键词、组成多维阵列,如“所属行业”可以作为一个网页一级特征,而“旅游”、“汽车”都可以看作这一特征下的子级描述,网页特征的判断和各级特征之间的逻辑关系都符合固定规则和算法。对网页进行分析时,除了根据网站的外部链接和内部链接的数量和质量来来对网页评值外,还对网页文本内容从语义逻辑上进行分析,为网页赋予新的特征,如该网页被多家旅游网站索引,且在文中多次出现“黄鹤楼”关键字,通过对“网页特征分析模型”查询,“旅游”就是本网页的特征值之一。7,引入“用户行为分析模型”每个用户都有自己的行为特征,反映在网络上就是他们会有不同的操作习惯和网页访问习惯。我们通过对用户较长时间操作行为进行记录,通过数据挖掘中“神经网络聚类分析方法”对用户的行为进行分析,建立“用户行为分析模型”。这个模型反映了一个用户较长时期的行为习惯,且这种行为习惯具有连续性和惯性。8,引入“动态因素分析模型”“动态因素”主要是采集分析某时间段内的变量,如最近十分钟内用户的搜索关键词、武汉的手机号码目前出现在杭州等。动态因素发生是在短期内的,是变化的,但是“动态因素分析模型”则是根据对众多“动态因素”分析,运用数据挖掘中“神经网络聚”中的分类(Classification)、估值(Estimation)、预言(Prediction)等算法推演出“动态因素”导致的变化趋势。对用户某一个“动态因素”,可以通过“动态因素分析模型”分析其行为的最大可能性。其中网页分析数据包含了而代搜索里的网页“重要性排序”(pagerank算法),也包括了网页特征值。改进型pagerank算法手机搜索具有以下特性
1,兼容性改进手机搜索实在传统pc搜索的基础上发展而来,它首先承认包容传统pc搜索排名的价值,这保证改进手机搜索的效果不低于传统pc搜索结果排名。2,成长性“用户行为分析模型”需要长期记录、分析用户的行为习惯,随着时间的增加,“用户行为分析模型”将更有权威性,更接近真实。3,尤其适合于无线搜索,很多用户行为和动态变量在传统pc搜索中无法获得,而在手机作为搜索终端的无线搜索领域则可以获取。
权利要求
1.一种基于3G网络的个性化手机智能搜索系统,其特征在于,该方法包括如下步骤 基于用户行为分析模型、网页特征分析模型、动态变量分析模型等模型的基础上,自主开发了“改进型pagerank搜索算法”,提供以用户为中心的个性化手机搜索服务,显著提高了手机搜索结果满意率。包括如下步骤。
(1)基于传统搜索引擎技术建立数据源库,就是首先以客观、公正的网页重要性对网页进数据分析处理; (2)引入“网页特征分析模型” “网页特征分析模型”是通过对网页大量分析后,用一组具有特征描述的关键词组成多维阵列,如“所属行业”可以作为一个网页一级特征,而“旅游”、“汽车”都可以看作这一特征下的子级描述,网页特征的判断和各级特征之间的逻辑关系都符合固定规则和算法。
(3)引入“用户行为分析模型” 每个用户都有自己的行为特征,反映在网络上就是他们会有不同的操作习惯和网页访问习惯。我们通过对用户较长时间操作行为进行记录,通过数据挖掘中“神经网络聚类分析方法”对用户的行为进行分析,建立“用户行为分析模型”。这个模型反映了一个用户较长时期的行为习惯,且这种行为习惯具有连续性和惯性。
(4)引入“动态因素分析模型” “动态因素”主要是采集分析某时间段内的变量,如最近十分钟内用户的搜索关键词、武汉的手机号码目前出现在杭州等。动态因素发生是在短期内的,是变化的,但是“动态因素分析模型”则是根据对众多“动态因素”分析,运用数据挖掘中“神经网络聚”中的分类(Classification)、估值(Estimation)、预言(Prediction)等算法推演出“动态因素”导致的变化趋势。对用户某一个“动态因素”,可以通过“动态因素分析模型”分析其行为的最大可能性。
2.根据权利要求I所述的一种基于3G网络的个性化手机智能搜索系统,其特征在于基于用户行为分析模型、网页特征分析模型、动态变量分析模型等模型的基础上,自主开发了“改进型pagerank搜索算法”,提供以用户为中心的个性化手机搜索服务,显著提高了手机搜索结果满意率。
全文摘要
本发明涉及一种基于3G网络的个性化手机智能搜索系统,该系统基于用户行为分析模型、网页特征分析模型、动态变量分析模型等模型的基础上,自主开发了“改进型pagerank搜索算法”,提供以用户为中心的个性化手机搜索服务,显著提高了手机搜索结果满意率。本发明有益的效果是1,更符合用户需求 通过对用户行为模型的分析,考虑用户“移动”的特性,提供更符合用户习惯和需求的搜索结果。2,成长性 “用户行为分析模型”需要长期记录、分析用户的行为习惯,随着时间的增加,“用户行为分析模型”将更有权威性,更接近真实。3,兼容性 改进手机搜索实在传统pc搜索的基础上发展而来,与传统搜索兼容。
文档编号G06F17/30GK102708159SQ20121012194
公开日2012年10月3日 申请日期2012年4月18日 优先权日2012年4月18日
发明者荣红军 申请人:杭州手趣科技有限公司