关联度确定方法及装置、信息提供方法及装置的制作方法

文档序号:6357687阅读:93来源:国知局
专利名称:关联度确定方法及装置、信息提供方法及装置的制作方法
技术领域
本申请涉及互联网信息处理技术领域,尤其涉及一种关联度确定方法及装置、信息提供方法及装置。
背景技术
随着互联网技术的不断发展,越来越多的信息资源选择网络作为传播的载体。为了使用户能够在海量的互联网信息中获取所需要的信息,大多数网站都为用户提供信息搜索服务。用户需要搜索某信息时,可以在网站中输入与用户搜索意图相对应的搜索关键词,该网站查找与该搜索关键词相关的信息,然后将查找到的信息提供给用户,便于用户在海量的互联网信息中顺利找到自己需要的信息。 电子商务网站就是一种能够为用户提供信息搜索服务的网站,电子商务网站为用户提供了能够在网上实现交易的商品,用户利用电子商务网站的搜索系统来搜索想要购买的商品,利用电子商务网站的资金结算系统来购买商品,电子商务网站通过物流配送系统将用户购买的商品配送给用户,这极大提高了用户购物的便利性。在电子商务网站中,用户搜索的信息一般为网站所提供的商品的商品信息,例如用户想要搜索的商品为帽子,而且颜色为单一颜色,即为纯色,那么用户可以在电子商务网站中输入搜索关键词“纯色帽子”,电子商务网站在所有商品中,查找与该搜索关键词“纯色帽子”相关的商品,然后将查找到的商品的商品信息提供给用户,其中商品的商品信息可以为该商品的页面链接。现有技术中,不同的用户在搜索相同的信息时,虽然搜索意图相同,但是输入的搜索关键词可能不同,那么网站根据不同的搜索关键词搜索到的信息可能不同,搜索到的信息的数量也可能相差较大,根据某些用户输入的搜索关键词搜索到的信息的数量非常多,而根据其他用户输入的搜索关键词搜索到的信息的数量非常少,或者根本没有搜索到相关的信息。例如用户A和用户B都想要在电子商务网站中搜索商品“白色的连衣裙”,即用户A和用户B的搜索意图相同,用户A输入的搜索关键词为“白色连衣裙”,用户B输入的搜索关键词为“白色的连身的裙子”,电子商务网站根据用户A输入的搜索关键词“白色连衣裙”搜索到的非常多的商品信息,那么用户A就可以在搜索到的商品信息中找到自己想要的商品,而电子商务网站根据用户B输入的搜索关键词“白色的连身的裙子”并未搜到相关的商品信息,那么用户B就无法通过电子商务网站的搜索服务来找到自己想要的商品。由此可见,现有技术中,若具有相同搜索意图的不同用户在搜索信息时,输入不同的搜索关键词,那么根据不同的搜索关键词搜索到的信息不相同,搜索到的信息的数量可能相差很大,从而导致为某些用户提供的信息不准确、不全面,用户无法根据搜索到的信息查找到自己所需要的信息。

发明内容
本申请实施例提供一种关联度确定方法及装置、信息提供方法及装置,用以解决现有技术中存在的为用户提供的信息不准确、不全面的问题。
本申请实施例技术方案如下一种关联度确定方法,该方法包括步骤获得规定时间段内的日志记录,所述日志记录中包含各搜索关键词及对应的点击"[目息;根据获得的各搜索关键词,构造各搜索关键词对,每个搜索关键词对中包含两个搜索关键词;在构造的各搜索关键词对中,选择出满足预设条件的搜索关键词对;针对选择出的每个搜索关键词对,分别执行针对该搜索关键词对包含的每个搜索关键词,分别获得所述规定时间段内,该搜索关键词对应的每个点击信息在该搜索关键词下的点击权重值;根据获得的各点击权重值,确定该搜索关键词对包含的两个搜索关键词之间的关联度。一种关联度确定装置,包括日志记录获得单元,用于获得规定时间段内的日志记录,所述日志记录中包含各搜索关键词及对应的点击信息;关键词对构造单元,用于根据关键词获得单元获得的各搜索关键词,构造各搜索关键词对,每个搜索关键词对中包含两个搜索关键词;关键词对选择单元,用于在关键词对构造单元构造的各搜索关键词对中,选择出满足预设条件的搜索关键词对;权重值获得单元,用于针对关键词对选择单元选择出的每个搜索关键词对,分别获得所述规定时间段内,该搜索关键词对包含的每个搜索关键词 对应的每个点击信息在该搜索关键词下的点击权重值;关联度确定单元,用于针对关键词对选择单元选择出的每个搜索关键词对,分别根据权重值获得单元获得的各点击权重值,确定该搜索关键词对包含的两个搜索关键词之间的关联度。一种信息提供方法,该方法包括步骤获得输入的当前搜索关键词后,查找该当前搜索关键词对应的各信息;在判断出查找到的信息的数量不大于第一规定阈值时,确定该当前搜索关键词对应的各补充搜索关键词;分别确定该当前搜索关键词与每个补充搜索关键词之间的关联度;在确定出的各补充搜索关键词中,选择出与该当前搜索关键词之间的关联度满足预设条件的各补充搜索关键词;针对选择出的每个补充搜索关键词,分别查找该补充搜索关键词对应的各信息;提供根据该当前搜索关键词查找到的各信息以及根据选择出的各补充搜索关键词查找到的各信息。一种信息提供装置,包括关键词获得单元,用于获得输入的当前搜索关键词 ’第一信息查找单元,用于查找关键词获得单元获得的该当前搜索关键词对应的各信息;信息数量判断单元,用于判断第一信息查找单元查找到的信息的数量是否小于第一规定阈值;关键词确定单元,用于在信息数量判断单元的判断结果为否时,确定该当前搜索关键词对应的各补充搜索关键词;关联度确定单元,用于分别确定该当前搜索关键词与关键词确定单元确定出的每个补充搜索关键词之间的关联度;关键词选择单元,用于在关键词确定单元确定出的各补充搜索关键词中,选择出与该当前搜索关键词之间的关联度满足预设条件的各补充搜索关键词;第二信息查找单元,用于针对关键词选择单元选择出的每个补充搜索关键词,分别查找该补充搜索关键词对应的各信息;信息提供单元,用于提供所述第一信息查找单元查找到的各信息以及第二信息查找单元查找到的各信息。本申请实施例技术方案中,首先获得规定时间段内的日志记录,所述日志记录中包含各搜索关键词及对应的点击信息,根据获得的各搜索关键词,构造各搜索关键词对,每个搜索关键词对中包含两个搜索关键词,在构造的各搜索关键词对中,选择出满足预设条件的搜索关键词对,针对选择出的每个搜索关键词对,分别获得所述规定时间段内,该搜索关键词对包含的每个搜索关键词对应的每个点击信息在该搜索关键词下的点击权重值,然后根据获得的各点击权重值,确定该搜索关键词对包含的两个搜索关键词之间的关联度,两个搜索关键词之间的关联度可以表征这两个搜索关键词的搜索意图之间的相似性,后续当获得用户输入的当前搜索关键词后,先查找该当前搜索关键词对应的各信息,如果查找到的信息的数量不大于第一规定阈值,则可以进行补充搜索,先确定该当前搜索关键词对应的各补充搜索关键词,再分别确定该当前搜索关键词与每个补充搜索关键词之间的关联度,选择出与该当前搜索关键词之间的关联度满足预设条件的各补充搜索关键词,针对选择出的每个补充搜索关键词,分别查找该补充搜索关键词对应的各信息,最后在向用户提供信息时,将根据该当前搜索关键词查找到的各信息以及根据选择出的各补充搜索关键词查找到的各信息提供给用户。由上可见,本申请实施例中,由于预先确定了各搜索关键词之间的关联度,因此后续在根据用户输入的当前搜索关键词搜索到的信息的数量过少时,可以根据预先确定的关联度来选择进行补充搜索的补充搜索关键词,然后根据选择的补充搜索关键词搜索相关信息,那么向用户提供的信息就不再只是根据当前搜索关键词搜索到的少量的信息,还有根据选择的补充搜索关键词搜索到的信息,从而有效地提高了向用户提供信息的准确性和全面性,用户可以根据搜索到的信息顺利查找到自己所需要的信息,提高了用户的查询效率。


图I为本申请实施例一中,关联度确定方法流程不意图;图2为本申请实施例二中,信息提供方法流程示意图;图3为本申请实施例三中,关联度确定装置结构示意图;图4为本申请实施例四中,信息提供装置结构示意图。
具体实施例方式下面结合各个附图对本申请实施例技术方案的主要实现原理具体实施方式
及其对应能够达到的有益效果进行详细地阐述。本申请实施例包括确定搜索关键词之间的关联度的线下处理过程,以及根据确定出的关联度为用户提供信息的线上处理过程,下面分别介绍两个处理过程。实施例一本申请实施例一提供了一种关联度确定方法,如图I所示,其具体处理过程如下步骤11,获得规定时间段内的日志记录,所述日志记录包含各搜索关键词及对应的点击信息;用户在网站中搜索信息时,会输入搜索关键词,并确认搜索。网站根据输入的该搜索关键词搜索相关的信息,并将搜索到的信息以搜索结果列表的形式提供给用户,用户可以通过点击搜索结果列表中的信息来确认是否为自身想要查找的信息。本申请实施例一提出,网站可以将用户的搜索和点击行为记录在日志记录中,具体为用户输入搜索关键词并确认搜索,网站根据该搜索关键词进行信息搜索后,为用户提供搜索结果列表,若用户点击了搜索结果列表中的某个信息,则该信息即为点击信息,网站将用户输入的搜索关键词与该点击信息对应记录在日志记录中。此外,日志记录中还包含每个点击信息在对应的搜索关键词下的点击权重值,点击权重值可以为点击信息在对应的搜索关键词下的点击行为的次数。若根据搜索关键词A搜索到的信息中,共有100个用户点击了 200次点击信息1,则此时点击信息I在搜索关键词A下的点击行为的次数为200,那么点击信息I在搜索关键词A下的点击权重值为200。较佳地,可能存在一个用户多次点击一个点击信息的情况,为了提高点击权重值的准确性,本申请实施例一提出,点击信息的点击权重值还可以是点击信息在对应的搜索关键词下的点击行为所属用户的数量。若根据搜索关键词A搜索到的信息中,共有100个用户点击了200次点击信息I,则此时点击信息I在搜索关键词A下的点击行为所属用户的数量为100,那么点击信息I在搜索关键词A下的点击权重值为100。本申请实施例一中的日志记录的格式可以但不限于如表I所示表I :
权利要求
1.一种关联度确定方法,其特征在于,包括 获得日志记录,所述日志记录中包含各捜索关键词及对应的点击信息; 根据获得的各搜索关键词,构造各搜索关键词对,每个搜索关键词对中包含两个搜索关键词; 在构造的各搜索关键词对中,选择出满足预设条件的捜索关键词对; 针对选择出的每个搜索关键词对,分别执行 针对该搜索关键词对包含的每个搜索关键词,分别获得该搜索关键词对应的每个点击信息在该搜索关键词下的点击权重值; 根据获得的各点击权重值,确定该搜索关键词对包含的两个搜索关键词之间的关联度。
2.如权利要求I所述的关联度确定方法,其特征在干,点击信息在该搜索关键词下的点击权重值为 点击信息在该搜索关键词下的点击行为的次数;或 点击信息在该搜索关键词下的点击行为所属用户的数量。
3.如权利要求I所述的关联度确定方法,其特征在于,在构造的各搜索关键词对中,选择出满足预设条件的搜索关键词对,具体包括 针对获得的每个搜索关键词,分别执行 获得所述规定时间段内,该搜索关键词对应的各点击信息; 将获得的各点击信息对应的类目信息,确定为该搜索关键词对应的类目信息; 将包含的两个搜索关键词均对应同一类目信息的搜索关键词对,确定为满足预设条件的搜索关键词对。
4.如权利要求I所述的关联度确定方法,其特征在于,根据获得的各点击权重值,确定该搜索关键词对包含的两个搜索关键词之间的关联度,具体包括 针对该搜索关键词对包含的每个搜索关键词,分别在该搜索关键词对应的各点击信息中,选择出在该搜索关键词下的点击权重值不小于规定阈值的点击信息; 根据选择出的各点击信息的点击权重值,确定该搜索关键词对包含的两个搜索关键词之间的关联度。
5.如权利要求I所述的关联度确定方法,其特征在于,通过下述方式确定搜索关键词对包含的两个搜索关键词之间的关联度
6.一种关联度确定装置,其特征在于,包括 日志记录获得单元,用于获得规定时间段内的日志记录,所述日志记录中包含各搜索关键词及对应的点击信息; 关键词对构造单元,用于根据日志记录获得单元获得的各搜索关键词,构造各搜索关键词对,每个搜索关键词对中包含两个搜索关键词; 关键词对选择单元,用于在关键词对构造单元构造的各搜索关键词对中,选择出满足预设条件的搜索关键词对; 权重值获得单元,用于针对关键词对选择单元选择出的每个搜索关键词对,分别获得所述规定时间段内,该搜索关键词对包含的每个搜索关键词对应的每个点击信息在该搜索关键词下的点击权重值; 关联度确定单元,用于针对关键词对选择单元选择出的每个搜索关键词对,分别根据权重值获得单元获得的各点击权重值,确定该搜索关键词对包含的两个搜索关键词之间的关联度。
7.如权利要求6所述的关联度确定装置,其特征在于,所述关键词对选择单元具体包括 点击信息获得子单元,用于针对日志记录获得单元获得的每个搜索关键词,分别获得所述规定时间段内,该搜索关键词对应的各点击信息; 类目信息确定子单元,用于针对日志记录获得单元获得的每个搜索关键词,将点击信息获得子单元获得的各点击信息对应的类目信息,确定为该搜索关键词对应的类目信息;关键词对确定子单元,用于将包含的两个搜索关键词均对应同一类目信息的搜索关键词对,确定为满足预设条件的搜索关键词对。
8.如权利要求6所述的关联度确定装置,其特征在于,所述关联度确定单元具体包括 点击信息选择子单元,用于针对关键词对选择单元选择出的每个搜索关键词对,分别在该搜索关键词对包含的每个搜索关键词对应的各点击信息中,选择出在该搜索关键词下的点击权重值不小于规定阈值的点击信息; 关联度确定子单元,用于针对关键词对选择单元选择出的每个搜索关键词对,根据点击信息选择子单元选择出的各点击信息的点击权重值,确定该搜索关键词对包含的两个搜索关键词之间的关联度。
9.一种信息提供方法,其特征在于,包括 获得输入的当前搜索关键词后,查找该当前搜索关键词对应的各信息; 在判断出查找到的信息的数量不大于第一规定阈值时,确定该当前搜索关键词对应的各补充搜索关键词; 分别确定该当前搜索关键词与每个补充搜索关键词之间的关联度; 在确定出的各补充搜索关键词中,选择出与该当前搜索关键词之间的关联度满足预设条件的各补充搜索关键词; 针对选择出的每个补充搜索关键词,分别查找该补充搜索关键词对应的各信息; 提供根据该当前搜索关键词查找到的各信息以及根据选择出的各补充搜索关键词查找到的各信息。
10.如权利要求9所述的信息提供方法,其特征在于,确定该当前搜索关键词对应的各补充搜索关键词,具体包括 在规定时间段内的各搜索关键词中,选择出与该当前搜索关键词对应相同类目信息的各搜索关键词; 将选择出的各搜索关键词,确定为该当前搜索关键词对应的各补充搜索关键词。
11.如权利要求9所述的信息提供方法,其特征在于,所述预设条件为 关联度不小于第二规定阈值;或 按照关联度由大到小的顺序排序后的前规定数目个关联度。
12.一种信息提供装置,其特征在于,包括 关键词获得单元,用于获得输入的当前搜索关键词; 第一信息查找单元,用于查找关键词获得单元获得的该当前搜索关键词对应的各信息; 信息数量判断单元,用于判断第一信息查找单元查找到的信息的数量是否小于第一规定阈值; 关键词确定单元,用于在信息数量判断单元的判断结果为否时,确定该当前搜索关键词对应的各补充搜索关键词; 关联度确定单元,用于分别确定该当前搜索关键词与关键词确定单元确定出的每个补充搜索关键词之间的关联度; 关键词选择单元,用于在关键词确定单元确定出的各补充搜索关键词中,选择出与该当前搜索关键词之间的关联度满足预设条件的各补充搜索关键词; 第二信息查找单元,用于针对关键词选择单元选择出的每个补充搜索关键词,分别查找该补充搜索关键词对应的各信息; 信息提供单元,用于提供所述第一信息查找单元查找到的各信息以及第二信息查找单元查找到的各信息。
13.如权利要求12所述的信息提供装置,其特征在于,所述关键词确定单元具体包括 关键词选择子单元,用于在规定时间段内的各搜索关键词中,选择出与该当前搜索关键词对应相同类目信息的各搜索关键词; 关键词确定子单元,用于将关键词选择子单元选择出的各搜索关键词,确定为该当前搜索关键词对应的各补充搜索关键词。
全文摘要
本申请公开了一种关联度确定方法及装置、信息提供方法及装置,关联度确定方法包括下述步骤获得规定时间段内的日志记录,所述日志记录中包含各搜索关键词及对应的点击信息;根据获得的各搜索关键词,构造各搜索关键词对;在构造的各搜索关键词对中,选择出满足预设条件的搜索关键词对;针对选择出的每个搜索关键词对,分别执行针对该搜索关键词对包含的每个搜索关键词,分别获得所述规定时间段内,该搜索关键词对应的每个点击信息在该搜索关键词下的点击权重值;根据获得的各点击权重值,确定该搜索关键词对包含的两个搜索关键词之间的关联度。采用本申请技术方案,解决了现有技术中存在的为用户提供的信息不准确、不全面的问题。
文档编号G06F17/30GK102737038SQ20111008653
公开日2012年10月17日 申请日期2011年4月7日 优先权日2011年4月7日
发明者郭瑞 申请人:阿里巴巴集团控股有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1