基于关键词聚类的排名参量值确定方法及装置的制造方法
【技术领域】
[0001] 本申请涉及数据处理领域,更具体地涉及一种基于关键词聚类的排名参量值确定 方法及装置。
【背景技术】
[000引对于目前主流的网络交互平台,例如电子商务平台,搜索引擎带来的流量(即用户 访问量或者用户搜索量)占平台总流量的20%至30%。从搜索引擎引入流量对优化数据是 很必要的。而为了获取更多的搜索引擎流量,通常采用增加海量长尾关键词的方法,该一 方法虽然有效,但长尾关键词的特点是流量少、效果随机且不稳定,加上搜索引擎数据量鹿 大,更加难W管理相应的搜索引擎的数据。由此,需要对搜索引擎数据进行分析和优化,W 优化数据管理、提高处理效率。下面W广告主做沈M为例来说明现有账户数据管理存在的 缺陷。
[0003] 比如,搜索引擎关键词竞价广告系统AdWords(又称"赞助商链接",中文俗称"右 侧广告"),是一种快速简单的购买广告服务的方式,该种广告服务的针对性强,无论预算是 多少,它都按每次点击计费(CPC)。通常,需要投递广告的广告主可W开通Adwords账户,在 Adwords账户中可W购买关键词,每个关键词可W绑定一个广告。当一个用户查询词通过 某种匹配方式匹配到广告主购买的关键词时,相应绑定的广告将在查询词搜索结果展示页 面显示。关键词匹配方式有H种,精确匹配,词组匹配,广泛匹配。其中,精确匹配就是当查 询词与Adwords账户中某一关键词完全相同,则查询词和竞价词匹配成功,搜索引擎触发 Adwords账户匹配成功的关键词所对应的广告。词组匹配就是当查询词完全包含关键词的 组成成分时,不论其各个组成成分W何种顺序出现,则查询词与关键词匹配成功,搜索引擎 触发Adwords中匹配成功的关键词所对应的广告。例如,针对查询词"mp3价格",通过词组 匹配方式可W触发关键词"mp3"对应的广告。广泛匹配,匹配范围比精确匹配和词组匹配 更广,查询词和关键词只需存在语义上的相关性即可,不要求完全相同或者具有包含关系, 甚至字面意义上完全不同也可W。例如"mp3"和"播放器"可构成广泛匹配关系。在搜索账 户中,广告主在决定是否购买某一关键词时,主要考虑该关键词的Roi。Roi(returnover investment,投入产出比)目P,收入(比如通过该关键词对应的广告引入的流量)除W成本, 当Roi大于设定阔值时,可W认为盈利;当Roi小于设定阔值时可W认为是亏损。
[0004] 在沈M(Search化gineMarketing,搜索引擎营销)推广时,为了增加账户搜索流 量,常常会加入大量长尾关键词。长尾关键词流量低,转化效果随机,波动大,广告主很难根 据其Roi来为其对应的广告确定一个合理的排名。因此,大量的效果不稳定的长尾关键词 对广告主管理Adwords账户带来了挑战。另外,目前搜索引擎普遍支持广泛匹配和词组匹 配。在广泛匹配或词组匹配的模式下,一个查询词(query)出现,可W匹配广告主的账户中 的多个关键词,该导致同一类型的关键词之间会产生相互影响。广告主通过提升账户中关 键词的投入(比如增加该关键词的费用,W提升该关键词对应的广告的排名)可W引入更多 流量,但是却会导致账户整体Roi的降低。通过降低关键词的投入的方式可W达到整体提 升账户Roi的目的,但是该个需要多轮的调整才可达到目的,过于缓慢。
[0005] 目前,普遍采用基于规则的方法管理Adwords账户,即,对Roi好的关键词提升投 入的费用,Roi较差的关键词降低投入的费用。该种基于规则方法仅从单个关键词角度出 发,无法有效的管理拥有海量长尾关键词Adwrods账户,由于长尾关键词的不稳定性及转 化效果的随机波动,需要对关键词做频繁的调整,不仅会增加Adwords账户管理成本,更会 导致广告主投入的费用波动过大,不稳定,并且该种基于规则的管理方法也无法解决广泛 匹配与词组匹配带来的影响。
【发明内容】
[0006] 针对上述现有技术的缺陷,本申请提供改进后的一种基于关键词聚类的排名参量 值确定方法及装置,W解决现有技术中搜索引擎存在的长尾关键词转化效果不稳定W及由 于关键词的广泛匹配和词组匹配两种匹配方式造成的同一类型的关键词之间相互影响的 问题。
[0007] 根据本申请的一个方面,提供一种基于关键词聚类的排名参量值确定方法,包括: 接收第一用户选择的多个关键词信息及每个关键词的排名参量值,所述排名参量值用于调 整该关键词对应的待投放信息在页面中的排名;对第一用户选择的多个关键词进行聚类, W得到一个或多个关键词类别;根据第一用户选择的关键词及其排名参量值,展示所述待 投放信息,W获取第二用户在每一关键词类别对应的待投放信息上的操作反馈信息;接收 第二用户当前输入的查询信息,确定与所述查询信息匹配的关键词、该匹配的关键词对应 的待投放信息、W及该匹配的关键词所属的关键词类别;利用第二用户在确定的所述关键 词类别对应的待投放信息上的操作反馈信息,调整所匹配的关键词的目标排名参量值;利 用该目标排名参量值,调整所匹配的关键词对应的待投放信息的排名。
[0008] 进一步,聚类包括;将所述多个关键词中每个关键词W及对应触发该关键词的一 个或多个查询词进行分词处理,W得到分别与所述多个关键词对应的多个词信息集合;根 据得到的分别与所述多个关键词对应的多个词信息集合,确定所述多个关键词中各个所述 关键词之间的相关度;根据各个所述关键词之间的相关度对所述多个关键词进行聚类,W 得到一个或多个关键词类别。
[0009] 其中,所述多个关键词中每个关键词对应的所述词信息集合中包含:与所述关键 词对应的一个或多个词项W及所述一个或多个词项在所述关键词中的权重。
[0010] 其中,将所述多个关键词中每个关键词W及对应触发该关键词的一个或多个查询 词进行分词处理,W得到分别与所述多个关键词对应的多个词信息集合包括:将所述多个 关键词中每个关键词W及对应触发该关键词的一个或多个查询词进行分词处理,W得到与 所述关键词对应的一个或多个词项;确定与所述关键词对应的一个或多个词项在所述关键 词中的权重;根据与所述关键词对应的一个或多个词项W及所述一个或多个词项在所述关 键词中的权重,构建所述关键词对应的词信息集合。
[0011] 其中,确定与所述关键词对应的一个或多个词项在所述关键词中的权重,进一步 包括;根据每个词项在所述关键词W及对应触发所述关键词的一个或多个查询词中出现的 次数W及出现所述词项的关键词的个数,确定所述词项在所述关键词中的权重。
[0012] 其中,根据得到的分别与所述多个关键词对应的多个词信息集合,确定各个所述 关键词之间的相关度,进一步包括:获取与所述多个关键词相关的一个或多个潜在类;基 于所述多个关键词中每个关键词对应的词信息集合,计算每个潜在类在所述多个关键词中 每个关键词中的权重;根据每个潜在类在所述每个关键词中的权重确定所述多个关键词中 各个关键词之间的相关度。
[0013] 其中,基于所述多个关键词中每个关键词对应的词信息集合,计算每个潜在类在 所述多个关键词中每个关键词中的权重,包括:根据每个关键词对应的词信息集合中包含 的与所述关键词对应的一个或多个词项在所述关键词中的权重,计算每个潜在类在所述多 个关键词中出现的概率W及在每个潜在类下每个关键词出现的概率;根据每个潜在类在每 个关键词中出现的概率W及在每个潜在类下每个关键词出现的概率,计算每个潜在类在所 述多个关键词中每个关键词中的权重。
[0014] 其中,根据各个所述关键词之间的相关度对所述多个关键词进行聚类,W得到一 个或多个关键词类别,进一步包括:将所述多个关键词中相关度超过预定阔值的关键词划 入同一关键词类别,W得到一个或多个关键词类别。
[0015] 根据本申请的另一个方面,提供一种基于关键词聚类的排名参量值确定装置,包 括:第一接收模块,用于接收第一用户选择的多个关键词信息及第一用户对每个关键词的 排名参量值,所述排名参量值用于调整该关键词对应的第一用户待投放信息在页面中的排 名;聚类模块,用于对第一用户选择的多个关键词进行聚类,W得到一个或多个关键词类 另IJ;展示模块,用于根据第一用户选择的多个关键词及第一用户对每个关键词的排名参量 值,展示所述多个关键词对应的第一用户的待投放信息,W获取第二用户在每一关键词类 别对应的待投放信息上的操作反馈信息;第二接收模块,用于接收第二用户当前输入的查 询信息,确定所述查询信息匹配的关键词、所匹配的关键词对应的待投放信息、W及所匹配 的关键词所属的关键词类别;确定模块,用于利用第二用户在确定的所述关键词类别对应 的待投放信息上的操作反馈信息,调整所匹配的关键词的目标排名参量值;调整模块,利用 该目标排名参量值,调整所匹配的关键词对应的待投放信息的排名。
[0016] 其中,聚类模块进一步包括;分词处理模块,用于将所述多个关键词中每个关键词 W及对应触发该关键词的一个或多个查询词进行分词处理,W得到分别与所述多个关键词 对应的多个词信息集合;相关度确定模块,用于根据得到的分别与所述多个关键词对应的 多个词信息集合,确定所述多个关键词中各个所述关键词之间的相关度;关键词聚类模块, 用于根据各个所述关键词之间的相关度对所述多个关键词进行聚类,W得到一个或多个关 键词类别。
[0017] 其中,所述多个关键词中每个关键词对应的所述词信息集合中包含:与所述关键 词对应的一个或多个词项W及所述一个或多个词项在所述关键词中的权重。
[0018] 其中,所述分词处理模块进一步包括;分词模块,用于将所述多个关键词中每个关 键词W及对应触发该关键词的一个或多个查询词进行分词处理,W得到与所述关键词对应 的一个或多个词项;权重确定模块,用于确定与所述关键词对应的一个或多个词项在所述 关键词中的权重;构建模块,用于根据与所述关键词对应的一个或多个词项W及所述一个 或多个词项在所述关键词中的权重,构建所述关键词对应的词信息集合。
[0019] 其中,所述权重确定模块进一步用于;根据每个词项在所述关键词W及对应触发 所述关键词的一个或多个查询词中出现的次数W及出现所述词项的关键词的个数,确定所 述词项在所述关键词中的权重。
[0020] 其中,所述相关度确定模块进一步包括:潜在类获取模块,用于获取与所述多个