一种文本信息的匹配、业务对象的推送方法和装置的制造方法_5

文档序号:9432554阅读:来源:国知局
文本信息组合。
[0277] 在本申请的一种优选实施例中,所述扩展文本信息组合组成模块还可W包括如下 子模块:
[027引去重子模块,对所述文本分词匹配的第二文本信息进行去重处理;
[0279] 所述组成子模块进一步可W包括如下子模块:
[0280] 去重组合子模块,用于将所述文本分词所属的第一文本信息,与所述去重处理之 后的第二文本信息组成扩展文本信息组合。
[0281] 在本申请的一种优选实施例中,所述第一文本信息对应的类目可W包括第一子类 目和第一父类目,所述第二文本信息对应的类目可W包括第二子类目和第二父类目;
[0282] 所述特征文本信息组合提取模块可W包括如下子模块:
[0283] 第一获取子模块,用于获取所述扩展文本信息中包含的第一文本信息对应的,置 信度顺序排序在前的一个或多个第一子类目;
[0284] 第二查找子模块,用于查找所述一个或多个第一子类目所属的,置信度顺序排序 在前的一个或多个第一父类目;
[0285] 第二获取子模块,用于获取所述扩展文本信息中包含的第二文本信息对应的,置 信度顺序排序在前的一个或多个第二子类目;
[0286]第H查找子模块,用于查找所述一个或多个第二子类目所属的,置信度顺序排序 在前的一个或多个第二父类目;
[0287] 提取子模块,用于提取所述第一子类目与所述第二子类目,和/或,所述第一子类 目与所述第二父类目,和/或,所述第一父类目与所述第二子类目匹配的扩展文本信息组 合,作为特征文本信息组合。
[028引在本申请实施例的一种优选示例中,所述第二文本信息可W对应有业务对象;
[0289] 可W通过W下公式计算所述特征文本信息组合所包含的第二文本信息的特征 值:
[0290] RPM1 = ASN*CPC
[0291] 其中,RPM1为特征值,ASN为所述业务对象对应的用户深度,CPC为所述业务对象 对应的权重。
[0292] 在本申请实施例的一种优选示例中,所述有限数量的第一文本信息可W包括在一 定时间范围内获得的查询词,所述有限数量的第二文本信息可W包括在一定时间内获得的 竞价词。
[0293] 参照图5,示出了本申请一种业务对象的推送装置实施例的结构框图,所述装置 500具体可W包括如下模块:
[0294] 文本信息接收单元501,用于接收客户端侧提交的第一文本信息;
[0295] 文本信息确定单元502,用于查找所述第一文本信息映射的第二文本信息;所述 第二文本信息对应有业务对象;
[0296] 业务对象推送单元503,用于将所述业务对象推送至客户端侧;
[0297] 其中,所述第一文本信息与所述第二文本信息可W通过调用W下单元确定映射关 系:
[029引文本信息获取单元,用于获取待匹配的第一文本信息和第二文本信息;所述第一 文本信息集合包括有限数量的第一文本信息,所述第二文本信息集合包括有限数量的第二 文本信息;
[0299] 文本信息匹配单元,用于按照预置的规则查询出与所述有限数量的第一文本信息 中的每一者相匹配的所述有限数量的第二文本信息中的一者或者多者。
[0300] 在本申请的一种优选实施例中,所述文本信息确定单元502可W包括如下模块:
[0301] 在线计算模块,用于在线计算所述第一文本信息映射的第二文本信息。
[0302] 在本申请的一种优选实施例中,所述文本信息确定单元502可W包括如下模块:
[0303] 字典查找模块,用于在预置的映射关系字典中查找所述第一文本信息映射的第二 文本信息;其中,所述映射关系字典为离线计算所述第一文本信息映射的第二文本信息所 生成的字典。
[0304] 在本申请的一种优选实施例中,所述第一文本信息和所述第二文本信息具有对应 的类目;
[0305] 所述文本信息匹配单元可W包括如下模块:
[0306] 扩展文本信息组合组成模块,用于按照预置的组合规则将所述第一文本信息和所 述第二文本信息组成扩展文本信息组合;
[0307] 特征文本信息组合提取模块,用于从所述扩展文本信息组合中提取特征文本信息 组合,所述特征文本信息组合为类目匹配的第一文本信息和第二文本信息所组成的扩展文 本信息组合;
[030引特征值计算模块,用于计算所述特征文本信息组合所包含的第二文本信息的特征 值;
[0309]映射关系设置模块,用于将特征值顺序排序在前的一个或多个第二文本信息及对 应的第一文本信息,设置为相互映射的第一文本信息和第二文本信息。
[0310] 在本申请的一种优选实施例中,所述扩展文本信息组合组成模块可W包括如下子 模块:
[0311] 分词子模块,用于对所述第一文本信息进行分词处理,获得文本分词;
[0312] 索引子模块,用于对所述第二文本信息建立倒排索引;
[0313] 第一查找子模块,用于在所述倒排索引中查找与所述文本分词匹配的第二文本信 息;
[0314] 组成子模块,用于将所述文本分词所属的第一文本信息,与所述匹配的第二文本 信息组成扩展文本信息组合。
[0315] 在本申请的一种优选实施例中,所述扩展文本信息组合组成模块还可W包括如下 子模块:
[0316] 去重子模块,对所述文本分词匹配的第二文本信息进行去重处理;
[0317] 所述组成子模块进一步可W包括如下子模块:
[031引去重组合子模块,用于将所述文本分词所属的第一文本信息,与所述去重处理之 后的第二文本信息组成扩展文本信息组合。
[0319] 在本申请的一种优选实施例中,所述第一文本信息对应的类目可W包括第一子类 目和第一父类目,所述第二文本信息对应的类目可W包括第二子类目和第二父类目;
[0320] 所述特征文本信息组合提取模块可W包括如下子模块:
[0321] 第一获取子模块,用于获取所述扩展文本信息中包含的第一文本信息对应的,置 信度顺序排序在前的一个或多个第一子类目;
[0322]第二查找子模块,用于查找所述一个或多个第一子类目所属的,置信度顺序排序 在前的一个或多个第一父类目;
[0323] 第二获取子模块,用于获取所述扩展文本信息中包含的第二文本信息对应的,置 信度顺序排序在前的一个或多个第二子类目;
[0324]第H查找子模块,用于查找所述一个或多个第二子类目所属的,置信度顺序排序 在前的一个或多个第二父类目;
[0325] 提取子模块,用于提取所述第一子类目与所述第二子类目,和/或,所述第一子类 目与所述第二父类目,和/或,所述第一父类目与所述第二子类目匹配的扩展文本信息组 合,作为特征文本信息组合。
[0326] 在本申请实施例的一种优选示例中,所述第二文本信息可W对应有业务对象;
[0327] 可W通过W下公式计算所述特征文本信息组合所包含的第二文本信息的特征 值:
[032引RPM1 =ASN*CPC
[0329] 其中,RPM1为特征值,ASN为所述业务对象对应的用户深度,CPC为所述业务对象 对应的权重。
[0330] 在本申请实施例的一种优选示例中,所述有限数量的第一文本信息可W包括在一 定时间范围内获得的查询词,所述有限数量的第二文本信息可W包括在一定时间内获得的 竞价词。
[0331] 对于装置实施例而言,由于其与方法实施例基本相似,所W描述的比较简单,相关 之处参见方法实施例的部分说明即可。
[0332] 本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与 其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。
[0333] 本领域内的技术人员应明白,本申请实施例的实施例可提供为方法、装置、或计算 机程序产品。因此,本申请实施例可采用完全硬件实施例、完全软件实施例、或结合软件和 硬件方面的实施例的形式。而且,本申请实施例可采用在一个或多个其中包含有计算机可 用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上 实施的计算机程序产品的形式。
[0334]在一个典型的配置中,所述计算机设备包括一个或多个处理器(CPU)、输入/输出 接口、网络接口和内存。内存可能包括计算机可读介质中的非永久性存储器,随机存取存储 器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flashRAM)。内存是计 算机可读介质的示例。计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可 W由任何方法或技术来实现信息存储。信息可W是计算机可读指令、数据结构、程序的模块 或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存 储器(SRAM)、动态随机存取存储器值RAM)、其他类型的随机存取存储器(RAM)、只读存储器 (ROM)、电可擦除可编程只读存储器巧EPROM)、快闪记忆体或其他内存技术、只读光盘只读 存储器(CD-ROM)、数字多功能光盘值VD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或 其他磁性存储设备或任何其他非传输介质,可用于存储可W被计算设备访问的信息。按照 本文中的界定,计算机可读介质不包括非持续性的电脑可读媒体(transitorymedia),女口 调制的数据信号和载波。
[0335] 本申请实施例是参照根据本申请实施例的方法、终端设备(系统)、和计算机程序 产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框 图中的每一流程和/或方框、W及流程图和/或方框图中的流程和/或方框的结合。可提 供送些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理 终端设备的处理器W产生一个机器,使得通过计算机或其他可编程数据处理终端设备的处 理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多 个方框中指定的功能的装置。
[0336] 送些计算机程序指令也可存储在能引导计算机或其他可编程数据处理终端设备 W特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包 括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方 框或多个方框中指定的功能。
[0337] 送些计算机程序指令也可装载到计算机或其他可编程数据处理终端设备上,使得 在计算机或其他可编程终端设备上执行一系列操作步骤W产生计算机实现的处理,从而在 计算机或其他可编程终端设备上执行的指令提供用于实现在流程图一个流程或多个流程 和/或方框图一个方框或多个方框中指定的功能的步骤。
[033引尽管已描述了本申请实施例的优选实施例,但本领域内的技术人员一旦得知了基 本创造性概念,则可对送些实施例做出另外的变更和修改。所W,所附权利要求意欲解释为 包括优选实施例W及落入本申请实施例范围的所有变更和修改。
[0339] 最后,还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将 一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示送些实体或操作 之间存在任何送种实际的
当前第5页1 2 3 4 5 6 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1