搜索目标识别方法、装置及终端的制作方法

文档序号:10569932阅读:446来源:国知局
搜索目标识别方法、装置及终端的制作方法
【专利摘要】一种搜索目标识别方法、装置及终端,搜索目标识别方法包括:根据已知的词典库对搜索文本进行分词,得到多个目标关键词,其中,所述词典库包括多种词典,所述多个目标关键词与所述多种词典相对应;根据所述多个目标关键词各自对应的词典,将所述多个目标关键词中的至少一部分与预设词典模板进行匹配转换,以得到组合词;将所述组合词与未匹配转换的目标关键词组成搜索关键词,所述搜索关键词对应所述搜索目标;其中,所述词典模板为所述词典库中一种或多种词典的组合。本发明技术方案提高了搜索目标识别的效率。
【专利说明】
搜索目标识别方法、装置及终端
技术领域
[0001]本发明涉及互联网技术领域,尤其涉及一种搜索目标识别方法、装置及终端。
【背景技术】
[0002]随着搜索经济的崛起,人们越来越关注全球各大搜索引擎的性能、技术和日流量等特性,因此搜索引擎的瓶颈以及性能提升逐步成为目前的研究热点。在互联网领域,用户通常习惯于使用通用搜索引擎,通过输入一段文本进行网络搜索,获取与输入文本相关的
?目息O
[0003]现有技术中,在某些商品搜索行业中,例如,在汽车行业的垂直搜索引擎(Vertical Search Engine)、汽车行业站点的搜索模块,提供给用户的界面是结构化的。用户在搜索时,按照提供的结构化的界面,一一进行筛选,并向搜索引擎提交查询。用户向搜索引擎提交查询关键词(通常采用自然语言的方式输入,例如“MP3”)。而搜索引擎内部进行搜索时只接受或识别特定格式的查询串(即,机器语言),例如,q= [MP3]0R[MP3录音笔]AND[MP3 耳机]&fi I ter: customer_id = 5432 l&sort type: +update_time&count = 12。因此,需要对用户的查询关键词进行相应处理以生成搜索引擎内部可识别的搜索引擎查询串。目前大多数搜索引擎是通过其前端系统事先根据不同的应用类型或业务类型的查询串逻辑生成相应的模板,然后在实际应用中套用与输入的查询关键词相关的模板来生成搜索引擎查询串。另外,新兴的客服机器人可以模拟人机对话,基于语音进行交互,实现目标的搜索。
[0004]但是,用户在使用类似的垂直搜索引擎时,需要点击多次过滤,才能匹配最终的搜索意图,导致使用不便;此外,客服机器人在搜索目标时,搜索关键词组合的灵活性低,降低了搜索效率,用户体验差。

【发明内容】

[0005]本发明解决的技术问题是如何提高搜索目标识别的效率。
[0006]为解决上述技术问题,本发明实施例提供一种搜索目标识别方法,搜索目标识别方法包括:根据已知的词典库对搜索文本进行分词,得到多个目标关键词,其中,所述词典库包括多种词典,所述多个目标关键词与所述多种词典相对应;根据所述多个目标关键词各自对应的词典,将所述多个目标关键词中的至少一部分与预设词典模板进行匹配转换,以得到组合词;将所述组合词与未匹配转换的目标关键词组成搜索关键词的至少一部分,所述搜索关键词对应所述搜索目标;其中,所述词典模板为所述词典库中一种或多种词典的组合。
[0007]可选的,所述搜索目标识别方法还包括:将所述搜索关键词形成与搜索引擎相适应的查询语句。
[0008]可选的,所述查询语句包括以下一种或多种:sql搜索语句和Iucene查询语句。
[0009]可选的,将所述多个目标关键词中的至少一部分与预设词典模板进行匹配转换包括:根据多个所述目标关键词中的至少一部分对应的词典及其排列顺序,确定匹配的所述预设词典模板;将与所述预设词典模板匹配的多个目标关键词组合,以形成所述组合词。
[0010]可选的,所述预设词典模板包括由范围词典和单位词典形成的范围模板,根据所述多个目标关键词各自对应的词典,将所述多个目标关键词中的至少一部分与预设词典模板进行匹配转换包括:将对应于范围词典和单位词典的多个所述目标关键词与所述范围模板匹配,并按照所述范围模板组合转换形成组合数词。
[0011]可选的,所述词典库包括以下一种或多种:单位词典、范围词典、颜色词典和品牌词典。
[0012]可选的,所述品牌词典还包括品牌同义词或品牌拼音。
[0013]为解决上述技术问题,本发明实施例还公开了一种搜索目标识别装置,所述搜索目标识别装置包括:分词单元,适于根据已知的词典库对搜索文本进行分词,得到多个目标关键词,其中,所述词典库包括多种词典,所述多个目标关键词与所述多种词典相对应;转换单元,适于根据所述多个目标关键词各自对应的词典,将所述多个目标关键词中的至少一部分与预设词典模板进行匹配转换,以得到组合词;组合单元,适于将所述组合词与未匹配转换的目标关键词组成搜索关键词的至少一部分,所述搜索关键词对应所述搜索目标;其中,所述词典模板为所述词典库中一种或多种词典的组合。
[0014]可选的,所述搜索目标识别装置还包括:查询语句形成单元,适于将所述搜索关键词形成与搜索引擎相适应的查询语句。
[0015]可选的,所述查询语句包括以下一种或多种:sql搜索语句和Iucene查询语句。
[0016]可选的,所述转换单元包括:确定子单元,适于根据多个所述目标关键词中的至少一部分对应的词典及其排列顺序,确定匹配的所述预设词典模板;转换子单元,适于将与所述预设词典模板匹配的多个目标关键词组合,以形成所述组合词。
[0017]可选的,所述预设词典模板包括由范围词典和单位词典形成的范围模板,所述转换单元包括:范围转换子单元,适于将对应于范围词典和单位词典的多个所述目标关键词与所述范围模板匹配,并按照所述范围模板组合转换形成组合数词。
[0018]可选的,所述词典库包括以下一种或多种:单位词典、范围词典、颜色词典和品牌词典。
[0019]可选的,所述品牌词典还包括品牌同义词或品牌拼音。
[0020]为解决上述技术问题,本发明实施例还公开了一种终端,所述终端包括所述搜索目标识别装置。
[0021]与现有技术相比,本发明实施例的技术方案具有以下有益效果:
[0022]本发明根据已知的词典库对搜索文本进行分词,得到多个目标关键词,其中,所述词典库包括多种词典,所述多个目标关键词与所述多种词典相对应;根据所述多个目标关键词各自对应的词典,将所述多个目标关键词中的至少一部分与预设词典模板进行匹配转换,以得到组合词;将所述组合词与未匹配转换的目标关键词组成搜索关键词的至少一部分,所述搜索关键词对应所述搜索目标;其中,所述词典模板为所述词典库中一种或多种词典的组合。通过将分词后得到的多个目标关键词与预设词典模板进行匹配转换,并与未匹配转换的目标关键词组成搜索关键词或者搜索关键词的一部分,从而使得搜索时使用的搜索关键词可以更准确的表达搜索文本,提高了搜索目标识别的准确性,进一步提高了搜索结果的效率和准确性。
[0023]进一步,将所述多个目标关键词中的至少一部分与预设词典模板进行匹配转换包括:根据多个所述目标关键词中的至少一部分对应的词典及其排列顺序,确定匹配的所述预设词典模板;将与所述预设词典模板匹配的多个目标关键词组合,以形成所述组合词。通过将至少一部分目标关键词根据其对应的词典和排列顺序,匹配确定的预设词典模板,形成组合词,通过对用户输入文本进行意图识别形成组合词的方式,从而将用户无结构的搜索转化成结构化搜索,提高了搜索结果的准确性,同时提升了用户体验。
【附图说明】
[0024]图1是本发明实施例一种搜索目标识别方法的流程图;
[0025]图2是本发明实施例另一种搜索目标识别方法的流程图;
[0026]图3是本发明实施例一种搜索目标识别装置的结构示意图;
[0027]图4是本发明实施例另一种搜索目标识别装置的结构示意图。
【具体实施方式】
[0028]如【背景技术】中所述,现有技术的搜索系统中,用户在使用类似的垂直搜索引擎时,需要点击多次过滤,才能匹配最终的搜索意图,导致使用不便;此外,客服机器人在搜索目标时,搜索关键词组合的灵活性低,降低了搜索效率,用户体验差。
[0029]本发明实施例通过将分词后得到的多个目标关键词与预设词典模板进行匹配转换,并与未匹配转换的目标关键词组成搜索关键词,从而使得搜索时使用的搜索关键词可以更准确的表达用户的搜索文本,提高了搜索目标识别的准确性,进一步提高了搜索结果的准确性,从而可以将用户无结构的搜索转化成结构化搜索,提升了用户体验。
[0030]为使本发明的上述目的、特征和优点能够更为明显易懂,下面结合附图对本发明的具体实施例做详细的说明。
[0031 ]图1是本发明实施例一种搜索目标识别方法的流程图,下面结合图1对搜索目标识别方法做详细的说明。
[0032]步骤SlOl:根据已知的词典库对搜索文本进行分词,得到多个目标关键词。其中,所述词典库包括多种词典,所述多个目标关键词与所述多种词典相对应。
[0033]本实施例中,搜索文本表示用户为了搜索目标在搜索引擎里输入的一段文字,例如可以是,英文字母、拼音、汉字、字符、数字以及其组合。所述词典库为已知或预先建立的,每一词典库为存储一个类别的关键词构成的数据库,一个词典库对应一个类别的关键词从而对应一个词典类别。例如,对于汽车行业而言,所述词典类别可以有“品牌”、“型号”、“颜色”和“单位”等,同时,预先为每个词典类别的词典库添加同一类型的关键词。可以理解的是,对于汽车行业而言,还可以定义其他种所述词典类别以及对应的词典库,例如“价格”等。
[0034]需要说明的是,所述词典类别在预先定义时,可以根据行业的不同而有所不同。又如,在化妆品行业,已知的词典类别可以有“品牌”、“功能” “核心词”和“容量”,可以看出,该词典类别与上例中的词典类别不同。需要指出的是,所述词典类别的具体名称的定义不限于本例,也可以将每个词典类别定义为其他名称,只要能区分不同类别的关键词即可。
[0035]在每一词典库中存储有单个类别的关键词,例如,在上述汽车的词典库中,品牌类别这一词典库中存储有“宝马”、“捷豹”、“路虎”、“劳斯莱斯”等关键词,而颜色类别这一词典库中存储有“白色”、“黑色” “银白色”等关键词,型号类别这一词典库中存储有“730Li”、“330i”、“325i”等关键词,“年份”、“价格”、“里程”、“排量”等单位词典分别存储有“年”、“万”、“万公里”、“升”等关键词,在此不必详尽描述。
[0036]在本发明的实施例中,所述词典库的词典类别为预先定义已知的,而所述词典库中的关键词也为预先存储的。需要指出的是,针对每个行业,可以定义不同的词典类别和词典库。
[0037]由此,在本步骤SlOl的具体实施中,可以根据已知的多个词典库对搜索文本进行分词,得到所述搜索文本的多个目标关键词。进一步而言,分词的过程是将搜索文本按照词典库进行切分,从而得到与词典库匹配的多个目标关键词。
[0038]例如,所述搜索文本为“宝马3-5万x5白色”,根据已知的多个词典库可以对“宝马3-5万x5白色”进行分词,在本实例中,假设已知的词典库为“品牌”、“单位”、“型号”、“范围”和“颜色”,并且已知每个词典库中均存储有同一类关键词,那么当词典库中的关键词包含所述搜索文本中的词时,将该词进行切分,例如“品牌”词典库中有“宝马”这一关键词,则可以将“宝马3-5万x5白色”中的“宝马”进行切分,依次类推,假设词典库中都能找到本例中的搜索文本中的词,那么可将“宝马3-5万x5白色”进行分词得到多个目标关键词:“宝马”、“3”、“-,,“5” “万”、“x5”和“白色”,分别对应词典“品牌”、“数词”、“范围”、“数词”、“单位”、“型号”和“颜色”。
[0039]例如,分此后得到的多个关键词也可以是:“宝马”、“3万,,、“_,,“5万,,“x5”和“白色”,分别对应词典“品牌”、“价格”、“范围”、“价格”、“型号”和“颜色”。需要指出的是,在本发明的实施例中,数字“3”和“5”可以被系统自动识别,“单位”词典库中可以仅存储单位词“万”,当分词系统在自动识别数词“3”和“5”后,如查找到词典库中有单位词“万”,则将数词“3”和“5”与“万”进行合并,得到所述目标关键词“3万”和“5万”。
[0040]步骤S102:根据所述多个目标关键词各自对应的词典,将所述多个目标关键词中的至少一部分与预设词典模板进行匹配转换,以得到组合词。
[0041]本实施例中,根据分词得到的多个目标关键词,以及预设词典模板,其中,所述词典模板为所述词典库中一种或多种词典的组合。所述预设词典模板为预先设定的,例如可以根据需要、根据经验或者根据大数据机器学习的结果预先设定,所述已知的模板包括不同的词典类别。将至少一部分所述多个目标关键词进行匹配转换,得到组合词。
[0042]具体实施中,数词与范围词典可以组合成下述结构:“数词+范围词+数词”,构建成为范围模板,所述范围词典可以包括“至”、“以上”、“以下”、“超过“等关键词。也可以是,数词、范围词典与单位词典组合成下述结构:“数词+范围词+数词+价格单位词”,构建成为价格范围模板。
[0043]例如,经步骤SlOl,确定得到多个目标关键词:“宝马”、“3”、“5” “万”、“x5”和“白色”,分别对应词典“品牌”、“数词”、“范围”、“数词,,、“单位”、“型号”和“颜色”。根据部分关键词“3”、“-,,“5万,,及其对应的词典类别“数词”、“范围”、“数词,,和“单位”,与价格范围模板“数词+范围词+数词+价格单位词”相匹配,经过此价格范围模板的处理,最终得到,最小价格30000,最大价格50000。根据词性的组合,抽取出应用词。具体地,“最小价格”和“最大价格”是根据价格范围模板抽取出来的,进而可以分析出价格的范围取值。得到价格范围的相对精准的抽取。
[0044]本发明实施例通过预设词典模板可以进行多个目标关键词之间灵活的组合,进一步提尚了目标搜索的效率。
[0045]步骤S103:将所述组合词与未匹配转换的目标关键词组成搜索关键词的至少一部分,所述搜索关键词对应所述搜索目标。
[0046]本实施例中,为了给用户带来与通用搜索引擎一致的用户体验,将所述组合词与未匹配转换的目标关键词组成搜索关键词,通过用户输入的文本,将非结构化的搜索转换成结构化的搜索。当然,搜索关键词中也并不限于仅由组合词以及未匹配的目标关键词组成,在此之外也可以包括其他的适当成分,例如一些用于辅助搜索的成分。
[0047]例如,经步骤S102,确定得到组合词:“最小价格30000,最大价格50000”,并与未匹配转换的目标关键词“宝马”、“x5”和“白色” 一起组成搜索关键词“品牌:宝马、最小价格:30000、最大价格:50000、颜色:白色”。
[0048]本发明实施例的搜索目标识别方法得到的搜索关键词,可以更准确的表达搜索文本,提高了搜索目标识别的准确性,进一步提高了搜索结果的准确性,可以适用于特定的应用场景,扩大了搜索目标识别方法的适用范围。
[0049]图2是本发明实施例另一种搜索目标识别方法的流程图,下面结合图2对所述搜索目标识别方法做详细的说明。
[0050]步骤S201:根据已知的词典库对搜索文本进行分词,得到多个目标关键词。其中,所述词典库包括多种词典,所述多个目标关键词与所述多种词典相对应。
[0051]具体实施中,所述词典库包括以下一种或多种:单位词典、范围词典、颜色词典和品牌词典。具体地,所述品牌词典还包括品牌同义词或品牌拼音,以适应用户在搜索文本中使用拼音或同义词的情况。例如,“宝马”的拼音”baoma”、“宝马”的英文名称缩写“BMW”等,在此不必详尽描述。
[0052]在本实施例中,分词方法与步骤SlOl中相同,可参照前述相应【具体实施方式】,在此不再赘述。
[0053]步骤S202:根据多个所述目标关键词中的至少一部分对应的词典及其排列顺序,确定匹配的所述预设词典模板。
[0054]具体实施中,确定多个所述目标关键词后,根据其中至少一部分关键词对应的词典及其中至少一部分关键词的排列顺序,确定与至少一部分关键词相匹配的所述预设词典模板。也可以说,至少一部分关键词对应的词典类别、排列顺序与确定的预设词典模板中词典组合的类别、组合的顺序相一致,则表示至少一部分关键词与所述预设词典模板相匹配。具体地,所述预设词典模板为预先设定的,例如可以根据需要、根据经验或者根据大数据机器学习的结果进行预先设定。
[0055]例如,经步骤S201,确定用户搜索文本进行分词后的多个目标关键词:“宝马”、“3”、“_,,“5” “万”、“x5”和“白色”,分别对应词典“品牌”、“数词”、“范围”、“数词”、“单位”、“型号”和“颜色”。根据部分关键词“3”、“_,,“5”、“万”及其对应的词典类别“数词”、“范围”、“数词”和“单位”,在词典库中的预设词典模板中按照此词典组合和顺序查找,找到价格范围模板“数词+范围词+数词+价格单位词”,价格范围模板与部分关键词“3”、“5”、“万”相匹配,也就是说,价格范围模板则是所述预设词典模板。需要指出的是,在词典库中未找到与多个关键词的至少一部分相匹配的预设词典模板时,则不进行组合词的组合操作。
[0056]步骤S203:将与所述预设词典模板匹配的多个目标关键词组合,以形成所述组合
Τ.κ| ο
[0057]具体实施中,所述预设词典模板包括由范围词典和单位词典形成的范围模板,根据所述多个目标关键词各自对应的词典,将所述多个目标关键词中的至少一部分与预设词典模板进行匹配转换包括:将对应于范围词典和单位词典的多个所述目标关键词与所述范围模板匹配,并按照所述范围模板组合转换形成组合数词。
[0058]例如,经步骤S202,确定所述预设词典模板为价格范围模板后,将部分关键词“3”、“5”、“万”按照价格范围模板“数词+范围词+数词+价格单位词”的格式进行组合转换,得到组合数词“最小价格30000,最大价格50000”,也可以是“最小价格3w,最大价格5w”。具体地,“最小价格”和“最大价格”是根据价格范围模板抽取出来的,进而可以分析出价格的范围取值。得到价格范围的相对精准的抽取。
[0059]步骤S204:将所述组合词与未匹配转换的目标关键词组成搜索关键词的至少一部分,所述搜索关键词对应所述搜索目标。
[0060]例如,经步骤S203,确定组合数词“最小价格30000,最大价格50000”,并与未匹配转换的目标关键词“宝马”、“x5”和“白色”一起组成搜索关键词“品牌:宝马、最小价格:30000、最大价格:50000、颜色:白色”。
[0061]本发明实施例在用户的搜索文本存在组合词的情况下,可以对能够进行组合的词语进行组合,形成组合词,并与未匹配转换的目标关键词组成搜索关键词,与直接分词后进行搜索的方法相比,搜索到的目标的准确性提高,用户体验提高。
[0062]步骤S205:将所述搜索关键词形成与搜索引擎相适应的查询语句。
[0063]具体实施中,所述查询语句可以包括以下一种或多种:sql搜索语句和Iucene查询语句。具体地,sql搜索语句表示结构化查询语言(Structured Query Language),Iucene查询语句用于全文搜索引擎Lucenelucene是一套用于全文检索和搜寻的开源程序库,能够做全文索引和搜寻,可以方便的在目标系统中实现全文检索的功能,或者是以此为基础建立起完整的全文检索引擎。
[0064]例如,经步骤S204,确定搜索关键词“品牌:宝马、最小价格:30000、最大价格:50000、颜色:白色”,可以以此最终结构构建成sql搜索语句:select*from auto wherebrand= “宝马”and price> = 30000and price< = 50000and color= “白色”。由此,将用户输入的搜索文本“宝马3-5万x5白色”构建成了结构化查询语句:select*from auto wherebrand= “宝马”and price> = 30000and price< = 50000and color= “白色”,基于所述结构化查询语句可以进行后续操作。
[0065]下面对本发明实施例中的所述搜索目标识别方法对应的装置做以下说明。
[0066]图3是本发明实施例中的一种搜索目标识别装置的结构示意图。如图3所示的搜索目标识别装置,可以包括:分词单元301、转换单元302和组合单元303。
[0067]其中,分词单元301适于根据已知的词典库对搜索文本进行分词,得到多个目标关键词,具体地,所述词典库包括多种词典,所述多个目标关键词与所述多种词典相对应;转换单元302适于根据所述多个目标关键词各自对应的词典,将所述多个目标关键词中的至少一部分与预设词典模板进行匹配转换,以得到组合词;组合单元303适于将所述组合词与未匹配转换的目标关键词组成搜索关键词的至少一部分,所述搜索关键词对应所述搜索目标。
[0068]具体实施中,搜索文本表示用户为了搜索目标在搜索引擎里输入的一段文字,例如可以是,英文字母、拼音、汉字、字符、数字以及其组合。分词单元301中词典库为已知或预先建立的,每一词典库为存储一个类别的关键词构成的数据库,一个词典库对应一个类别的关键词从而对应一个词典类别。例如,对于汽车行业而言,所述词典类别可以有“品牌”、“型号”、“颜色”和“单位”等,同时,预先为每个词典类别的词典库添加同一类型的关键词。可以理解的是,对于汽车行业而言,还可以定义其他种所述词典类别以及对应的词典库,例如“价格”等。转换单元302根据分词得到的多个目标关键词,以及预设词典模板,其中,所述词典模板为所述词典库中一种或多种词典的组合。所述预设词典模板为预先设定的,例如可以根据需要、根据经验或者根据大数据机器学习的结果预先设定,所述已知的模板包括不同的词典类别。将至少一部分所述多个目标关键词进行匹配转换,得到组合词。
[0069]本发明实施例的搜索目标识别方法得到的搜索关键词,可以更准确的表达搜索文本,提高了搜索目标识别的准确性,进一步提高了搜索结果的准确性。
[0070]图4是本发明实施例中的另一种搜索目标识别装置的结构示意图。
[0071]如图4所示的搜索目标识别装置可以包括:分词单元401、转换单元402、确定子单元403、转换子单元404、组合单元405和查询语句形成单元406。
[0072]其中,分词单元401适于根据已知的词典库对搜索文本进行分词,得到多个目标关键词。具体地,所述词典库包括多种词典,所述多个目标关键词与所述多种词典相对应。所述词典库可以包括以下一种或多种:单位词典、范围词典、颜色词典和品牌词典。具体地,所述品牌词典还包括品牌同义词或品牌拼音,以适应用户在搜索文本中使用拼音或同义词的情况。例如,“宝马”的拼音“baoma”、“宝马”的英文名称缩写“BMW”等,在此不必详尽描述。
[0073]具体实施中,转换单元402可以包括确定子单元403和转换子单元404。确定子单元403适于根据多个所述目标关键词中的至少一部分对应的词典及其排列顺序,确定匹配的所述预设词典模板;转换子单元404适于将与所述预设词典模板匹配的多个目标关键词组合,以形成所述组合词。
[0074]具体实施中,确定多个所述目标关键词后,根据其中至少一部分关键词对应的词典及其中至少一部分关键词的排列顺序,确定与至少一部分关键词相匹配的所述预设词典模板。也可以说,至少一部分关键词对应的词典类别、排列顺序与确定的预设词典模板中词典组合的类别、组合的顺序相一致,则表示至少一部分关键词与所述预设词典模板相匹配。具体地,所述预设词典模板为预先设定的,例如可以根据需要、根据经验或者根据大数据机器学习的结果进行预先设定。
[0075]组合单元405适于将所述组合词与未匹配转换的目标关键词组成搜索关键词的至少一部分,所述搜索关键词对应所述搜索目标。查询语句形成单元406适于将所述搜索关键词形成与搜索引擎相适应的查询语句。
[0076]本发明实施例的具体方式可参照前述相应实施例,此处不再赘述。
[0077]本发明实施例在用户的搜索文本存在组合词的情况下,可以对能够进行组合的词语进行组合,形成组合词,并与未匹配转换的目标关键词组成搜索关键词,与直接分词后进行搜索的方法相比,搜索到的目标的准确性提高,用户体验提高。
[0078]本发明实施例还公开了一种终端,所述终端包括所述搜索目标识别装置。所述终端可以支持配置所述搜索目标识别装置,执行所述搜索目标识别方法。
[0079]本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,该程序可以存储于以计算机可读存储介质中,存储介质可以包括:R0M、RAM、磁盘或光盘等。
[0080]虽然本发明披露如上,但本发明并非限定于此。任何本领域技术人员,在不脱离本发明的精神和范围内,均可作各种更动与修改,因此本发明的保护范围应当以权利要求所限定的范围为准。
【主权项】
1.一种搜索目标识别方法,其特征在于,包括: 根据已知的词典库对搜索文本进行分词,得到多个目标关键词,其中,所述词典库包括多种词典,所述多个目标关键词与所述多种词典相对应; 根据所述多个目标关键词各自对应的词典,将所述多个目标关键词中的至少一部分与预设词典模板进行匹配转换,以得到组合词; 将所述组合词与未匹配转换的目标关键词组成搜索关键词的至少一部分, 所述搜索关键词对应所述搜索目标; 其中,所述词典模板为所述词典库中一种或多种词典的组合。2.根据权利要求1所述的搜索目标识别方法,其特征在于,还包括: 将所述搜索关键词形成与搜索引擎相适应的查询语句。3.根据权利要求2所述的搜索目标识别方法,其特征在于,所述查询语句包括以下一种或多种:sql搜索语句和Iucene查询语句。4.根据权利要求1所述的搜索目标识别方法,其特征在于,将所述多个目标关键词中的至少一部分与预设词典模板进行匹配转换包括: 根据多个所述目标关键词中的至少一部分对应的词典及其排列顺序,确定匹配的所述预设词典模板; 将与所述预设词典模板匹配的多个目标关键词组合,以形成所述组合词。5.根据权利要求1所述的搜索目标识别方法,其特征在于,所述预设词典模板包括由范围词典和单位词典形成的范围模板,根据所述多个目标关键词各自对应的词典,将所述多个目标关键词中的至少一部分与预设词典模板进行匹配转换包括:将对应于范围词典和单位词典的多个所述目标关键词与所述范围模板匹配,并按照所述范围模板组合转换形成组合数词。6.根据权利要求1至4任一项所述的搜索目标识别方法,其特征在于,所述词典库包括以下一种或多种:单位词典、范围词典、颜色词典和品牌词典。7.根据权利要求6所述的搜索目标识别方法,其特征在于,所述品牌词典还包括品牌同义词或品牌拼音。8.一种搜索目标识别装置,其特征在于,包括: 分词单元,适于根据已知的词典库对搜索文本进行分词,得到多个目标关键词,其中,所述词典库包括多种词典,所述多个目标关键词与所述多种词典相对应; 转换单元,适于根据所述多个目标关键词各自对应的词典,将所述多个目标关键词中的至少一部分与预设词典模板进行匹配转换,以得到组合词; 组合单元,适于将所述组合词与未匹配转换的目标关键词组成搜索关键词的至少一部分,所述搜索关键词对应所述搜索目标; 其中,所述词典模板为所述词典库中一种或多种词典的组合。9.根据权利要求8所述的搜索目标识别装置,其特征在于,还包括: 查询语句形成单元,适于将所述搜索关键词形成与搜索引擎相适应的查询语句。10.根据权利要求9所述的搜索目标识别装置,其特征在于,所述查询语句包括以下一种或多种:sql搜索语句和Iucene查询语句。11.根据权利要求8所述的搜索目标识别装置,其特征在于,所述转换单元包括: 确定子单元,适于根据多个所述目标关键词中的至少一部分对应的词典及其排列顺序,确定匹配的所述预设词典模板; 转换子单元,适于将与所述预设词典模板匹配的多个目标关键词组合,以形成所述组合词。12.根据权利要求8所述的搜索目标识别装置,其特征在于,所述预设词典模板包括由范围词典和单位词典形成的范围模板,所述转换单元包括: 范围转换子单元,适于将对应于范围词典和单位词典的多个所述目标关键词与所述范围模板匹配,并按照所述范围模板组合转换形成组合数词。13.根据权利要求8至11任一项所述的搜索目标识别装置,其特征在于,所述词典库包括以下一种或多种:单位词典、范围词典、颜色词典和品牌词典。14.根据权利要求13所述的搜索目标识别装置,其特征在于,所述品牌词典还包括品牌同义词或品牌拼音。15.一种终端,其特征在于,包括如权利要求8至14任一项所述的搜索目标识别装置。
【文档编号】G06F17/30GK105930362SQ201610224273
【公开日】2016年9月7日
【申请日】2016年4月12日
【发明人】汤奇峰, 王万宝
【申请人】晶赞广告(上海)有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1