搜索方法和装置制造方法

文档序号:6639688阅读:226来源:国知局
搜索方法和装置制造方法
【专利摘要】本发明提供了一种搜索方法和装置,该方法包括:接收来自用户的搜索词,从所述搜索词中解析出实体名称和实体属性名称;在知识图谱中匹配所述实体名称和/或实体属性名称,查找匹配的数据对,确定所述数据对中所述实体属性名称对应的属性赋值,并将所述属性赋值提供给所述用户。本发明能够直观、精准地将属性赋值作为搜索结果提供给用户,能够为用户提供准确的搜索结果,提高搜索效率,提升用户搜索体验。
【专利说明】搜索方法和装置

【技术领域】
[0001]本发明涉及搜索领域,特别是一种搜索方法和装置。

【背景技术】
[0002]随着信息技术的飞速发展,当今社会进入了信息爆炸时代,人们越来越多地借助网络来寻找自己需要的信息,因此,检索成为人们工作、生活不可或缺的一部分。人们通常使用搜索引擎来进行检索,搜索引擎是指根据一定的策略、运用特定的计算机程序从互联网上搜集信息,在对信息进行组织和处理后,为用户提供检索服务,将与用户检索相关的信息展示给用户的系统。
[0003]相关技术中,当用户输入搜索词进行搜索时,搜索引擎根据搜索词匹配相关的网页,并将该搜索词相关的网页作为搜索结果返回给用户。然而,对于一些特定架构的知识图谱,如实体名称、实体属性名称及相应的属性赋值的架构,目前的搜索方法并不适用。


【发明内容】

[0004]鉴于上述问题,提出了本发明以便提供一种克服上述问题或者至少部分地解决上述问题的搜索方法和装置。
[0005]依据本发明的一个方面,提供了一种搜索方法,包括:接收来自用户的搜索词,从所述搜索词中解析出实体名称和实体属性名称;在知识图谱中匹配所述实体名称和/或实体属性名称,查找匹配的数据对,确定所述数据对中所述实体属性名称对应的属性赋值,并将所述属性赋值提供给所述用户。
[0006]可选地,所述知识图谱中的数据对的架构包括实体名称、实体属性名称以及相应的属性赋值。
[0007]可选地,从所述搜索词中解析出实体名称和实体属性名称,包括:在预置的、包含实体名称和实体属性名称的索引词中匹配所述搜索词;根据匹配的结果,得到所述搜索词对应的实体名称和实体属性名称。
[0008]可选地,从所述搜索词中解析出实体名称和实体属性名称,包括:在预置的、包含实体属性名称的正则规则中匹配所述搜索词;根据匹配的结果,得到所述搜索词对应的实体名称和实体属性名称。
[0009]可选地,从所述搜索词中解析出实体名称和实体属性名称,包括:对所述搜索词作分词处理;在预置的、包含实体名称及实体属性名称的词类别组合中匹配所述搜索词对应的分词;根据匹配的结果,得到所述搜索词对应的实体名称和实体属性名称。
[0010]可选地,若从所述搜索词中解析出多个实体属性名称,在知识图谱中匹配所述实体名称和/或实体属性名称,查找匹配的数据对,确定所述数据对中所述实体属性名称对应的属性赋值,包括:在知识图谱中匹配所述实体名称和/或第一实体属性名称,查找到匹配的数据对;查找所述数据对中所述第一实体属性名称对应的属性赋值,并将所述属性赋值作为新的实体名称与第二实体属性名称结合在所述知识图谱中进行匹配,进而查找到所述新的实体名称的第二实体属性名称对应的属性赋值,直至查找到最后一个实体属性名称对应的属性赋值。
[0011]可选地,从所述搜索词中解析出实体名称和实体属性名称之前,还包括:对所述搜索词进行预处理。
[0012]可选地,所述预处理的类型包括下列至少之一:规范化处理、筛查处理、词义扩展处理。
[0013]依据本发明的另一个方面,还提供了一种搜索装置,包括:
[0014]用户输入接口,适于接收来自用户的搜索词;
[0015]解析器,适于从所述搜索词中解析出实体名称和实体属性名称;
[0016]知识图谱数据库,适于存储知识图谱数据对;
[0017]查找器,适于在知识图谱中匹配所述实体名称和/或实体属性名称,查找匹配的数据对,确定所述数据对中所述实体属性名称对应的属性赋值;
[0018]用户输出接口,适于将所述属性赋值提供给所述用户。
[0019]可选地,所述知识图谱中的数据对的架构包括实体名称、实体属性名称以及相应的属性赋值。
[0020]可选地,所述解析器还适于:在预置的、包含实体名称和实体属性名称的索引词中匹配所述搜索词;根据匹配的结果,得到所述搜索词对应的实体名称和实体属性名称。
[0021]可选地,所述解析器还适于:在预置的、包含实体属性名称的正则规则中匹配所述搜索词;根据匹配的结果,得到所述搜索词对应的实体名称和实体属性名称。
[0022]可选地,所述解析器还适于:对所述搜索词作分词处理;在预置的、包含实体名称及实体属性名称的词类别组合中匹配所述搜索词对应的分词;根据匹配的结果,得到所述搜索词对应的实体名称和实体属性名称。
[0023]可选地,若从所述搜索词中解析出多个实体属性名称,所述查找器还适于:在知识图谱中匹配所述实体名称和/或第一实体属性名称,查找到匹配的数据对;查找所述数据对中所述第一实体属性名称对应的属性赋值,并将所述属性赋值作为新的实体名称与第二实体属性名称结合在所述知识图谱中进行匹配,进而查找到所述新的实体名称的第二实体属性名称对应的属性赋值,直至查找到最后一个实体属性名称对应的属性赋值。
[0024]可选地,所述装置还包括:预处理器,适于在所述解析器从所述搜索词中解析出实体名称和实体属性名称之前,对所述搜索词进行预处理。
[0025]可选地,所述预处理的类型包括下列至少之一:规范化处理、筛查处理、词义扩展处理。
[0026]本发明针对一些特定架构(如实体名称、实体属性名称及相应的属性赋值的架构)的知识图谱,提供了一种搜索方法,即对来自用户的搜索词进行解析,解析出搜索词中包含的实体名称和实体属性名称,随后在知识图谱中匹配实体名称和/或实体属性名称,查找匹配的数据对,进而确定数据对中实体属性名称对应的属性赋值,并将属性赋值提供给用户。由此可知,本发明能够直观、精准地将属性赋值作为搜索结果提供给用户,解决了相关技术中在搜索结果中无法直接地展示这些信息,而需要用户花费较多时间从相关网页中筛选出这部分信息的问题,从而提高搜索效率,提升用户搜索体验。并且,本发明基于结构化数据的结构性特点构建知识图谱,使得知识图谱中数据项的架构包括实体名称、实体属性名称及相应的属性赋值,基于知识图谱结构化数据对外提供搜索服务时,能够为用户提供准确的搜索结果。此外,基于数据对的结构化特点,本发明能够将相关知识图谱信息系统化地提供给用户,使得用户能够获取全面的知识信息。
[0027]上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂,以下特举本发明的【具体实施方式】。
[0028]根据下文结合附图对本发明具体实施例的详细描述,本领域技术人员将会更加明了本发明的上述以及其他目的、优点和特征。

【专利附图】

【附图说明】
[0029]通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本发明的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:
[0030]图1示出了根据本发明一个实施例的搜索方法的流程图;
[0031]图2示出了图1中步骤S102解析搜索词的详细过程的流程图;
[0032]图3示出了根据本发明一个实施例的搜索词为“张三同事的妻子的爸爸”的搜索结果示意图;
[0033]图4A示出了根据本发明一个实施例的搜索词为“来自星星的你的主题曲”的搜索结果示意图;
[0034]图4B示出了根据本发明一个实施例的搜索词为“还珠格格片头曲”的搜索结果示意图;
[0035]图5示出了根据本发明一个实施例的搜索装置的结构示意图;以及
[0036]图6示出了根据本发明另一个实施例的搜索装置的结构示意图。

【具体实施方式】
[0037]下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。
[0038]本发明基于知识图谱提供一种搜索方法和装置。知识图谱旨在描述真实世界中存在的各种实体(如人物、汉字、视频、音乐、影视、小说等)或概念,每个实体或概念用一个全局唯一确定的ID(Identity,身份标识号)来标识。每个属性-值对用来刻画实体的内在特性,而关系用来连接两个实体,刻画它们之间的关联。知识图谱亦可被看作是一张巨大的网状图,网状图中的节点表示实体或概念,而网状图中的边则由属性或关系构成。知识图谱主要就是构建和维护上述的实体和关系,为搜索中的推荐系统、语义理解、问题回答等提供支持。此外,知识图谱并不是一张静态的网状图,它会根据外界的变化而进行自我调整与更新。
[0039]基于上述知识图谱提供搜索知识图谱信息的服务,本发明提供了一种基于知识图谱的搜索方法。图1示出了根据本发明一个实施例的搜索方法的流程图。如图1所示,该方法至少包括以下步骤S102至步骤S106。
[0040]步骤S102、接收来自用户的搜索词,从搜索词中解析出实体名称和实体属性名称。
[0041]步骤S104、在知识图谱中匹配实体名称和/或实体属性名称,查找匹配的数据对。
[0042]步骤S106、确定数据对中实体属性名称对应的属性赋值,并将属性赋值提供给用户。
[0043]本发明针对一些特定架构(如实体名称、实体属性名称及相应的属性赋值的架构)的知识图谱,提供了一种搜索方法,即对来自用户的搜索词进行解析,解析出搜索词中包含的实体名称和实体属性名称,随后在知识图谱中匹配实体名称和/或实体属性名称,查找匹配的数据对,进而确定数据对中实体属性名称对应的属性赋值,并将属性赋值提供给用户。由此可知,本发明能够直观、精准地将属性赋值作为搜索结果提供给用户,解决了相关技术中在搜索结果中无法直接地展示这些信息,而需要用户花费较多时间从相关网页中筛选出这部分信息的问题,从而提高搜索效率,提升用户搜索体验。并且,本发明基于结构化数据的结构性特点构建知识图谱,使得知识图谱中数据项的架构包括实体名称、实体属性名称及相应的属性赋值,基于知识图谱结构化数据对外提供搜索服务时,能够为用户提供准确的搜索结果。此外,基于数据对的结构化特点,本发明能够将相关知识图谱信息系统化地提供给用户,使得用户能够获取全面的知识信息。
[0044]本发明可以从互联网海量数据(例如结构化数据、网页源数据、用户生成数据等)利用数据挖掘方法整理组织,构建知识图谱。知识图谱中的数据对的架构可以包括实体名称、实体属性名称以及相应的属性赋值,即“实体名称-实体属性名称-属性赋值”三元数据对,进而通过特有的查询语言查询知识图谱中相关的知识信息。
[0045]基于知识图谱中数据对的结构特点,在接收到来自用户的搜索词后,分析搜索词,判断用户的查询是否属于知识图谱覆盖的范围,将现有知识图谱覆盖的查询转成知识图谱可以理解的查询语言,提交给知识图谱。基于此,在上文步骤S102中从搜索词中解析出实体名称和实体属性名称可以通过多种方式来实现,如高频索引命中、正则命中、词典命中等等,下面详细介绍这三种方式。
[0046]方式一,高频索引命中的方式。可以在预置的、包含实体名称和实体属性名称的索引词中匹配搜索词,根据匹配的结果,得到搜索词对应的实体名称和实体属性名称。如预先在索引词中配置“张三的身高”,若用户搜索“张三的身高”时,即命中索引词。
[0047]方式二,正则命中的方式。可以在预置的、包含实体属性名称的正则规则中匹配搜索词,根据匹配的结果,得到搜索词对应的实体名称和实体属性名称。如预先配置正则规则“~(.+ ?)的身高”,若用户搜索“李四的身高”时,就匹配上了这条正则规则,即正则命中。
[0048]方式三,词典命中的方式。可以对搜索词作分词处理,进而在预置的、包含实体名称及实体属性名称的词类别组合中匹配搜索词对应的分词,根据匹配的结果,得到搜索词对应的实体名称和实体属性名称。例如,预先配置“张三”为关键词、“身高”为属性词,“的”为停用词,然后再配置词类别的组合规则,比如配置一条组合规则,关键词属性词,若用户搜索“张三的身高”,则先对搜索词“张三的身高”作分词处理,结果为张三/的/身高,抛掉停用词“的”,剩下“张三身高”,匹配上了 “关键词属性词”这条组合规则。
[0049]进一步地,在步骤S102从搜索词中解析出实体名称和实体属性名称之前,本发明还可以对搜索词进行预处理,例如规范化处理(如将繁体变简体、大写变小写等)、筛查处理(如根据预设筛查策略过滤掉明显不是知识类需求的搜索词)、词义扩展处理(如招行扩展为招商银行等),等等。
[0050]本发明还可以结合上述方式一、方式二、方式三以及预处理,对搜索词进行解析,步骤S102中从搜索词中解析出实体名称和实体属性名称的解析过程如图2所示,包括以下步骤S202至步骤S214。
[0051]步骤S202、接收来自用户的搜索词。
[0052]步骤S204、对搜索词进行规范化处理。
[0053]步骤S206、判断搜索词是否在黑名单中,其中,黑名单中存储了明显不是知识类需求的搜索词,若是,则结束;否则,继续执行步骤S208。
[0054]步骤S208、判断是否命中索引,若是,则继续执行步骤S210 ;若否,则继续执行步骤 S212。
[0055]步骤S210、解析出实体名称和实体属性名称,进而可以继续执行上文步骤S104以及步骤S106。
[0056]步骤S212、判断是否命中正则,若是,则继续执行步骤S210 ;若否,则继续执行步骤 S214。
[0057]步骤S214、判断是否命中词典,若是,则继续执行步骤S210 ;若否,则结束。
[0058]进一步地,若步骤S102从搜索词中解析出多个实体属性名称,本发明提供了一种优选的实施步骤S104和步骤S106的方案,在该方案中,在知识图谱中匹配实体名称和/或第一实体属性名称,查找到匹配的数据对,随后查找数据对中第一实体属性名称对应的属性赋值,并将该属性赋值作为新的实体名称与第二实体属性名称结合在知识图谱中进行匹配,进而查找到新的实体名称的第二实体属性名称对应的属性赋值,直至查找到最后一个实体属性名称对应的属性赋值。以实体为人物为例,用户输入的搜索词为“张三的妻子的兄弟”,从该搜索词中解析出人物名称为“张三”以及人物的多重关系属性数据为“妻子”、“兄弟”。此时,在知识图谱中匹配人物名称“张三”和/或人物的第一重关系属性数据“妻子”,查找到相应的人物关系数据对“张三-妻子-李月”,进而确定人物的第一重关系属性数据“妻子”对应的关系属性赋值为“李月”。随后,在知识图谱中匹配新的人物名称“李月”和/或人物的第二重关系属性数据“兄弟”,查找到相应的人物关系数据对“李月-兄弟-李四”,进而确定人物的第二重关系属性数据“兄弟”对应的关系属性赋值为“李四”。最后,将上述人物知识图谱信息提供给用户,展示的效果如图3所示。图3以图框的形式展示人物知识图谱信息,在实际应用中,图框本身可以是其他形状或颜色,也可以隐藏。当然,上述列举仅是示意性的,并不用于限制本发明,在一些情况下,李月的兄弟也可能存在多条人物关系数据对,如“李月-兄弟-李四”、“李月-兄弟-李五”、“李月-兄弟-李六”等等,此时可以针对每条人物关系数据对进行查找对应的关系属性赋值,可参照前文张三的同事为“李月-兄弟-李四”的情况进行匹配和查找,此处不再赘述。
[0059]下面通过具体的优选实施例对本发明实施例提供的搜索方法做进一步说明。在本发明的一个实施例中,以实体为影视为例,用户输入的搜索词为“来自星星的你的主题曲”,从该搜索词中解析出影视名称为“来自星星的你”以及影视歌曲的类型“主题曲”,在知识图谱中查找到相应的影视歌曲数据对“来自星星的你-主题曲-爱你的宿命”,进而确定影视歌曲的类型对应的歌曲名称为“爱你的宿命”。随后,在知识图谱中匹配歌曲名称“爱你的宿命”,查找相应的歌曲数据结构对“爱你的宿命-歌手-电视原声”、“爱你的宿命-播放时长-5分6秒”、“爱你的宿命-播放资源地址-http://music, s0.com”等。最后,将上述歌曲信息作为搜索结果提供给用户,具体的搜索结果如图4A所示,“来自星星的你主题曲”,有两首结果,用户点击播放按钮后,会跳转到360音乐盒里面播放。图4A以图框的形式展示歌曲信息,在实际应用中,图框本身可以是其他形状或颜色,也可以隐藏。此外,本发明还提供了与搜索词“来自星星的你的主题曲”相关的信息,如相关推荐词“来自星星的你的插曲”、“来自星星的片尾曲”的文字链接,当用户点击该文字链接时,可以将“来自星星的你的插曲”或“来自星星的片尾曲”作为搜索词直接进行搜索。
[0060]在本发明的另一个实施例中,用户输入的搜索词为“还珠格格片头曲”,从该搜索词中解析出影视名称为“还珠格格”以及影视歌曲的类型“片头曲”,在知识图谱中查找到相应的影视歌曲数据对“还珠格格-片头曲-奔向你”,进而确定影视歌曲的类型对应的歌曲名称为“奔向你”。随后,在知识图谱中匹配歌曲名称“奔向你”,查找相应的歌曲数据结构对“奔向你-歌手-电视原声”、“奔向你-播放时长-6分8秒”、“奔向你-播放资源地址-http://music, s0.com”等。最后,将上述歌曲信息作为搜索结果提供给用户,具体的搜索结果如图4B所示,“还珠格格片头曲”,只有一首结果,用户点击播放按钮后,可以在当前页面播放。
[0061]基于同一发明构思,本发明实施例还提供了一种搜索装置,以实现上述搜索方法。
[0062]图5示出了根据本发明一个实施例的搜索装置的结构示意图。参见图5,该装置至少可以包括:用户输入接口 510、解析器520、知识图谱数据库530、查找器540以及用户输出接口 550。
[0063]现介绍本发明实施例的搜索装置的各组成或器件的功能以及各部分间的连接关系:
[0064]用户输入接口 510,适于接收来自用户的搜索词;
[0065]解析器520,与用户输入接口 510相耦合,适于从搜索词中解析出实体名称和实体属性名称;
[0066]知识图谱数据库530,适于存储知识图谱数据对;
[0067]查找器540,与解析器520以及知识图谱数据库530相耦合,适于在知识图谱中匹配实体名称和/或实体属性名称,查找匹配的数据对,确定数据对中实体属性名称对应的属性赋值;
[0068]用户输出接口 550,与查找器540相耦合,适于将属性赋值提供给用户。
[0069]在一个实施例中,知识图谱中的数据对的架构包括实体名称、实体属性名称以及相应的属性赋值。
[0070]在一个实施例中,上述解析器520还适于:在预置的、包含实体名称和实体属性名称的索引词中匹配搜索词;根据匹配的结果,得到搜索词对应的实体名称和实体属性名称。
[0071]在一个实施例中,上述解析器520还适于:在预置的、包含实体属性名称的正则规则中匹配搜索词;根据匹配的结果,得到搜索词对应的实体名称和实体属性名称。
[0072]在一个实施例中,上述解析器520还适于:对搜索词作分词处理;在预置的、包含实体名称及实体属性名称的词类别组合中匹配搜索词对应的分词;根据匹配的结果,得到搜索词对应的实体名称和实体属性名称。
[0073]在一个实施例中,若从搜索词中解析出多个实体属性名称,上述查找器540还适于:在知识图谱中匹配实体名称和/或第一实体属性名称,查找到匹配的数据对;查找数据对中第一实体属性名称对应的属性赋值,并将属性赋值作为新的实体名称与第二实体属性名称结合在知识图谱中进行匹配,进而查找到新的实体名称的第二实体属性名称对应的属性赋值,直至查找到最后一个实体属性名称对应的属性赋值。
[0074]在一个实施例中,图6示出了根据本发明另一个实施例的搜索装置的结构示意图,该装置还包括:预处理器610,与用户输入接口 510相耦合,适于在解析器520从搜索词中解析出实体名称和实体属性名称之前,对搜索词进行预处理。
[0075]在一个实施例中,预处理的类型包括下列至少之一:规范化处理、筛查处理、词义扩展处理。
[0076]根据上述任意一个优选实施例或多个优选实施例的组合,本发明实施例能够达到如下有益效果:
[0077]本发明针对一些特定架构(如实体名称、实体属性名称及相应的属性赋值的架构)的知识图谱,提供了一种搜索方法,即对来自用户的搜索词进行解析,解析出搜索词中包含的实体名称和实体属性名称,随后在知识图谱中匹配实体名称和/或实体属性名称,查找匹配的数据对,进而确定数据对中实体属性名称对应的属性赋值,并将属性赋值提供给用户。由此可知,本发明能够直观、精准地将属性赋值作为搜索结果提供给用户,解决了相关技术中在搜索结果中无法直接地展示这些信息,而需要用户花费较多时间从相关网页中筛选出这部分信息的问题,从而提高搜索效率,提升用户搜索体验。并且,本发明基于结构化数据的结构性特点构建知识图谱,使得知识图谱中数据项的架构包括实体名称、实体属性名称及相应的属性赋值,基于知识图谱结构化数据对外提供搜索服务时,能够为用户提供准确的搜索结果。此外,基于数据对的结构化特点,本发明能够将相关知识图谱信息系统化地提供给用户,使得用户能够获取全面的知识信息。
[0078]在此处所提供的说明书中,说明了大量具体细节。然而,能够理解,本发明的实施例可以在没有这些具体细节的情况下实践。在一些实例中,并未详细示出公知的方法、结构和技术,以便不模糊对本说明书的理解。
[0079]类似地,应当理解,为了精简本公开并帮助理解各个发明方面中的一个或多个,在上面对本发明的示例性实施例的描述中,本发明的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。然而,并不应将该公开的方法解释成反映如下意图:即所要求保护的本发明要求比在每个权利要求中所明确记载的特征更多的特征。更确切地说,如下面的权利要求书所反映的那样,发明方面在于少于前面公开的单个实施例的所有特征。因此,遵循【具体实施方式】的权利要求书由此明确地并入该【具体实施方式】,其中每个权利要求本身都作为本发明的单独实施例。
[0080]本领域那些技术人员可以理解,可以对实施例中的设备中的模块进行自适应性地改变并且把它们设置在与该实施例不同的一个或多个设备中。可以把实施例中的模块或单元或组件组合成一个模块或单元或组件,以及此外可以把它们分成多个子模块或子单元或子组件。除了这样的特征和/或过程或者单元中的至少一些是相互排斥之外,可以采用任何组合对本说明书(包括伴随的权利要求、摘要和附图)中公开的所有特征以及如此公开的任何方法或者设备的所有过程或单元进行组合。除非另外明确陈述,本说明书(包括伴随的权利要求、摘要和附图)中公开的每个特征可以由提供相同、等同或相似目的的替代特征来代替。
[0081]此外,本领域的技术人员能够理解,尽管在此所述的一些实施例包括其它实施例中所包括的某些特征而不是其它特征,但是不同实施例的特征的组合意味着处于本发明的范围之内并且形成不同的实施例。例如,在权利要求书中,所要求保护的实施例的任意之一都可以以任意的组合方式来使用。
[0082]本发明的各个部件实施例可以以硬件实现,或者以在一个或者多个处理器上运行的软件模块实现,或者以它们的组合实现。本领域的技术人员应当理解,可以在实践中使用微处理器或者数字信号处理器(DSP)来实现根据本发明实施例的搜索装置中的一些或者全部部件的一些或者全部功能。本发明还可以实现为用于执行这里所描述的方法的一部分或者全部的设备或者装置程序(例如,计算机程序和计算机程序产品)。这样的实现本发明的程序可以存储在计算机可读介质上,或者可以具有一个或者多个信号的形式。这样的信号可以从因特网网站上下载得到,或者在载体信号上提供,或者以任何其他形式提供。
[0083]应该注意的是上述实施例对本发明进行说明而不是对本发明进行限制,并且本领域技术人员在不脱离所附权利要求的范围的情况下可设计出替换实施例。在权利要求中,不应将位于括号之间的任何参考符号构造成对权利要求的限制。单词“包含”不排除存在未列在权利要求中的元件或步骤。位于元件之前的单词“一”或“一个”不排除存在多个这样的元件。本发明可以借助于包括有若干不同元件的硬件以及借助于适当编程的计算机来实现。在列举了若干装置的单元权利要求中,这些装置中的若干个可以是通过同一个硬件项来具体体现。单词第一、第二、以及第三等的使用不表示任何顺序。可将这些单词解释为名称。
[0084]至此,本领域技术人员应认识到,虽然本文已详尽示出和描述了本发明的多个示例性实施例,但是,在不脱离本发明精神和范围的情况下,仍可根据本发明公开的内容直接确定或推导出符合本发明原理的许多其他变型或修改。因此,本发明的范围应被理解和认定为覆盖了所有这些其他变型或修改。
[0085]本发明还公开了:
[0086]Al、一种搜索方法,包括:
[0087]接收来自用户的搜索词,从所述搜索词中解析出实体名称和实体属性名称;
[0088]在知识图谱中匹配所述实体名称和/或实体属性名称,查找匹配的数据对;
[0089]确定所述数据对中所述实体属性名称对应的属性赋值,并将所述属性赋值提供给所述用户。
[0090]A2、根据Al所述的方法,其中,其中,所述知识图谱中的数据对的架构包括实体名称、实体属性名称以及相应的属性赋值。
[0091]A3、根据Al或A2所述的方法,其中,从所述搜索词中解析出实体名称和实体属性名称,包括:
[0092]在预置的、包含实体名称和实体属性名称的索引词中匹配所述搜索词;
[0093]根据匹配的结果,得到所述搜索词对应的实体名称和实体属性名称。
[0094]A4、根据A1-A3任一项所述的方法,其中,从所述搜索词中解析出实体名称和实体属性名称,包括:
[0095]在预置的、包含实体属性名称的正则规则中匹配所述搜索词;
[0096]根据匹配的结果,得到所述搜索词对应的实体名称和实体属性名称。
[0097]A5、根据A1-A4任一项所述的方法,其中,从所述搜索词中解析出实体名称和实体属性名称,包括:
[0098]对所述搜索词作分词处理;
[0099]在预置的、包含实体名称及实体属性名称的词类别组合中匹配所述搜索词对应的分词;
[0100]根据匹配的结果,得到所述搜索词对应的实体名称和实体属性名称。
[0101]A6、根据A1-A5任一项所述的方法,其中,若从所述搜索词中解析出多个实体属性名称,在知识图谱中匹配所述实体名称和/或实体属性名称,查找匹配的数据对,确定所述数据对中所述实体属性名称对应的属性赋值,包括:
[0102]在知识图谱中匹配所述实体名称和/或第一实体属性名称,查找到匹配的数据对;
[0103]查找所述数据对中所述第一实体属性名称对应的属性赋值,并将所述属性赋值作为新的实体名称与第二实体属性名称结合在所述知识图谱中进行匹配,进而查找到所述新的实体名称的第二实体属性名称对应的属性赋值,直至查找到最后一个实体属性名称对应的属性赋值。
[0104]A7、根据A1-A6任一项所述的方法,其中,从所述搜索词中解析出实体名称和实体属性名称之前,还包括:对所述搜索词进行预处理。
[0105]AS、根据A1-A7任一项所述的方法,其中,所述预处理的类型包括下列至少之一:规范化处理、筛查处理、词义扩展处理。
[0106]B9、一种搜索装置,包括:
[0107]用户输入接口,适于接收来自用户的搜索词;
[0108]解析器,适于从所述搜索词中解析出实体名称和实体属性名称;
[0109]知识图谱数据库,适于存储知识图谱数据对;
[0110]查找器,适于在知识图谱中匹配所述实体名称和/或实体属性名称,查找匹配的数据对,确定所述数据对中所述实体属性名称对应的属性赋值;
[0111]用户输出接口,适于将所述属性赋值提供给所述用户。
[0112]B10、根据B9所述的装置,其中,所述知识图谱中的数据对的架构包括实体名称、实体属性名称以及相应的属性赋值。
[0113]B11、根据B9或BlO所述的装置,其中,所述解析器还适于:
[0114]在预置的、包含实体名称和实体属性名称的索引词中匹配所述搜索词;
[0115]根据匹配的结果,得到所述搜索词对应的实体名称和实体属性名称。
[0116]B12、根据B9-B11任一项所述的装置,其中,所述解析器还适于:
[0117]在预置的、包含实体属性名称的正则规则中匹配所述搜索词;
[0118]根据匹配的结果,得到所述搜索词对应的实体名称和实体属性名称。
[0119]B13、根据B9-B12任一项所述的装置,其中,所述解析器还适于:
[0120]对所述搜索词作分词处理;
[0121]在预置的、包含实体名称及实体属性名称的词类别组合中匹配所述搜索词对应的分词;
[0122]根据匹配的结果,得到所述搜索词对应的实体名称和实体属性名称。
[0123]B14、根据B9-B13任一项所述的装置,其中,若从所述搜索词中解析出多个实体属性名称,所述查找器还适于:
[0124]在知识图谱中匹配所述实体名称和/或第一实体属性名称,查找到匹配的数据对;
[0125]查找所述数据对中所述第一实体属性名称对应的属性赋值,并将所述属性赋值作为新的实体名称与第二实体属性名称结合在所述知识图谱中进行匹配,进而查找到所述新的实体名称的第二实体属性名称对应的属性赋值,直至查找到最后一个实体属性名称对应的属性赋值。
[0126]B15、根据B9-B14任一项所述的装置,其中,还包括:
[0127]预处理器,适于在所述解析器从所述搜索词中解析出实体名称和实体属性名称之前,对所述搜索词进行预处理。
[0128]B16、根据B9-B15任一项所述的装置,其中,所述预处理的类型包括下列至少之一:规范化处理、筛查处理、词义扩展处理。
【权利要求】
1.一种搜索方法,包括: 接收来自用户的搜索词,从所述搜索词中解析出实体名称和实体属性名称; 在知识图谱中匹配所述实体名称和/或实体属性名称,查找匹配的数据对; 确定所述数据对中所述实体属性名称对应的属性赋值,并将所述属性赋值提供给所述用户。
2.根据权利要求1所述的方法,其中,其中,所述知识图谱中的数据对的架构包括实体名称、实体属性名称以及相应的属性赋值。
3.根据权利要求1或2所述的方法,其中,从所述搜索词中解析出实体名称和实体属性名称,包括: 在预置的、包含实体名称和实体属性名称的索引词中匹配所述搜索词; 根据匹配的结果,得到所述搜索词对应的实体名称和实体属性名称。
4.根据权利要求1-3任一项所述的方法,其中,从所述搜索词中解析出实体名称和实体属性名称,包括: 在预置的、包含实体属性名称的正则规则中匹配所述搜索词; 根据匹配的结果,得到所述搜索词对应的实体名称和实体属性名称。
5.根据权利要求1-4任一项所述的方法,其中,从所述搜索词中解析出实体名称和实体属性名称,包括: 对所述搜索词作分词处理; 在预置的、包含实体名称及实体属性名称的词类别组合中匹配所述搜索词对应的分词; 根据匹配的结果,得到所述搜索词对应的实体名称和实体属性名称。
6.根据权利要求1-5任一项所述的方法,其中,若从所述搜索词中解析出多个实体属性名称,在知识图谱中匹配所述实体名称和/或实体属性名称,查找匹配的数据对,确定所述数据对中所述实体属性名称对应的属性赋值,包括: 在知识图谱中匹配所述实体名称和/或第一实体属性名称,查找到匹配的数据对; 查找所述数据对中所述第一实体属性名称对应的属性赋值,并将所述属性赋值作为新的实体名称与第二实体属性名称结合在所述知识图谱中进行匹配,进而查找到所述新的实体名称的第二实体属性名称对应的属性赋值,直至查找到最后一个实体属性名称对应的属性赋值。
7.根据权利要求1-6任一项所述的方法,其中,从所述搜索词中解析出实体名称和实体属性名称之前,还包括:对所述搜索词进行预处理。
8.根据权利要求1-7任一项所述的方法,其中,所述预处理的类型包括下列至少之一:规范化处理、筛查处理、词义扩展处理。
9.一种搜索装置,包括: 用户输入接口,适于接收来自用户的搜索词; 解析器,适于从所述搜索词中解析出实体名称和实体属性名称; 知识图谱数据库,适于存储知识图谱数据对; 查找器,适于在知识图谱中匹配所述实体名称和/或实体属性名称,查找匹配的数据对,确定所述数据对中所述实体属性名称对应的属性赋值; 用户输出接口,适于将所述属性赋值提供给所述用户。
10.根据权利要求9所述的装置,其中,所述知识图谱中的数据对的架构包括实体名称、实体属性名称以及相应的属性赋值。
【文档编号】G06F17/30GK104462505SQ201410806173
【公开日】2015年3月25日 申请日期:2014年12月19日 优先权日:2014年12月19日
【发明者】晋松, 王志龙, 吴凯 申请人:北京奇虎科技有限公司, 奇智软件(北京)有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1