一种智能查询方法及系统的制作方法

文档序号:9432595阅读:415来源:国知局
一种智能查询方法及系统的制作方法
【技术领域】
[0001]本发明涉及IT技术领域,特别涉及一种智能查询方法及系统。
【背景技术】
[0002]经济建设中的服务业的比重在提高,高效、高质、智能化的服务备受期待,信息搜索即是其中之一。
[0003]在知识大爆炸时代,知识数量巨大、专业性强,这就要求搜索智能化,能够快速找到精准信息。
[0004]知识类型众多,特征各异,需要快速的定制搜索能力,高效的将搜索能力接入目标系统。
[0005]目前市面上搜索需求巨大,搜索引擎产品数量众多,但真正能满足特定领域知识的产品则很少,这就为适用特定领域知识的企业级智能搜索引擎产品带来机会。

【发明内容】

[0006]本发明所要解决的技术问题是提供一种能够快速、高效、准确的智能查询方法及系统。
[0007]本发明解决上述技术问题的技术方案如下:一种智能查询方法,包括以下步骤:
[0008]从数据源中提取数据信息,并根据提取的数据信息创建索引库;
[0009]获取用户的查询请求;
[0010]根据查询请求搜索所述索引库,并返回查询结果。
[0011]本发明的有益效果是:本发明具有高性能、高精度的特点,基于多数据源、多维度的数据查询,易于集成,快速接入已有系统,资源要求少,支持负载均衡,可伸缩性高,支持大数据,自定义数据来源。标准的xml数据接口,快速导入结构化与非结构化数据。灵活的插件体系,方便定制搜索策略;根据数据与需求特点,搜索算法可进行热插拔式配置,达到良好精度。
[0012]在上述技术方案的基础上,本发明还可以做如下改进。
[0013]进一步,所述方法还包括:
[0014]创建查询分析表,所述查询分析表用于记录用户每一次查询请求及获取的查询结果O
[0015]进一步,所述方法还包括:
[0016]定义用于传递查询结果的xml数据接口。
[0017]进一步,所述返回查询结果包括:
[0018]通过xml数据接口返回查询结果,所述查询结果包括结构化数据和非结构化数据。
[0019]进一步,一种智能查询系统,包括:
[0020]提取创建模块,用于从数据源中提取数据信息,并根据提取的数据信息创建索引库;
[0021]获取模块,用于获取用户的查询请求;
[0022]搜索返回模块,用于根据查询请求搜索所述索引库,并返回查询结果。
[0023]进一步,所述系统还包括:
[0024]创建模块,用于创建查询分析表,所述查询分析表用于记录用户每一次查询请求及获取的查询结果。
[0025]进一步,所述系统还包括:
[0026]定义模块,用于定义用于传递查询结果的xml数据接口。
[0027]进一步,所述搜索返回模块,用于通过xml数据接口返回查询结果,所述查询结果包括结构化数据和非结构化数据。
【附图说明】
[0028]图1为本发明方法流程图;
[0029]图2为本发明系统结构图。
[0030]附图中,各标号所代表的部件列表如下:
[0031 ]1、提取创建模块,2、获取模块,3、搜索返回模块,4、创建模块,5、定义模块。
【具体实施方式】
[0032]以下结合附图对本发明的原理和特征进行描述,所举实例只用于解释本发明,并非用于限定本发明的范围。
[0033]实施例1
[0034]如图1所示,一种智能查询方法,包括以下步骤:
[0035]从数据源中提取数据信息,并根据提取的数据信息创建索引库;
[0036]获取用户的查询请求;
[0037]根据查询请求搜索所述索引库,并返回查询结果。
[0038]所述方法还包括:
[0039]创建查询分析表,所述查询分析表用于记录用户每一次查询请求及获取的查询结果O
[0040]所述方法还包括:
[0041]定义用于传递查询结果的xml数据接口。
[0042]所述返回查询结果包括:
[0043]通过xml数据接口返回查询结果,所述查询结果包括结构化数据和非结构化数据。
[0044]如图2所示,一种智能查询系统,包括:
[0045]提取创建模块1,用于从数据源中提取数据信息,并根据提取的数据信息创建索引库;
[0046]获取模块2,用于获取用户的查询请求;
[0047]搜索返回模块3,用于根据查询请求搜索所述索引库,并返回查询结果。
[0048]所述系统还包括:
[0049]创建模块4,用于创建查询分析表,所述查询分析表用于记录用户每一次查询请求及获取的查询结果。
[0050]所述系统还包括:
[0051]定义模块5,用于定义用于传递查询结果的xml数据接口。
[0052]搜索返回模块3,用于通过xml数据接口返回查询结果,所述查询结果包括结构化数据和非结构化数据。
[0053]在具体实施中,本发明的企业级智能搜索引擎SAAS层可接入web系统、及时消息、智能短信应答、手机客户端APP。
[0054]企业级智能搜索引擎在服务层提供数据解析、数据导入、智能分词、搜索策略、高亮显示、智能提示、拼音搜索等服务;计算机通过语言分析、语义分析去理解自然语言NLP具体含义。
[0055]支持多数据源配置、索引配置、词典管理、日志分析、语义模板、行为分析等能力。
[0056]1、定义数据源、索引库字段、每个字段分词算法;
[0057]1.1数据源头支持主流数据库、常用文档、爬取的网页,通过配置的方式导入知识数据,便捷快速。
[0058]1.2分析数据的元属性,挖掘出知识的内在结构,构造知识模型。
[0059]1.3通过自然语言处理的分词手段对知识模型进行加工,处理成可以被快速搜索的数据结构。
[0060]2、配置业务词库、同义词;
[0061]2.1业务领域出现新的词汇,需要以一种可配置管理的手段加入进来,以反映新的业务概念。
[0062]2.2以同义词库的方式建立不同表达方式其实是同一种含义,以满足中文多样表达的现状。
[0063]2.3此阶段的工作主要是为分词组件服务。
[0064]3、依据上述配置,创建索引引擎将按配置要求生成索引库;
[0065]3.1根据I阶段加工好的知识数据,建立倒排索引数据结构,形成词项与知识的映射关系。
[0066]3.2索引数据结构包括词频、文档频率、文档长度、词项的权重、词项的位置等。
[0067]4、定义搜索策略、高亮策略、排行策略;
[0068]4.1管理后台通过插件的方式配置搜索策略,不同的业务数据有不同的搜索要求,通过插件的方式可以灵活定制,高扩展。
[0069]4.2管理后台通过插件的方式配置尚壳策略,尚壳功能灵活,可以尚壳关键词,也可以高亮所有的词语。
[0070]4.3管理后台通过插件的方式配置排序策略,可以相关度排序,时间排序,或者点击率排序。
[0071 ] 5、输入搜索内容,支持拼音搜索、业务词搜索、同义词搜索、语义理解搜索;
[0072]6、支持标签搜索、关联匹配、自定义排序、搜索置顶;
[0073]7、记录搜索日志及点击日志;
[0074]7.1搜索日志包括搜索时间、搜索词、搜索结果数、响应时间、区域、渠道、分页、排序、用户、客户浏览器等。
[0075]7.2点击日志包括点击时间、搜索词、响应时间、知识、区域、渠道、分页、用户、客户浏览器等。
[0076]8、提供搜索分析;
[0077]8.1分析挖掘搜索行为,生成搜索报表。
[0078]8.1.1热词报表:分析用户关注的热点。
[0079]8.1.2搜索无结果报表:知识是否缺失,或者系统存在缺陷,反馈给知识运营部门和技术支持方。
[0080]8.1.3渠道统计报表:分析不同渠道的导入流量,反馈给营销策划部门。
[0081]8.1.4区域统计报表:不同区域的搜索统计,反馈给营销策划部门。
[0082]8.2通过点击知识的行为,建立搜索词和知识之间的关联关系,并以此为依据调整知识在结果排行中的权重,以此反映用户的倾向。
[0083]9、语义模板。
[0084]9.1标注细粒度的知识模板特征。
[0085]9.2根据知识模板的特征,学习出知识模板关联的语义模板
[0086]9.3导入知识语料库,训练出知识和语义模板之间的关联。
[0087]以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
【主权项】
1.一种智能查询方法,其特征在于,包括以下步骤: 从数据源中提取数据信息,并根据提取的数据信息创建索引库; 获取用户的查询请求; 根据查询请求搜索所述索引库,并返回查询结果。2.根据权利要求1所述的智能查询方法,其特征在于,所述方法还包括: 创建查询分析表,所述查询分析表用于记录用户每一次查询请求及获取的查询结果。3.根据权利要求1所述的智能查询方法,其特征在于,所述方法还包括: 定义用于传递查询结果的xml数据接口。4.根据权利要求3所述的智能查询方法,其特征在于,所述返回查询结果包括: 通过xml数据接口返回查询结果,所述查询结果包括结构化数据和非结构化数据。5.一种智能查询系统,其特征在于,包括: 提取创建模块,用于从数据源中提取数据信息,并根据提取的数据信息创建索引库; 获取模块,用于获取用户的查询请求; 搜索返回模块,用于根据查询请求搜索所述索引库,并返回查询结果。6.根据权利要求5所述的智能查询系统,其特征在于,所述系统还包括: 创建模块,用于创建查询分析表,所述查询分析表用于记录用户每一次查询请求及获取的查询结果。7.根据权利要求5所述的智能查询系统,其特征在于,所述系统还包括: 定义模块,用于定义用于传递查询结果的xml数据接口。8.根据权利要求7所述的智能查询系统,其特征在于,所述搜索返回模块,用于通过xml数据接口返回查询结果,所述查询结果包括结构化数据和非结构化数据。
【专利摘要】本发明涉及一种智能查询方法及系统,包括以下步骤:从数据源中提取数据信息,并根据提取的数据信息创建索引库;获取用户的查询请求;根据查询请求搜索所述索引库,并返回查询结果。本发明具有高性能、高精度的特点,基于多数据源、多维度的数据查询,易于集成,快速接入已有系统,资源要求少,支持负载均衡,可伸缩性高,支持大数据,自定义数据来源。标准的xml数据接口,快速导入结构化与非结构化数据。灵活的插件体系,方便定制搜索策略;根据数据与需求特点,搜索算法可进行热插拔式配置,达到良好精度。
【IPC分类】G06F17/30
【公开号】CN105183774
【申请号】CN201510485017
【发明人】吴俊柏
【申请人】北京思特奇信息技术股份有限公司
【公开日】2015年12月23日
【申请日】2015年8月7日
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1