基于数据库ES查询同义词的方法及系统与流程

文档序号:40772017发布日期:2025-01-24 21:09阅读:2来源:国知局
基于数据库ES查询同义词的方法及系统与流程

本发明涉及数据库,具体地说是基于数据库es查询同义词的方法及系统。


背景技术:

1、随着信息技术的飞速发展,搜索引擎已成为用户获取网络信息的重要工具。然而,由于语言的多样性和复杂性,用户在查询时可能使用不同的词汇表达相同或相似的意图,如同义词、近义词、缩写词等。传统的搜索引擎通常只能精确匹配用户输入的查询词,无法有效处理同义词查询,导致查询结果可能不够准确和全面,影响用户体验。

2、如何在搜索引擎中实现高效的同义词查询、提高查询结果的准确性和用户体验,是需要解决的技术问题。


技术实现思路

1、本发明的技术任务是针对以上不足,提供基于数据库es查询同义词的方法及系统,来解决如何在搜索引擎中实现高效的同义词查询、提高查询结果的准确性和用户体验的技术问题。

2、第一方面,本发明一种基于数据库es查询同义词的方法,包括如下步骤:

3、同义词数据库构建:构建一个包括同义词之间映射关系以及关联权重的同义词数据库,关联权重用于体现不同同义词之间的关联性;

4、同义词查询:用户通过搜索引擎界面输入查询词,以用户输入的查询词作为原始查询词,解析原始查询词得到关键字,基于关键字从同义词数据库中查找同义词,并基于关联权重对查找到的同义词进行排序、形成同义词列表;

5、es查询:以原始查询词和对应的同义词列表为查询条件,通过elasticsearch搜索引擎进行查询,基于查询条件、通过elasticsearch对索引中的文档进行匹配和排序,返回符合查询条件的相关文档作为查询结果;

6、结果展示:对elasticsearch返回的相关文档进行展示。

7、作为优选,对于elasticsearch返回的相关文档,基于相关文档与原始查询词的相关度进行排序形成文档列表,并对文档列表进行展示。

8、作为优选,关联权重为基于同义词之间的语义相似度和使用频率作为因素计算得到的。

9、作为优选,对elasticsearch返回的相关文档进行展示后,基于用户反馈和查询结果的质量对同义词数据库进行更新优化。

10、第二方面,本发明一种基于数据库es查询同义词的系统,用于通过如第一方面任一项所述的一种基于数据库es查询同义词的方法实现同义词查询,所述系统包括同义词数据库构建模块、同义词查询模块、es查询模块以及结果展示模块;

11、同义词数据库构建模块用于执行如下:构建一个包括同义词之间映射关系以及关联权重的同义词数据库,关联权重用于体现不同同义词之间的关联性;

12、同义词查询模块用于执行如下:用户通过搜索引擎界面输入查询词,以用户输入的查询词作为原始查询词,解析原始查询词得到关键字,基于关键字从同义词数据库中查找同义词,并基于关联权重对查找到的同义词进行排序、形成同义词列表;

13、es查询模块用于执行如下:以原始查询词和对应的同义词列表为查询条件,通过elasticsearch搜索引擎进行查询,基于查询条件、通过elasticsearch对索引中的文档进行匹配和排序,返回符合查询条件的相关文档作为查询结果;

14、结果展示模块用于执行如下:对elasticsearch返回的相关文档进行展示。

15、作为优选,对于elasticsearch返回的相关文档,结果展示模块用于基于相关文档与原始查询词的相关度进行排序形成文档列表,并对文档列表进行展示。

16、作为优选,关联权重为基于同义词之间的语义相似度和使用频率作为因素计算得到的。

17、作为优选,对elasticsearch返回的相关文档进行展示后,同义词数据库构建模块用于基于用户反馈和查询结果的质量对同义词数据库进行更新优化。

18、本发明的基于数据库es查询同义词的方法及系统具有以下优点:

19、1、提高查询准确性:通过同义词数据库对查询词进行同义词扩展,能够覆盖更多相关文档,提高查询结果的准确性;

20、2、改善用户体验:展示包含同义词的相关文档,能够为用户提供更丰富、更全面的信息,提升用户体验;

21、3、降低维护成本:同义词数据库可动态更新,减少手动维护同义词词典的工作量,降低维护成本;

22、4、扩展性强:可与其他搜索引擎和数据库进行集成,具有良好的扩展性和通用性。



技术特征:

1.一种基于数据库es查询同义词的方法,其特征在于,包括如下步骤:

2.根据权利要求1所述的基于数据库es查询同义词的方法,其特征在于,对于elasticsearch返回的相关文档,基于相关文档与原始查询词的相关度进行排序形成文档列表,并对文档列表进行展示。

3.根据权利要求1所述的基于数据库es查询同义词的方法,其特征在于,关联权重为基于同义词之间的语义相似度和使用频率作为因素计算得到的。

4.根据权利要求1所述的基于数据库es查询同义词的方法,其特征在于,对elasticsearch返回的相关文档进行展示后,基于用户反馈和查询结果的质量对同义词数据库进行更新优化。

5.一种基于数据库es查询同义词的系统,其特征在于,用于通过如权利要求1-4任一项所述的一种基于数据库es查询同义词的方法实现同义词查询,所述系统包括同义词数据库构建模块、同义词查询模块、es查询模块以及结果展示模块;

6.根据权利要求5所述的一种基于数据库es查询同义词的系统,其特征在于,对于elasticsearch返回的相关文档,结果展示模块用于基于相关文档与原始查询词的相关度进行排序形成文档列表,并对文档列表进行展示。

7.根据权利要求5所述的一种基于数据库es查询同义词的系统,其特征在于,关联权重为基于同义词之间的语义相似度和使用频率作为因素计算得到的。

8.根据权利要求5所述的一种基于数据库es查询同义词的系统,其特征在于,对elasticsearch返回的相关文档进行展示后,同义词数据库构建模块用于基于用户反馈和查询结果的质量对同义词数据库进行更新优化。


技术总结
本发明公开了基于数据库ES查询同义词的方法及系统,属于数据库技术领域,要解决的技术问题为如何在搜索引擎中实现高效的同义词查询、提高查询结果的准确性和用户体验。包括如下步骤:构建一个包括同义词之间映射关系以及关联权重的同义词数据库;以用户输入的查询词作为原始查询词,解析原始查询词得到关键字,基于关键字从同义词数据库中查找同义词,并基于关联权重对查找到的同义词进行排序、形成同义词列表;以原始查询词和对应的同义词列表为查询条件,通过Elasticsearch搜索引擎进行查询,基于查询条件、对索引中的文档进行匹配和排序,返回相关文档;对相关文档进行展示。

技术研发人员:梁志勇,李俊,单震
受保护的技术使用者:浪潮卓数大数据产业发展有限公司
技术研发日:
技术公布日:2025/1/23
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1