天文文献检索方法和天文文献搜索方法与流程

文档序号:35795338发布日期:2023-10-21 22:22阅读:26来源:国知局
天文文献检索方法和天文文献搜索方法与流程

本技术涉及文献检索,特别是涉及天文文献检索方法和天文文献搜索方法。


背景技术:

1、天文文献中涵盖了天文学研究的文本和数据,具体包括科学论文、书籍、报告、会议论文等形式。随着天文学领域的不断发展,天文文献数量急剧增加,对于实现天文文献快速而准确的检索需求,也随之出现。

2、在相关的文献检索引擎中,通常只支持关键词搜索,通过单一的文字索引引擎实现文献检索,而无法提供多模态的索引引擎,故而无法实现对于天文文献全面准确的检索。

3、针对相关技术中存在对于天文文献的检索的准确度和全面度较低的问题,目前还没有提出有效的解决方案。


技术实现思路

1、在本实施例中提供了一种天文文献检索方法和天文文献搜索方法,以解决相关技术中对于天文文献的检索的准确度和全面度较低的问题。

2、第一个方面,在本实施例中提供了一种天文文献检索方法,包括:

3、获取天文检索数据,对所述天文检索数据进行向量化编码,得到检索向量;

4、基于所述天文检索数据中的文献属性,利用知识库索引引擎从预设的文献库中为所述天文检索数据匹配第一候选文献数据;

5、基于所述检索向量,利用向量相似矩阵结合向量索引引擎,从所述文献库中为所述天文检索数据匹配第二候选文献数据;

6、合并所述第一候选文献数据和所述第二候选文献数据,得到检索结果。

7、在其中的一些实施例中,所述基于所述检索向量,利用向量相似矩阵结合向量索引引擎,从所述文献库中为所述天文检索数据匹配第二候选文献数据,包括:

8、基于所述检索向量与预设的图片索引引擎中的图片向量所构成的图文相似矩阵,从所述图片索引引擎中为所述检索向量匹配图片向量;

9、从所述文献库中查询与匹配到的图片向量相对应的第二候选文献数据;所述第二候选文献数据与所述图片向量之间存在预先建立的对应关系。

10、在其中的一些实施例中,所述对所述天文检索数据进行向量化编码,得到检索向量,包括:

11、利用训练完备的文本编码器,对所述天文检索数据进行向量化编码,得到检索向量。

12、在其中的一些实施例中,所述方法还包括:

13、将用于训练的文本集输入预设的文本编码器;

14、将用于训练的图片集输入预设的图片编码器;

15、为所述文本编码器的输出和所述图片编码器的输出,构建图文相似矩阵;

16、以预设的对称图文相似矩阵为目标,对所述文本编码器和所述图片编码器进行训练,得到训练完备的文本编码器和训练完备的图片编码器;

17、将预设的天文文献中的图片输入所述训练完备的图片编码器,得到图片向量,将所述图片向量存储至所述图片索引引擎中。

18、在其中的一些实施例中,所述基于所述检索向量,利用向量相似矩阵结合向量索引引擎,从所述文献库中为所述天文检索数据匹配第二候选文献数据,还包括:

19、基于所述检索向量与预设的文献索引引擎中的文献向量所构成的向量相似矩阵,从所述文献索引引擎中为所述检索向量匹配文献向量;

20、从所述文献库中查询与匹配到的文献向量相对应的第二候选文献数据;所述第二候选文献数据与所述文献向量之间存在预先建立的对应关系。

21、在其中的一些实施例中,所述方法还包括:

22、对所述天文检索数据进行文本预处理,得到结构化数据;

23、基于所述结构化数据,利用文字索引引擎从预设的文献库中匹配第三候选文献数据;

24、将所述第三候选文献数据合并至所述检索结果。

25、在其中的一些实施例中,所述方法还包括:

26、至少将预先获取的用户的行为特征,以及合并后的所述候选文献数据的文献特征输入预设的排序模型,对所述检索结果与所述天文检索数据的相关度进行打分,并基于打分结果选择所述检索结果中预设数量的候选文献数据作为输出结果。

27、第二个方面,在本实施例中提供了一种天文文献搜索方法,包括:

28、响应于用户在前端页面输入天文关键词,将所述天文关键词识别为天文检索数据;

29、对所述天文检索数据进行向量化编码,得到检索向量;

30、基于所述天文检索数据中的文献属性,利用知识库索引引擎从预设的文献库中为所述天文检索数据匹配第一候选文献数据;

31、基于所述检索向量,利用向量相似矩阵结合向量索引引擎,从所述文献库中为所述天文检索数据匹配第二候选文献数据;

32、合并所述第一候选文献数据和所述第二候选文献数据,得到搜索结果。

33、在其中的一些实施例中,所述方法还包括:

34、对所述天文检索数据进行文本预处理,得到结构化数据;

35、基于所述结构化数据,利用文字索引引擎从预设的文献库中匹配第三候选文献数据;

36、将所述第三候选文献数据合并至所述搜索结果。

37、第三个方面,在本实施例中提供了一种天文文献推荐方法,所述方法包括:

38、响应于前端页面中预设的文献推荐区域的加载,获取用户在预设时间内在前端页面所操作过的文献序列和脱敏后的用户画像数据,将所述文献序列和所述用户画像数据识别为天文检索数据;

39、对所述天文检索数据进行向量化编码,得到检索向量;

40、基于所述天文检索数据中的文献属性,利用知识库索引引擎从预设的文献库中为所述天文检索数据匹配第一候选文献数据;

41、基于所述检索向量,利用向量相似矩阵结合向量索引引擎,从所述文献库中为所述天文检索数据匹配第二候选文献数据;

42、合并所述第一候选文献数据和所述第二候选文献数据,得到推荐结果。

43、在其中的一些实施例中,所述方法还包括:

44、利用图片索引引擎,从所述文献库中为所述天文检索数据匹配第四候选文献数据;

45、将所述第四候选文献数据合并至所述推荐结果。

46、第四个方面,在本实施例中提供了一种电子装置,包括存储器、处理器以及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述第一个方面所述的天文文献检索方法。

47、第五个方面,在本实施例中提供了一种存储介质,其上存储有计算机程序,该程序被处理器执行时实现上述第一个方面所述的天文文献检索方法。

48、与相关技术相比,在本实施例中提供的天文文献检索方法和天文文献搜索方法,获取天文检索数据,对天文检索数据进行向量化编码,得到检索向量;基于天文检索数据中的文献属性,利用知识库索引引擎从预设的文献库中为天文检索数据匹配第一候选文献数据;基于检索向量,利用向量相似矩阵结合向量索引引擎,从文献库中为天文检索数据匹配第二候选文献数据;合并第一候选文献数据和第二候选文献数据,得到检索结果。其能够基于多种索引引擎分别实现天文文献数据的检索,从而提高检索的全面度和准确度。

49、本技术的一个或多个实施例的细节在以下附图和描述中提出,以使本技术的其他特征、目的和优点更加简明易懂。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1