自学习的知识库管理方法、装置、终端设备及存储介质与流程

文档序号:19787050发布日期:2020-01-24 13:43阅读:来源:国知局

技术特征:

1.一种自学习的知识库管理方法,其特征在于:包括以下步骤;

接收文档查询指令,从文档查询指令中提取待查询关键词以及待查询关键词对应的文档类别;

建立tf-idf算法,根据待查询关键词对应的文档类别,从网络获取相关文档类别的文档对应的关键词,根据tf-idf算法计算待查询关键词的tf-idf值与网络关键词的tf-idf值,根据待查询关键词的tf-idf值与网络关键词的tf-idf值,将待查询关键词的tf-idf值与网络关键词的tf-idf值进行比较,根据比较结果,确定待添加的网络关键词对应的文档;

获取待添加网络文档对应的文件链接以及文件,将待添加网络文档对应的文件链接以及文件存储至知识库中,为该待添加网络文档生成唯一编号,将该唯一编号与待添加网络文档对应的文件链接以及文件进行关联,并将关联完成的唯一编号展示给用户。

2.如权利要求1所述的自学习的知识库管理方法,其特征在于:还包括以下步骤,建立tf-idf算法,设定关键词tf-idf值的范围,根据待查询关键词对应的文档类别,从网络获取相关文档类别的文档对应的关键词,根据tf-idf算法计算网络关键词的tf-idf值,将该网络关键词的tf-idf值与关键词tf-idf值的范围进行比较,当该网络关键词的tf-idf值满足关键词tf-idf值的范围时,判定该网络关键词对应的文档真实有效,根据tf-idf算法计算该网络关键词的tf-idf值;当该网络关键词的tf-idf值不满足关键词tf-idf值的范围时,重新从网络获取相关文档类别的文档对应的关键词。

3.如权利要求2所述的自学习的知识库管理方法,其特征在于:还包括以下步骤,建立tf-idf算法,根据待查询关键词对应的文档类别,从网络获取相关文档类别的文档对应的关键词,根据tf-idf算法计算待查询关键词的tf-idf值与网络关键词的tf-idf值,根据待查询关键词的tf-idf值与网络关键词的tf-idf值,将待查询关键词的tf-idf值与网络关键词的tf-idf值进行比较,当待查询关键词的tf-idf值小于或者等于网络关键词的tf-idf值时,将该网络关键词对应的文档作为待添加的网络文档;当待查询关键词的tf-idf值大于网络关键词的tf-idf值时,重新从网络获取相关文档类别的文档对应的关键词。

4.如权利要求2或3所述的自学习的知识库管理方法,其特征在于:tf-idf算法为:

其中,p(x)代表待查询关键词以及网络关键词的tf-idf值,tf(x)代表待查询关键词以及网络关键词的词频,n代表网络中文档总数,n(x)代表带有关键词的文档数。

5.如权利要求1所述的自学习的知识库管理方法,其特征在于:还包括以下步骤,建立预设语言库,获取待添加网络文档对应的文件,根据预设语言库对待添加网络文档对应的文件的内容进行检索,确定待添加网络文档对应的文件的语言类别,并将该待添加网络文档对应的文件存入对应语言类别的知识库中。

6.如权利要求1所述的自学习的知识库管理方法,其特征在于:还包括以下步骤,获取待添加网络文档对应的文件链接,从该文件链接中提取文档标签,所述文档标签包括:网络文档来源网站、网络文档分类、网络文档归属,根据文档标签对待添加网络文档进行标记,并存入知识库中。

7.如权利要求1所述的自学习的知识库管理方法,其特征在于:还包括以下步骤,设定预设点击量阈值,获取待添加网络文档的点击量,将待添加网络文档的点击量与预设点击量阈值进行比较,当待添加网络文档的点击量大于预设点击量阈值时,将待添加网络文档存入知识库中并优先推送给用户;当待添加网络文档的点击量小于预设点击量阈值时,将待添加网络文档存入知识库中。

8.一种自学习的知识库管理装置,其特征在于,所述自学习的知识库管理装置包括:

提取模块,用于接收文档查询指令,从文档查询指令中提取待查询关键词以及待查询关键词对应的文档类别;

计算模块,用于建立tf-idf算法,根据待查询关键词对应的文档类别,从网络获取相关文档类别的文档对应的关键词,根据tf-idf算法计算待查询关键词的tf-idf值与网络关键词的tf-idf值,根据待查询关键词的tf-idf值与网络关键词的tf-idf值,将待查询关键词的tf-idf值与网络关键词的tf-idf值进行比较,根据比较结果,确定待添加的网络关键词对应的文档;

管理模块,用于获取待添加网络文档对应的文件链接以及文件,将待添加网络文档对应的文件链接以及文件存储至知识库中,为该待添加网络文档生成唯一编号,将该唯一编号与待添加网络文档对应的文件链接以及文件进行关联,并将关联完成的唯一编号展示给用户。

9.一种终端设备,其特征在于,所述终端设备包括:存储器、处理器以及存储在所述存储器上并可在所述处理器上运行的自学习的知识库管理方法程序,所述自学习的知识库管理方法程序配置为实现如权利要求1至7任一项所述的自学习的知识库管理方法的步骤。

10.一种存储介质,其特征在于,所述存储介质为计算机存储介质,所述计算机存储介质上存储有自学习的知识库管理方法程序,所述自学习的知识库管理方法程序被处理器执行时实现如权利要求1至7任一项所述的自学习的知识库管理方法的步骤。

当前第2页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1