一种基于贝叶斯分类器的水利知识问答方法、设备及介质与流程

文档序号：35342168发布日期：2023-09-07 12:34阅读：38来源：国知局

本技术涉及互联网搜索服务，尤其涉及一种基于贝叶斯分类器的水利知识问答方法、设备及介质。

背景技术：

1、自然语言处理工具包(han language processing，hanlp)基于java开发的，支持中文分词、词性标注、命名实体识别、关键词提取、文本分类、依存句法分析、语义角色标注等多种自然语言处理任务。hanlp还提供了多种中文分词算法、词性标注模型、命名实体识别模型和依存句法分析模型，以及针对不同应用场景的文本分类模型和情感分析模型。贝叶斯分类器是一种基于贝叶斯定理的分类算法，其原理是根据样本数据中的先验概率和类条件概率，对新数据进行分类。在贝叶斯分类器中，每个类别被赋予一个概率值，当新的数据到来时，分类器会计算该数据属于每个类别的概率，最终将该数据分配给概率最大的类别。

2、目前，随着信息化进程的加速和大数据技术的不断发展，企业和个人越来越需要处理和分析大量的数据，以快速获取所需信息和提高工作效率。同样的，水利行业也需要实现水利知识问答的自动答复。但是，现有的自动问答系统通常是按照常规方式进行分词的，无法满足水利行业存在较多专业词汇的要求，使得常规分词的分词效果较差；并且，现有水利场景中问题分类的预测概率准确率较低，无法在短时间内处理大量的查询请求，实现对水利知识的实时查询问答。

技术实现思路

1、本技术实施例提供了一种基于贝叶斯分类器的水利知识问答方法、设备及介质，用以解决现有技术无法满足水利行业较多专业词汇的要求，分词效果较差，且问题分类的预测概率准确率较低，无法实现对水利知识的实时查询问答的技术问题。

2、一方面，本技术实施例提供了一种基于贝叶斯分类器的水利知识问答方法，包括：

3、接收用户提问问题的文本信息，并基于自然语言处理工具包以及通过加载预设的自定义水利词典，对所述文本信息进行中文分词以及语义分析，以确定对应的关键词；

4、将所述关键词输入至预先训练好的贝叶斯分类器中，以确定所述关键词对应的目标分类模型，并将所述目标分类模型作为用户提问的问题对应的意图；

5、根据所述目标分类模型对应的模型唯一标识码，获取所述问题对应的模型数据，并确定所述问题对应意图的返回模型；

6、将所述模型数据拼接至所述返回模型中，并将拼接后的语句作为所述问题的答复返回至所述用户。

7、在本技术的一种实现方式中，所述将所述关键词输入至预先训练好的贝叶斯分类器中，以确定所述关键词对应的目标分类模型，并将所述目标分类模型作为用户提问的问题对应的意图，具体包括：

8、将所述关键词输入至预先训练好的贝叶斯分类器中；所述贝叶斯分类器中设置有若干个分类模型语句；

9、计算所述关键词与所述若干个分类模型语句之间对应的若干个相似度，并在所述若干个分类模型语句中确定出目标分类模型语句；所述目标分类模型语句与所述关键词之间的相似度是所述若干个相似度中最高的；

10、确定所述目标分类模型语句对应的目标分类模型，并将所述目标分类模型作为用户提问的问题对应的意图。

11、在本技术的一种实现方式中，所述将所述关键词输入至预先训练好的贝叶斯分类器中，以确定所述关键词对应的目标分类模型之前，所述方法还包括：

12、通过预设方式获取若干个训练样本，并将所述若干个训练样本输入至贝叶斯分类器中；

13、在所述贝叶斯分类器中，分别对所述若干个训练样本进行聚类分析，获得对应的分析结果，并根据分析结果，确定训练样本对应的多个分类模型语句；

14、将所述多个分类模型语句发送至所述训练样本对应的服务终端中，并基于所述服务终端，获取对应用户的反馈数据；所述反馈数据用于表示单位时间内所述用户对接收到所述多个分类模型语句的操作数据；

15、根据所述反馈数据，在所述多个分类模型语句中，确定出所述训练样本对应的目标分类模型，以完成对所述贝叶斯分类器的训练。

16、在本技术的一种实现方式中，所述根据所述目标分类模型对应的模型唯一标识码，获取所述问题对应的模型数据，具体包括：

17、确定出所述目标分类模型对应的模型唯一标识码，并根据所述模型唯一标识码，找到对应的目标分类模型；

18、判断所述目标分类模型的模型类型，并基于所述模型类型，获取所述问题对应的模型数据；所述模型类型包括url模型和sql模型。

19、在本技术的一种实现方式中，所述基于所述模型类型，获取所述问题对应的模型数据，具体包括：

20、在所述目标分类模型的模型类型为url模型的情况下，确定所述url模型对应的数据接口，并通过配置所述url模型的模型参数，获取所述数据接口返回的模型数据；

21、在所述目标分类模型的模型类型为sql模型的情况下，通过配置所述sql模型的模型参数连接至对应的数据源，并执行对应sql语句，以获取所述问题对应的模型数据。

22、在本技术的一种实现方式中，所述基于自然语言处理工具包以及通过加载预设的自定义水利词典，对所述文本信息进行中文分词以及语义分析，以确定对应的关键词之前，所述方法还包括：

23、通过预设方式爬取水利相关文章，并在所述水利相关文章中，获取若干水利关联信息；

24、基于所述若干水利关联信息，获取对应的若干水利专用词汇，并生成所述若干水利专用词汇对应的自定义水利词典；

25、所述自定义水利词典中自定义的水利专用词汇的优先级大于标准词汇的优先级。

26、在本技术的一种实现方式中，所述基于自然语言处理工具包以及通过加载预设的自定义水利词典，对所述文本信息进行中文分词以及语义分析，以确定对应的关键词，具体包括：

27、基于自然语言处理工具包中的依存句法分析模型，对所述文本信息进行语义分析，并通过所述自然语言处理工具包中的词性标注模型，确定所述用户提问问题的文本信息对应的词性；

28、基于所述自然语言处理工具包中的中文分词算法以及确定出的所述文本信息对应的词性，并通过加载预设的自定义水利词典，对所述文本信息进行中文分词，提取出对应的关键词。

29、在本技术的一种实现方式中，所述将所述模型数据拼接至所述返回模型中，并将拼接后的语句作为所述问题的答案返回至所述用户，具体包括：

30、在所述返回模型中确定出所述模型数据的对应位置，并通过所述模型数据，将所述对应位置上的占位符进行替换，以将所述模型数据拼接至所述返回模型中；

31、在替换成功的情况下，将拼接后的语句作为所述问题的答案返回至所述用户，在替换失败的情况下，将默认回复语句返回至所述用户，以完成对水利知识的问答。

32、另一方面，本技术实施例还提供了一种基于贝叶斯分类器的水利知识问答设备，所述设备包括：

33、至少一个处理器；

34、以及，与所述至少一个处理器通信连接的存储器；

35、其中，所述存储器存储有可被所述至少一个处理器执行的指令，所述指令被所述至少一个处理器执行，以使所述至少一个处理器能够执行如上述的一种基于贝叶斯分类器的水利知识问答方法。

36、另一方面，本技术实施例还提供了一种非易失性计算机存储介质，存储有计算机可执行指令，所述计算机可执行指令设置为：

37、如上述的一种基于贝叶斯分类器的水利知识问答方法。

38、本技术实施例提供了一种基于贝叶斯分类器的水利知识问答方法、设备及介质，至少包括以下有益效果：

39、在对用户提问问题对应的文本信息进行中文分词时，通过加载预设的自定义水利词典，能够使划分出的关键词更符合水利行业，对提问问题分词的效果更好；通过将划分好的关键词输入至预先训练好的贝叶斯分类器，输出关键词对应的目标分类模型，进而将目标分类模型作为用户提问问题对应的意图，不仅能够使问题的分类概率预测的更准确，还提高了问题分类概率的预测效率；通过目标分类模型的模型唯一标识码，能够获取到目标分类模型对应的模型数据，通过确定出问题对应意图的返回模型，并将模型数据拼接至返回模型中，进而将拼接后的语句作为问题的答复返回至用户，实现对水利知识的实时自动问答，这样不仅能够自动分析和处理大量的文本信息，还能够根据用户提出的问题快速准确的给出答复，问答效率更高。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：张宇房爱印尹曦萌闫海旺曲建龙
技术所有人：浪潮智慧科技有限公司
我是此专利的发明人

上一篇：媒体内容的生成方法、装置、设备及可读存储介质与流程
上一篇：一种多六自由度飞行器协同作战决策方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。