本发明涉及自然语言处理,具体涉及一种自然语言匹配方法、装置、计算机设备及存储介质。
背景技术:
1、自然语言处理是人工智能领域的一项重要技术,随着自然语言处理技术的发展,基于通用信息的语言识别与语义匹配技术渐渐提高。语义匹配一般可理解为判断用户输入的自然语言和语义之间是否匹配的过程,是根据用户输入的自然语言,通过分析语义或语境等,将其与预设的模式、规则或语义表示进行匹配,从而理解用户意图。
2、而发明人发现,目前的语义匹配技术中,匹配规则都比较单一,且不够完善,导致语义识别准确率较低。
技术实现思路
1、有鉴于此,本发明提供了一种自然语言匹配方法、装置、计算机设备及存储介质,以解决目前自然语言匹配准确率较低的问题。
2、第一方面,本发明提供了一种自然语言匹配方法,包括:
3、获取待匹配语句;
4、将待匹配语句与预先设置的语料库进行全语句规则匹配或者有序规则匹配,其中,语料库中预先定义有通过匹配规则将预设语料分词构成的规则语句与语义内容之间的对应关系,全语句规则匹配用于匹配与待匹配语句完全相同的语句,有序规则匹配用于匹配与待匹配语句结构语序相同并且关键词相同的语句;
5、若全语句规则匹配失败并且有序规则匹配失败的情况下,对待匹配语句进行语义内容的算法匹配,以确定是否存在与待匹配语句语义相近的语料;
6、若语义内容的算法匹配失败的情况下,对待匹配语句进行变元规则匹配,得到匹配结果;其中,变元规则匹配用于将待匹配语句中同属性或者相同归属分类替换为已知变元属性的情况下进行语句匹配。
7、在一种可选实施方式中,通过以下步骤设置语料库,包括:
8、建立预设自然语言库,自然语言库用于匹配待匹配语句中的语料分词;
9、建立匹配规则表,匹配规则表包括:全语句匹配规则与有序匹配规则;
10、将预设自然语言库中的至少一个预设语料分词与匹配规则表中的匹配规则组合,获得匹配组;
11、将匹配组与匹配组之间通过预设的组合规则进行组合,获得多个规则语句,用于构成语料库。
12、在一种可选实施方式中,设置语料库,包括:
13、生成与规则语句对应的语义内容、语义节点以及所属话题;
14、根据规则语句、与规则语句对应的语义内容、语义节点以及所属话题,构成语料库。
15、在一种可选实施方式中,预设自然语言库,包括:
16、归属语料表,包括:预设语料分词以及与预设语料分词对应的所属类别;
17、平行语料表,包括:预设语料分词以及与预设语料分词对应的常用词;
18、代词替换表,包括:预设语料代词、与预设语料代词对应的替换词,以及与替换词对应的替换优先值。
19、在一种可选实施方式中,将待匹配语句与预先设置的语料库进行全语句规则匹配,包括:
20、当匹配规则为全语句第一匹配规则时,待匹配语句中的语料分词需包含匹配组中全部的预设语料分词;
21、当匹配规则为全语句第二匹配规则时,待匹配语句中的语料分词需包含匹配组中任意一个预设语料分词;
22、当匹配规则为全语句第三匹配规则时,待匹配语句中的语料分词需不包含匹配组中全部的预设语料分词;
23、当匹配规则为全语句第四匹配规则时,待匹配语句中的语料分词需不包含匹配组中任意一个预设语料分词;
24、当匹配规则为全语句第五匹配规则时,待匹配语句中的语料分词需与匹配组中的预设语料分词完全相同;
25、当匹配规则为全语句第六匹配规则时,待匹配语句中的语料分词需与匹配组中的任意一个预设语料分词完全相同。
26、在一种可选实施方式中,将待匹配语句与预先设置的语料库进行有序规则匹配,包括:
27、当匹配规则为有序第一匹配规则时,待匹配语句中的语料分词需包含匹配组中任意一个预设语料分词;
28、当匹配规则为有序第二匹配规则时,待匹配语句中的语料分词需不包含匹配组中任意一个预设语料分词;
29、当匹配规则为有序第三匹配规则时,待匹配语句中的语料分词需与匹配组中的预设语料分词的存在归属关系;
30、当匹配规则为有序第四匹配规则时,待匹配语句中的语料分词需与匹配组中的预设语料分词的存在平行关系;
31、当匹配规则为有序第四匹配规则时,待匹配语句中的语料分词需与匹配组中的预设语料分词的存在变元关系;
32、当匹配规则为有序第五匹配规则时,待匹配语句中的语料分词需与匹配组中的预设语料分词的不存在归属关系;
33、当匹配规则为有序第六匹配规则时,待匹配语句中的语料分词需与匹配组中的预设语料分词的存在不平行关系;
34、当匹配规则为有序第七匹配规则时,待匹配语句中的语料分词需与匹配组中的预设语料分词的存在填充关系。
35、第二方面,本发明提供了一种自然语言匹配装置,该装置包括:
36、获取模块,用于获取待匹配语句;
37、规则匹配模块,用于将待匹配语句与预先设置的语料库进行全语句规则匹配或者有序规则匹配,其中,语料库中预先定义有通过匹配规则将预设语料分词构成的规则语句与语义内容之间的对应关系,全语句规则匹配用于匹配与待匹配语句完全相同的语句,有序规则匹配用于匹配与待匹配语句结构语序相同并且关键词相同的语句;
38、算法匹配模块,用于若全语句规则匹配失败并且有序规则匹配失败的情况下,对待匹配语句进行语义内容的算法匹配,以确定是否存在与待匹配语句语义相近的语料;
39、变元匹配模块,用于若语义内容的算法匹配失败的情况下,对待匹配语句进行变元规则匹配,得到匹配结果;其中,变元规则匹配用于将待匹配语句中同属性或者相同归属分类替换为已知变元属性的情况下进行语句匹配。
40、第三方面,本发明提供了一种计算机设备,包括:存储器和处理器,存储器和处理器之间互相通信连接,存储器中存储有计算机指令,处理器通过执行计算机指令,从而执行上述第一方面或其对应的任一实施方式的自然语言匹配方法。
41、第四方面,本发明提供了一种计算机可读存储介质,计算机可读存储介质存储有计算机指令,计算机指令用于使计算机执行上述第一方面或其对应的任一实施方式的自然语言匹配方法。
42、本发明实施例中,通过制定匹配规则,通过全语句规则匹配,有序规则匹配、算法匹配、变元规则匹配结合的实现方式,可以使用户语料匹配的更精准,更全面,进而可以提高语义识别的准确率。
1.一种自然语言匹配方法,其特征在于,所述方法包括:
2.根据权利要求1所述的方法,其特征在于,通过以下步骤设置所述语料库,包括:
3.根据权利要求2所述的方法,其特征在于,所述设置所述语料库,包括:
4.根据权利要求2所述的方法,其特征在于,所述预设自然语言库,包括:
5.根据权利要求2所述的方法,其特征在于,所述将所述待匹配语句与预先设置的语料库进行全语句规则匹配,包括:
6.根据权利要求4所述的方法,其特征在于,所述将所述待匹配语句与预先设置的语料库进行有序规则匹配,包括:
7.一种自然语言匹配装置,其特征在于,所述装置包括:
8.一种计算机设备,其特征在于,包括:
9.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机指令,所述计算机指令用于使所述计算机执行权利要求1-6任一项所述的自然语言匹配方法。