本公开涉及自然语言处理领域,具体涉及一种指令识别方法及装置、设备、计算机可读存储介质。
背景技术:
1、自然语言处理(nlp,natural language processing)是计算机科学领域与人工智能领域中的一个重要方向。自然语言处理研究能实现人与计算机之间用自然语言进行有效通信的各种理论和方法。例如,利用自然语言处理技术可以对各种语料数据,例如语音数据、文本数据,进行处理。
2、随着人工智能(ai)算法以及ai芯片等硬件技术的发展,智能设备已经在日常生活中被广泛应用,如智能家居语音控制系统、智能音箱、智能会议系统会议记录生成等。
技术实现思路
1、本公开提供一种指令识别方法,所述指令识别方法包括:
2、获取待识别语音,并对所述待识别语音进行语音识别,得到对应的识别文本;
3、将所述识别文本与命令文本库中的n个命令文本进行匹配,获得所述n个命令文本中的每个与所述识别文本的最长公共子序列和最长公共子串;其中,n为大于0的整数;
4、根据所述n个命令文本中的每个与所述识别文本的最长公共子序列和最长公共子串,确定所述命令文本库中与所述识别文本对应的目标文本。
5、在一些实施例中,所述识别文本包括拼音字符串文本,所述拼音字符串文本包括至少一个拼音字符串。
6、在一些实施例中,所述拼音字符串文本还包括与每个所述拼音字符串所对应的声调字符,其中,所述拼音字符串文本中的各拼音字符串和所述声调字符按照预设规则排列。
7、在一些实施例中,所述识别文本包括至少一个文字字符。
8、在一些实施例中,将所述识别文本与命令文本库中的n个命令文本进行匹配,获得所述n个命令文本中的每个与所述识别文本的最长公共子序列和最长公共子串,包括:
9、遍历所述命令文本词库中的n个命令文本,每遍历一个所述命令文本,均判断所述识别文本与当前遍历到的命令文本是否完全相同;
10、若所述识别文本与所述当前遍历到的命令文本完全相同,则获取所述识别文本与所述当前遍历到的命令文本的最长公共子序列和最长公共子串,并停止遍历;若所述识别文本与所述当前遍历到的命令文本不完全相同,则获取所述识别文本与所述当前遍历到的命令文本的最长公共子序列和最长公共子串,并继续遍历。
11、在一些实施例中,将所述识别文本与命令文本库中的n个命令文本进行匹配,获得所述n个命令文本中的每个与所述识别文本的最长公共子序列和最长公共子串,包括:
12、将所述命令文本词库中的命令文本,逐个与所述识别文本进行匹配,并获取每个所述命令文本与所述识别文本的最长公共子序列和最长公共子串。
13、在一些实施例中,根据所述n个命令文本中的每个与所述识别文本的最长公共子序列和最长公共子串,确定所述命令文本库中与所述识别文本对应的目标文本,包括:
14、判断所述n个命令文本中的每个与所述识别文本的最长公共子序列和最长公共子串的长度是否满足预设条件;若满足,则将相应的命令文本作为备选文本;
15、从所有的所述备选文本中选择所述最长公共子序列的长度最大的一个命令文本,作为目标文本。
16、在一些实施例中,所述预设条件包括:
17、所述最长公共子序列的长度与所述命令文本的长度的比值大于或等于第一阈值,且所述最长公共子串的长度与所述命令文本的长度的比值大于或等于第二阈值。
18、在一些实施例中,所述第二阈值为:
19、
20、其中,length(commodi)为第i命令文本的长度。
21、本公开还提供一种指令识别装置,包括:
22、语音识别模块,被配置为获取目标用户发出的待识别的目标语音,并确定出所述目标语音对应的识别文本;
23、匹配模块,被配置为将所述识别文本与命令文本库中的n个命令文本进行匹配,获得所述n个命令文本中的每个与所述识别文本的最长公共子序列和最长公共子串;其中,n为大于0的整数;
24、识别模块,被配置为根据所述n个命令文本中的每个与所述识别文本的最长公共子序列和最长公共子串,确定所述命令文本库中与所述识别文本对应的目标文本。
25、本公开还提供一种指令识别设备,包括:处理器、存储器、系统总线;
26、所述处理器以及所述存储器通过所述系统总线相连;
27、所述存储器用于存储一个或多个程序,所述一个或多个程序包括指令,所述指令当被所述处理器执行时使所述处理器执行以上实施例中所述的语音识别方法。
28、本公开还提供一种计算机可读存储介质,所述计算机可读存储介质中存储有指令,当所述指令在终端设备上运行时,使得所述终端设备执行以上实施例中所述的语音识别方法。
1.一种指令识别方法,其特征在于,包括:
2.根据权利要求1所述的指令识别方法,其特征在于,所述识别文本包括拼音字符串文本,所述拼音字符串文本包括至少一个拼音字符串。
3.根据权利要求2所述的指令识别方法,其特征在于,所述拼音字符串文本还包括与每个所述拼音字符串所对应的声调字符,其中,所述拼音字符串文本中的各拼音字符串和所述声调字符按照预设规则排列。
4.根据权利要求1所述的指令识别方法,其特征在于,所述识别文本包括至少一个文字字符。
5.根据权利要求1至4中任一项所述的指令识别方法,其特征在于,将所述识别文本与命令文本库中的n个命令文本进行匹配,获得所述n个命令文本中的每个与所述识别文本的最长公共子序列和最长公共子串,包括:
6.根据权利要求1至4中任一项所述的指令识别方法,其特征在于,将所述识别文本与命令文本库中的n个命令文本进行匹配,获得所述n个命令文本中的每个与所述识别文本的最长公共子序列和最长公共子串,包括:
7.根据权利要求1至4中任一项所述的指令识别方法,其特征在于,根据所述n个命令文本中的每个与所述识别文本的最长公共子序列和最长公共子串,确定所述命令文本库中与所述识别文本对应的目标文本,包括:
8.根据权利要求7所述的指令识别方法,其特征在于,所述预设条件包括:
9.根据权利要求8所述的指令识别方法,其特征在于,所述第二阈值为:
10.一种指令识别装置,其特征在于,包括:
11.一种指令识别设备,其特征在于,包括:处理器、存储器、系统总线;
12.一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现权利要求1至9中任一项所述的方法。