本发明涉及数据处理,尤其涉及一种正则表达式的生成方法、装置、电子设备及介质。
背景技术:
1、正则表达式是一种用于匹配和操作文本的工具,它是由一系列字符和特殊字符组成的模式,用于描述要匹配的文本模式。
2、现有技术中可以通过生成工具来自动生成正则表达式,但上述生成工具需要用户具有一定的专业技能,如编程知识,不能较好地适用于普通用户的需要,灵活性较差,而且在处理较为复杂的文本时生成的正则表达式准确性较差。
技术实现思路
1、本发明提供了一种正则表达式的生成方法、装置、电子设备及介质,以增强生成方法的通用性和灵活性,扩大用户的使用范围,提高生成正则表达式的准确性。
2、根据本发明的一方面,提供了一种正则表达式的生成方法,包括:
3、获取用户作用在所输入原始文本数据的选取操作,并确定所述选取操作对应的原始文本数据中的第一文本数据;
4、采用关键词提取算法确定所述第一文本数据的目标关键词;
5、基于所述目标关键词和所述第一文本数据生成所述原始文本数据的目标正则表达式,所述目标正则表达式用于对所述原始文本数据进行处理。
6、根据本发明的另一方面,提供了一种正则表达式的生成装置,包括:
7、获取模块,用于获取用户作用在所输入原始文本数据的选取操作,并确定所述选取操作对应的原始文本数据中的第一文本数据;
8、确定模块,用于采用关键词提取算法确定所述第一文本数据的目标关键词;
9、生成模块,用于基于所述目标关键词和所述第一文本数据生成所述原始文本数据的目标正则表达式,所述目标正则表达式用于对所述原始文本数据进行处理。
10、根据本发明的另一方面,提供了一种电子设备,所述电子设备包括:
11、至少一个处理器;以及
12、与所述至少一个处理器通信连接的存储器;其中,
13、所述存储器存储有可被所述至少一个处理器执行的计算机程序,所述计算机程序被所述至少一个处理器执行,以使所述至少一个处理器能够执行本发明任一实施例所述的正则表达式的生成方法。
14、根据本发明的另一方面,提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机指令,所述计算机指令用于使处理器执行时实现本发明任一实施例所述的正则表达式的生成方法。
15、本发明实施例提供了一种正则表达式的生成方法、装置、电子设备及介质,所述方法包括:获取用户作用在所输入原始文本数据的选取操作,并确定所述选取操作对应的原始文本数据中的第一文本数据;采用关键词提取算法确定所述第一文本数据的目标关键词;基于所述目标关键词和所述第一文本数据生成所述原始文本数据的目标正则表达式,所述目标正则表达式用于对所述原始文本数据进行处理。利用上述技术方案,通过确定选取操作对应的第一文本数据,以及采用关键词提取算法确定第一文本数据的目标关键词,能够准确地生成原始文本数据的目标正则表达式,提高了生成正则表达式的准确性,同时增强了生成方法的通用性和灵活性,扩大了用户的使用范围。
16、应当理解,本部分所描述的内容并非旨在标识本发明的实施例的关键或重要特征,也不用于限制本发明的范围。本发明的其它特征将通过以下的说明书而变得容易理解。
1.一种正则表达式的生成方法,其特征在于,包括:
2.根据权利要求1所述的方法,其特征在于,所述基于所述目标关键词和所述第一文本数据生成所述原始文本数据的目标正则表达式,包括:
3.根据权利要求2所述的方法,其特征在于,在所述基于所述目标关键词、所述数据类型以及所述第一文本数据生成所述原始文本数据的目标正则表达式之前,还包括:
4.根据权利要求3所述的方法,其特征在于,所述基于所述目标关键词、所述数据类型以及所述第二文本数据生成所述原始文本数据的目标正则表达式,包括:
5.根据权利要求1所述的方法,其特征在于,在所述采用关键词提取算法确定所述第一文本数据的目标关键词之前,还包括:
6.根据权利要求5所述的方法,其特征在于,所述对所述预处理后文本数据进行标注处理,得到所述预处理后文本数据的词语信息,包括:
7.根据权利要求5或6所述的方法,其特征在于,所述采用关键词提取算法确定所述第一文本数据的目标关键词,包括:
8.根据权利要求1所述的方法,其特征在于,所述基于所述目标关键词和所述第一文本数据生成所述原始文本数据的目标正则表达式,包括:
9.一种正则表达式的生成装置,其特征在于,包括:
10.一种电子设备,其特征在于,所述电子设备包括:
11.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机指令,所述计算机指令用于使处理器执行时实现权利要求1-8中任一项所述的正则表达式的生成方法。