一种文本处理方法、装置及存储介质与流程

文档序号:34987613发布日期:2023-08-03 19:49阅读:32来源:国知局
一种文本处理方法、装置及存储介质与流程

本技术涉及通信,尤其涉及一种文本处理方法、装置及存储介质。


背景技术:

1、随着科技的发展,位置信息已经成为人们信息生活中的一部分,人们通常可以将多个地址的位置信息和可视化地图进行结合,以便于对位置信息进行可视化。

2、目前,大多数的位置信息都是地址文本信息,由于地址文本信息中经常会存在大量与地址无关的冗余信息,因此,无法直接将地址文本信息转换为位置信息。


技术实现思路

1、本技术提供一种文本处理方法、装置及存储介质,用于解决现有技术中,如何将地址文本信息转换为位置信息的技术问题。

2、为达到上述目的,本技术采用如下技术方案:

3、第一方面,提供一种文本处理方法,包括:获取待处理文本;当待处理文本包括符号类文本时,根据符号类文本确定待处理文本的第一查询地址;根据预先建立好的冗余文本库,去除第一查询地址中的冗余文本,以得到第二查询地址;根据第二查询地址确定待处理文本对应的位置信息。

4、可选的,根据符号类文本确定待处理文本的第一查询地址,包括:当待处理文本中包括括号,且括号外的文本中包括断句符号时,根据断句符号将括号外的文本划分为多个第一子文本,并将多个第一子文本中的首个第一子文本确定为主查询地址;或者,当待处理文本中包括括号,且括号外的文本中不包括断句符号时,将括号外的文本确定为主查询地址;或者,当待处理文本中不包括括号,且待处理文本中包括断句符号时,根据断句符号将待处理文本划分为多个第二子文本,并将第二子文本中的首个第二子文本确定为主查询地址;或者,当待处理文本中不包括括号,且待处理文本中不包括断句符号时,将待处理文本确定为主查询地址;将主查询地址确定为第一查询地址。

5、可选的,当根据主查询地址对应的第二查询地址确定待处理文本对应的位置信息失败时,文本处理方法还包括:按照地址要素文本在第二查询地址中的从后往前的顺序,依次去除第二查询地址中的地址要素文本,以得到第三查询地址,直到确定出第三查询地址对应的位置信息;或者,获取辅查询地址,并将辅查询地址确定为第一查询地址。

6、可选的,获取辅查询地址,包括:当待处理文本中包括括号,且括号内的文本满足预设条件,且括号内的文本中不包括断句符号时,将括号内的文本确定为辅查询地址;或者,当待处理文本中包括括号,且括号内的文本满足预设条件,且括号内的文本中包括断句符号时,根据断句符号将括号内的文本划分为多个第三子文本,并将满足预设条件的第三子文本确定为辅查询地址;或者,当待处理文本中包括括号,且括号内的文本不满足预设条件,且括号外的文本中包括断句符号时,根据断句符号将括号外的文本划分为多个第四子文本,并将除首个第四子文本以外的其他第四子文本中,满足预设条件的第四子文本确定为辅查询地址;或者,当待处理文本中不包括括号,且待处理文本中包括断句符号时,根据断句符号将待处理文本划分为多个第五子文本,并将除首个第五子文本以外的其他第五子文本中,满足预设条件的第五子文本确定为辅查询地址。

7、可选的,还包括:获取样例文本,并将样例文本进行分词处理,以得到多个第六子文本;样例文本为去除字母类文本、数字类文本和符号类文本的文本;去除多个第六子文本中预设地址文本,以得到多个第七子文本;将文本个数大于预设个数的第七子文本确定为第八子文本;第八子文本包括单字子文本和多字子文本;当包括目标单字子文本和目标多字子文本的样例文本的数量大于预设数量时,将目标单字子文本和目标多字子文本确定为关联文本;目标单字子文本为单字子文本中的任意一个子文本;目标多字子文本为多字子文本中的任意一个子文本;确定冗余文本库包括多字子文本和关联文本。

8、第二方面,提供一种文本处理装置,包括:获取单元和处理单元;获取单元,用于获取待处理文本;处理单元,用于当待处理文本包括符号类文本时,根据符号类文本确定待处理文本的第一查询地址;处理单元,还用于根据预先建立好的冗余文本库,去除第一查询地址中的冗余文本,以得到第二查询地址;处理单元,还用于根据第二查询地址确定待处理文本对应的位置信息。

9、可选的,处理单元,具体用于:当待处理文本中包括括号,且括号外的文本中包括断句符号时,根据断句符号将括号外的文本划分为多个第一子文本,并将多个第一子文本中的首个第一子文本确定为主查询地址;当待处理文本中包括括号,且括号外的文本中不包括断句符号时,将括号外的文本确定为主查询地址;当待处理文本中不包括括号,且待处理文本中包括断句符号时,根据断句符号将待处理文本划分为多个第二子文本,并将第二子文本中的首个第二子文本确定为主查询地址;当待处理文本中不包括括号,且待处理文本中不包括断句符号时,将待处理文本确定为主查询地址;将主查询地址确定为第一查询地址。

10、可选的,当根据主查询地址对应的第二查询地址确定待处理文本对应的位置信息失败时,处理单元,还用于按照地址要素文本在第二查询地址中的从后往前的顺序,依次去除第二查询地址中的地址要素文本,以得到第三查询地址,直到确定出第三查询地址对应的位置信息;获取单元,还用于获取辅查询地址;处理单元,还用于将辅查询地址确定为第一查询地址。

11、可选的,获取单元,具体用于:当待处理文本中包括括号,且括号内的文本满足预设条件,且括号内的文本中不包括断句符号时,将括号内的文本确定为辅查询地址;当待处理文本中包括括号,且括号内的文本满足预设条件,且括号内的文本中包括断句符号时,根据断句符号将括号内的文本划分为多个第三子文本,并将满足预设条件的第三子文本确定为辅查询地址;当待处理文本中包括括号,且括号内的文本不满足预设条件,且括号外的文本中包括断句符号时,根据断句符号将括号外的文本划分为多个第四子文本,并将除首个第四子文本以外的其他第四子文本中,满足预设条件的第四子文本确定为辅查询地址;当待处理文本中不包括括号,且待处理文本中包括断句符号时,根据断句符号将待处理文本划分为多个第五子文本,并将除首个第五子文本以外的其他第五子文本中,满足预设条件的第五子文本确定为辅查询地址。

12、可选的,获取单元,还用于获取样例文本,并将样例文本进行分词处理,以得到多个第六子文本;处理单元,还用于样例文本为去除字母类文本、数字类文本和符号类文本的文本;处理单元,还用于去除多个第六子文本中预设地址文本,以得到多个第七子文本;处理单元,还用于将文本个数大于预设个数的第七子文本确定为第八子文本;第八子文本包括单字子文本和多字子文本;处理单元,还用于当包括目标单字子文本和目标多字子文本的样例文本的数量大于预设数量时,将目标单字子文本和目标多字子文本确定为关联文本;目标单字子文本为单字子文本中的任意一个子文本;目标多字子文本为多字子文本中的任意一个子文本;处理单元,还用于确定冗余文本库包括多字子文本和关联文本。

13、第三方面,提供一种文本处理装置,包括存储器和处理器;存储器用于存储计算机执行指令,处理器与存储器通过总线连接;当文本处理装置运行时,处理器执行存储器存储的计算机执行指令,以使文本处理装置执行第一方面所述的文本处理方法。

14、该文本处理装置可以是网络设备,也可以是网络设备中的一部分装置,例如网络设备中的芯片系统。该芯片系统用于支持网络设备实现第一方面及其任意一种可能的实现方式中所涉及的功能,例如,获取、确定、发送上述文本处理方法中所涉及的数据和/或信息。该芯片系统包括芯片,也可以包括其他分立器件或电路结构。

15、第四方面,提供一种计算机可读存储介质,计算机可读存储介质包括计算机执行指令,当计算机执行指令在计算机上运行时,使得该计算机执行第一方面所述的文本处理方法。

16、第五方面,还提供一种计算机程序产品,该计算机程序产品包括计算机指令,当计算机指令在文本处理装置上运行时,使得文本处理装置执行如上述第一方面所述的文本处理方法。

17、需要说明的是,上述计算机指令可以全部或者部分存储在计算机可读存储介质上。其中,计算机可读存储介质可以与文本处理装置的处理器封装在一起的,也可以与文本处理装置的处理器单独封装,本技术实施例对此不作限定。

18、本技术中第二方面、第三方面、第四方面以及第五方面的描述,可以参考第一方面的详细描述。

19、在本技术实施例中,上述文本处理装置的名字对设备或功能模块本身不构成限定,在实际实现中,这些设备或功能模块可以以其他名称出现。例如,接收单元还可以称为接收模块、接收器等。只要各个设备或功能模块的功能和本技术类似,属于本技术权利要求及其等同技术的范围之内。

20、本技术提供的技术方案至少带来以下有益效果:

21、基于上述任一方面,本技术提供一种文本处理方法,包括:电子设备可以获取待处理文本(又可以称为地址文本信息)。之后,当待处理文本包括符号类文本时,电子设备可以根据符号类文本确定待处理文本的第一查询地址。接着,电子设备还可以根据预先建立好的冗余文本库,去除第一查询地址中的冗余文本,以得到第二查询地址。后续,电子设备可以根据第二查询地址确定待处理文本对应的位置信息。

22、由上可知,电子设备可以通过符号类文本和预先建立好的冗余文本库对待处理文本进行处理,以得到第二查询地址。这样,电子设备可以根据符号类文本去除符号类文本对位置信息的查询所造成的干扰。之后,电子设备可以根据冗余文本库进一步的去除待处理文本中的冗余文本,以使得电子设备可以根据去除了冗余文本后的第二查询地址,确定待处理文本对应的位置信息。

23、本技术中的第一方面、第二方面、第三方面、第四方面以及第五方面的有益效果,均可以参考上述有益效果的分析,此处不再赘述。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1