通信地址解析服务更新方法及其装置、设备、介质、产品与流程

文档序号:31784680发布日期:2022-10-12 12:31阅读:44来源:国知局
通信地址解析服务更新方法及其装置、设备、介质、产品与流程

1.本技术涉及电商信息处理技术领域,尤其涉及一种通信地址解析服务更新方法及其相应的装置、计算机设备、计算机可读存储介质,以及计算机程序产品。


背景技术:

2.物流服务体系在电商领域中特别重要。物流服务是从接收顾客订单开始到将商品送到顾客手中为止所发生的所有服务活动,可使交易的产品或服务实现增值。其本质是更好地满足顾客需求,即保证顾客需要的商品在顾客要求的时间内准时送达,服务能达到顾客所要求的水平等。
3.实践中,物流服务平台会根据用户提供的地址文本进行识别,输出地址文本对应的经纬度和邮政编码,发送给下游渠道商,用于物流过程中的分发操作和行车定位操作等,提高下单商品在运费计算、揽收、分发、派送的效率。
4.经纬度和邮政编码数据是相对复杂稀缺的数据,目前常需依赖第三方通信地址解析服务来获取,成本高昂,如果自行实现相关功能,其实现成本更高,利用率相对较低,因而,需要探索其他可行的方式。


技术实现要素:

5.本技术的首要目的在于解决上述问题而提供一种通信地址解析服务更新方法及其相应的装置、计算机设备、计算机可读存储介质、计算机程序产品。
6.为满足本技术的各个目的,本技术采用如下技术方案:
7.适应本技术的目的之一而提供的一种通信地址解析服务更新方法,包括如下步骤:
8.响应用户提交的通信地址解析请求,调用自建通信地址解析服务预定义的第一解析接口处理所述通信地址解析请求,以获取自建通信地址解析服务应用神经网络模型后获得的第一解析结果,所述神经网络模型用于从标准数据库中确定所述请求中携带的录入地址文本相对应的标准地址文本,所述标准数据库存储多个标准地址文本;
9.当所述第一解析结果指示解析失败时,调用第三方通信地址解析服务预定义的第二解析接口处理所述通信地址解析请求,以获取根据所述请求中携带的录入地址文本确定的第二解析结果;
10.当所述第一解析结果或所述第二解析结果包含所述录入地址文本的标准地址文本及其解析信息时,将其推送给所述用户,且作为数据记录存储于所述标准数据库中,所述解析信息包括所述标准地址文本相对应的邮政编码和/或经纬度;
11.响应定时任务触发事件,根据给定的地址样本应用所述神经网络模型确定其在标准数据库中的标准地址文本共同构成正样本,采用所述正样本对所述神经网络模型实施迭代训练,将其训练至收敛状态后重启服务。
12.可选的,响应定时任务触发事件之前,包括:
13.判断所述标准数据库自最后一次全量更新之后是否达到既定周期,当达到既定周期时,遍历所述标准数据库中的各个数据记录,以每个数据记录中的标准地址文本为传参,调用第二解析接口获取并更新所述数据记录中与所述标准地址文本相对应的解析信息。
14.可选的,响应用户提交的通信地址解析请求,调用自建通信地址解析服务预定义的第一解析接口处理所述通信地址解析请求,以获取自建通信地址解析服务应用神经网络模型后获得的第一解析结果,所述神经网络模型用于从标准数据库中确定所述请求中携带的录入地址文本相对应的标准地址文本,所述标准数据库存储多个标准地址文本,包括:
15.响应用户提交的通信地址解析请求,获取所述通信地址解析请求中的录入地址文本;
16.从自建通信地址解析服务相对应的第一缓存区中查询是否存在所述录入地址文本相对应的解析信息,当存在所述解析信息时,将所述解析信息推送给所述用户;
17.当所述第一缓存区不存在所述解析信息时,调用自建通信地址解析服务预定义的第一解析接口处理所述通信地址解析请求,以获取包含标准地址文本及其相对应的解析信息的第一解析结果;
18.当所述第一解析结果包含所述解析信息时,将所述标准地址文本及所述解析信息对应所述录入地址文本存储于所述第一缓存区中。
19.可选的,当所述第一解析结果或所述第二解析结果包含所述录入地址文本的标准地址文本及其解析信息时,将其推送给所述用户,且作为数据记录存储于所述标准数据库中,所述解析信息包括所述标准地址文本相对应的邮政编码和/或经纬度,包括:
20.当所述第一解析结果指示解析失败时,从第三方通信地址解析服务相对应的第二缓存区中查询是否存在所述录入地址文本相对应的解析信息,当存在所述解析信息时,将所述解析信息推送给所述用户;
21.当所述第二缓存区不存在所述解析信息时,调用第三方通信地址解析服务预定义的第二解析接口处理所述通信地址解析请求,以获取第二解析结果;
22.当所述第二解析结果包含所述解析信息时,将所述标准地址文本与所述解析信息对应所述录入地址文本存储于所述第二缓存区中。
23.可选的,所述自建通信地址解析服务被实现为执行如下步骤:
24.从所述标准数据库中召回与所述录入地址文本相匹配的多个标准地址文本,构成候选列表;
25.调用所述神经网络模型,分别将所述候选列表中的每个标准地址文本与所述录入地址文本构造为输入信息,由该神经网络模型确定出该标准地址文本相对应的排序分值;
26.从所述候选列表中选取排序分值最高且超过预设阈值的标准地址文本作为所述录入地址文本相对应的正确文本;
27.根据所述正确文本确定其所指向的地理位置的经纬度和/或邮政编码;
28.将所述邮政编码和/或经纬度作为解析信息,返回所述正确文本相对应的标准地址文本及所述解析信息,作为第一解析结果返回。
29.可选的,所述神经网络模型执行如下步骤:
30.应用编码层将所述输入信息中的录入地址文本和标准地址文本分别编码为嵌入向量;
31.应用特征提取层为所述嵌入向量提取深层语义信息,获得相应的地址特征向量;
32.应用线性层计算所述地址特征向量之间的相似度,获得相似度向量;
33.应用分类器将所述相似度向量映射到预设的分类空间,获得其中正向类别相对应的分类概率作为所述输入信息中的标准地址文本的排序分值。
34.适应本技术的目的之一而提供的一种通信地址解析服务更新装置,包括:自建服务调用模块、三方服务调用模块、结果推送存储模块,以及定时训练更新模块,其中,所述自建服务调用模块,设置为响应用户提交的通信地址解析请求,调用自建通信地址解析服务预定义的第一解析接口处理所述通信地址解析请求,以获取自建通信地址解析服务应用神经网络模型后获得的第一解析结果,所述神经网络模型用于从标准数据库中确定所述请求中携带的录入地址文本相对应的标准地址文本,所述标准数据库存储多个标准地址文本;所述三方服务调用模块,设置为当所述第一解析结果指示解析失败时,调用第三方通信地址解析服务预定义的第二解析接口处理所述通信地址解析请求,以获取根据所述请求中携带的录入地址文本确定的第二解析结果;所述结果推送存储模块,设置为当所述第一解析结果或所述第二解析结果包含所述录入地址文本的标准地址文本及其解析信息时,将其推送给所述用户,且作为数据记录存储于所述标准数据库中,所述解析信息包括所述标准地址文本相对应的邮政编码和/或经纬度;所述定时训练更新模块,设置为响应定时任务触发事件,根据给定的地址样本应用所述神经网络模型确定其在标准数据库中的标准地址文本共同构成正样本,采用所述正样本对所述神经网络模型实施迭代训练,将其训练至收敛状态后重启服务。
35.适应本技术的目的之一而提供的一种计算机设备,包括中央处理器和存储器,所述中央处理器用于调用运行存储于所述存储器中的计算机程序以执行本技术所述的通信地址解析服务更新方法的步骤。
36.适应本技术的另一目的而提供的一种计算机可读存储介质,其以计算机可读指令的形式存储有依据所述的通信地址解析服务更新方法所实现的计算机程序,该计算机程序被计算机调用运行时,执行该方法所包括的步骤。
37.适应本技术的另一目的而提供的一种计算机程序产品,包括计算机程序/指令,该计算机程序/指令被处理器执行时实现本技术任意一种实施例中所述方法的步骤。
38.相对于现有技术,本技术优先将用户提交的通信地址解析请求交由自建通信地址服务进行处理,在自建通信地址服务未能获得对应的结果时,才将该通信地址解析请求交由第三方通信地址服务处理,尽量避免直接调用第三方通信地址服务以免产生高昂的解析成本,而且,对于第三方通信地址服务处理所述通信地址解析请求所产生的解析信息,由于具有权威性,因而会存储到标准数据库中再利用,可供本技术中的自建通信地址服务所采用的神经网络模型的训练和推理阶段使用,为其训练和推理过程召回多个标准地址文本,在训练阶段,利用这些召回的标准地址文本可以构造出神经网络模型训练所需的训练样本,在推理阶段,则可通过神经网络模型预测出各个标准地址文本相对应的排序分值进而确定其中的正确文本,以便依据正确文本获取其历史获得的解析信息返回给用户。由此可见,本技术能以较为低成本的方式,复用第三方数据,为电商平台提供高效精准的通信地址解析服务,并实现循环更新提升自建通信地址解析服务相对应的服务能力
附图说明
39.本技术上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中:
40.图1为本技术的通信地址解析服务更新方法在一个实施例中的流程示意图;
41.图2为本技术实施例中响应通信地址解析请求调用自建通信地址解析服务并缓存解析信息的过程的流程示意图;
42.图3为本技术实施例中当自建通信地址解析失败时的响应和缓存流程示意图;
43.图4为本技术实施例中自建通信地址解析服务工作过程的流程示意图;
44.图5为本技术示例性采用的神经网络模型的网络架构示意图;
45.图6为本技术所述神经网络模型的工作流程示意图;
46.图7为本技术的通信地址解析服务更新装置的原理框图;
47.图8为本技术所采用的一种计算机设备的结构示意图。
具体实施方式
48.下面详细描述本技术的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,仅用于解释本技术,而不能解释为对本技术的限制。
49.本技术领域技术人员可以理解,除非特意声明,这里使用的单数形式“一”、“一个”、“所述”和“该”也可包括复数形式。应该进一步理解的是,本技术的说明书中使用的措辞“包括”是指存在所述特征、整数、步骤、操作、元件和/或组件,但是并不排除存在或添加一个或多个其他特征、整数、步骤、操作、元件、组件和/或它们的组。应该理解,当我们称元件被“连接”或“耦接”到另一元件时,它可以直接连接或耦接到其他元件,或者也可以存在中间元件。此外,这里使用的“连接”或“耦接”可以包括无线连接或无线耦接。这里使用的措辞“和/或”包括一个或更多个相关联的列出项的全部或任一单元和全部组合。
50.本技术领域技术人员可以理解,除非另外定义,这里使用的所有术语(包括技术术语和科学术语),具有与本技术所属领域中的普通技术人员的一般理解相同的意义。还应该理解的是,诸如通用字典中定义的那些术语,应该被理解为具有与现有技术的上下文中的意义一致的意义,并且除非像这里一样被特定定义,否则不会用理想化或过于正式的含义来解释。
51.本技术领域技术人员可以理解,这里所使用的“客户端”、“终端”、“终端设备”既包括无线信号接收器的设备,其仅具备无发射能力的无线信号接收器的设备,又包括接收和发射硬件的设备,其具有能够在双向通信链路上,进行双向通信的接收和发射硬件的设备。这种设备可以包括:蜂窝或其他诸如个人计算机、平板电脑之类的通信设备,其具有单线路显示器或多线路显示器或没有多线路显示器的蜂窝或其他通信设备;pcs(personal communications service,个人通信系统),其可以组合语音、数据处理、传真和/或数据通信能力;pda(personal digital assistant,个人数字助理),其可以包括射频接收器、寻呼机、互联网/内联网访问、网络浏览器、记事本、日历和/或gps(global positioning system,全球定位系统)接收器;常规膝上型和/或掌上型计算机或其他设备,其具有和/或包括射频接收器的常规膝上型和/或掌上型计算机或其他设备。这里所使用的“客户端”、“终端”、“终端设备”可以是便携式、可运输、安装在交通工具(航空、海运和/或陆地)中的,或者适合于和/或配置为在本地运行,和/或以分布形式,运行在地球和/或空间的任何其他位置运行。这里所使用的“客户端”、“终端”、“终端设备”还可以是通信终端、上网终端、音乐/视频播放终端,例如可以是pda、mid(mobile internet device,移动互联网设备)和/或具有音乐/视频播放功能的移动电话,也可以是智能电视、机顶盒等设备。
52.本技术所称的“服务器”、“客户端”、“服务节点”等名称所指向的硬件,本质上是具备个人计算机等效能力的电子设备,为具有中央处理器(包括运算器和控制器)、存储器、输入设备以及输出设备等冯诺依曼原理所揭示的必要构件的硬件装置,计算机程序存储于其存储器中,中央处理器将存储在外存中的程序调入内存中运行,执行程序中的指令,与输入输出设备交互,借此完成特定的功能。
53.需要指出的是,本技术所称的“服务器”这一概念,同理也可扩展到适用于服务器机群的情况。依据本领域技术人员所理解的网络部署原理,所述各服务器应是逻辑上的划分,在物理空间上,这些服务器既可以是互相独立但可通过接口调用的,也可以是集成到一台物理计算机或一套计算机机群的。本领域技术人员应当理解这一变通,而不应以此约束本技术的网络部署方式的实施方式。
54.本技术的一个或数个技术特征,除非明文指定,既可部署于服务器实施而由客户端远程调用获取服务器提供的在线服务接口来实施访问,也可直接部署并运行于客户端来实施访问。
55.本技术中所引用或可能引用到的神经网络模型,除非明文指定,既可部署于远程服务器且在客户端实施远程调用,也可部署于设备能力胜任的客户端直接调用,某些实施例中,当其运行于客户端时,其相应的智能可通过迁移学习来获得,以便降低对客户端硬件运行资源的要求,避免过度占用客户端硬件运行资源。
56.本技术所涉及的各种数据,除非明文指定,既可远程存储于服务器,也可存储于本地终端设备,只要其适于被本技术的技术方案所调用即可。
57.本领域技术人员对此应当知晓:本技术的各种方法,虽然基于相同的概念而进行描述而使其彼此间呈现共通性,但是,除非特别说明,否则这些方法都是可以独立执行的。同理,对于本技术所揭示的各个实施例而言,均基于同一发明构思而提出,因此,对于相同表述的概念,以及尽管概念表述不同但仅是为了方便而适当变换的概念,应被等同理解。
58.本技术即将揭示的各个实施例,除非明文指出彼此之间的相互排斥关系,否则,各个实施例所涉的相关技术特征可以交叉结合而灵活构造出新的实施例,只要这种结合不背离本技术的创造精神且可满足现有技术中的需求或解决现有技术中的某方面的不足即可。对此变通,本领域技术人员应当知晓。
59.本技术的一种通信地址解析服务更新方法,可被编程为计算机程序产品,部署于客户端和/或服务器中运行而实现,例如在本技术的电商平台应用场景中可以实现于网站页面中,通过协调客户端与服务器之间的信息交互。
60.请参阅图1,本技术的通信地址解析服务更新方法在其一种实施例中,包括如下步骤:
61.步骤s1100、响应用户提交的通信地址解析请求,调用自建通信地址解析服务预定义的第一解析接口处理所述通信地址解析请求,以获取自建通信地址解析服务应用神经网
络模型后获得的第一解析结果,所述神经网络模型用于从标准数据库中确定所述请求中携带的录入地址文本相对应的标准地址文本,所述标准数据库存储多个标准地址文本;
62.示例性的电商平台应用场景中,本技术用于响应在各个独立站访问的用户提交的通信地址解析请求。所述用户可以是独立站的商家用户提交的,也可以是消费者用户提交的。所述独立站用于部署线上店铺,与其他独立站互不隶属,但可以访问部署了本技术的技术方案的计算机程序产品运行后提供的各种接口。本技术的服务器通常由电商平台服务方提供,以便在安装所述计算机程序产品后,运行自建通信地址解析服务,集中处理各个独立站转发过来的各种通信地址解析请求。
63.当消费者用户在独立站的线上店铺下单的过程中输入作为送货地址的地址文本时,该地址文本作为录入地址文本,被封装在通信地址解析请求中发送给本技术的服务器,以便请求服务器对所述录入地址文本进行解析,获得其相对应的邮政编码和/或经纬度,所述邮政编码可以用于补全送货地址所需的相关信息,所述经纬度可以用于在地图中定位目的地,以供相关用户参考。
64.同理,线上店铺的商家用户也可以触发所述的通信地址解析请求,以便在消费者用户提供的地址信息不全时,进一步修正相关地址信息,并且根据消费者用户的录入地址文本进一步确定邮政编码和/或经纬度,用于完善订单的物流处理环节所需的业务数据,使物流过程中相应的包裹更易分发和派送。
65.当服务器接收所述通信地址解析请求后,便可调用自建通信地址解析服务预定义的第一解析接口,由该第一解析接口处理该通信地址解析请求。一个实施例中,还可以根据服务器的自建通信地址解析服务的流量是否达到阈值而判断是否采用所述的第一解析接口处理所述的通信地址解析请求,当其未达到所述阈值时,默认采用所述第一解析接口处理所述的通信地址解析请求;当其达到所述阈值之后,便可调用第三方通信地址解析服务预定的第二解析接口用于处理所述的通信地址解析请求。
66.当默认调用所述第一解析接口对所述通信地址解析请求进行处理之后,由自建通信地址解析服务获取所述通信地址解析请求中携带的录入地址文本,调用一个预训练至收敛状态的神经网络模型对该录入地址文本进行修正,以获得其对应的标准地址文本,然后再根据该标准地址文本查询确定出其相对应的邮政编码和/或经纬度,其中,邮政编码和/或经纬度便是所述录入地址文本相对应的解析信息,将该标准地址文本关联所述解析信息封装为第一解析结果,返回给调用方,调用方用户便获得了所述的录入地址文本相对应的解析信息。
67.所述的神经网络模型被实现为用于根据给定的两个地址文本,通常包括一个所述的录入地址文本和一个所述的标准地址文本,根据该两个地址文本的深层语义信息预测出两者之间的相似度作为排序分值。将多个这样的标准地址文本分别关联所述录入地址文本构成多个地址对,将每个地址对输入所述神经网络模型中确定出其相对应的排序分值,最终自建通信地址解析服务便可确定其中排序分值最高所对应的标准地址文本即是所述录入地址文本的正确文本,因而,根据标准地址文本所查询确定的解析信息是正确的。
68.所述的标准地址文本,可以根据所述录入地址文本从一个标准数据库中召回以便进一步输入所述神经网络模型中进行排序分值的确定。至于召回的策略,可以是召回标准数据库中的全量标准地址文本,也可以是基于规则匹配或者编辑距离相近匹配等任意方式
确定其中部分标准地址文本,总之,通过应用召回策略,可以获得一个召回地址集,该召回地址集是标准地址库的一个子集,后续可针对召回地址集中的各个标准地址文本适用所述神经网络模型确定其中各个标准地址文本的排序分值。据此不难理解,粗召回的标准地址文本与所述录入地址文本的关联度是不够精确的,而采用本技术的神经网络模型为每个标准地址文本确定其相应的排序分值,可以更精确表示出标准地址文本与所述录入地址文本之间的关联程度,据此确定相应的标准地址文本作为所述录入地址文本的正确文本用于获取相应的解析信息,更为准确。
69.所述的标准数据库,可以包括多个标准地址文本,其中的标准地址文本在一个实施例中可以是借助第三方通信地址解析服务响应海量用户提交的通信地址解析请求后获得相应的标准地址文本和解析信息,并将这些历史的标准地址文本和解析信息存储沉淀下来的库存。由于第三方通信地址解析服务的解析结果,即其所确定的标准地址文本和解析信息具有权威性,因而,将其存储于标准数据库中,在自建通信地址解析服务需要提供具体解析服务时,供录入地址文本做召回之用,可以有效降低对第三方通信地址解析服务的高频使用。
70.当然,自建通信地址解析服务可能未能从所述标准数据库中召回任何标准地址文本,或者,虽然召回了部分标准地址文本,但经逐一与所述录入地址文本组成地址对交由所述神经网络模型确定排序分值之后,各个排序分值均未能超过预设阈值,这种情况下,意味着自建通信地址解析服务未能为所述录入地址文本提供有效的解析信息,因而可以返回空值或者其他特定标识符作为第一解析结果,用于指示解析失败。
71.步骤s1200、当所述第一解析结果指示解析失败时,调用第三方通信地址解析服务预定义的第二解析接口处理所述通信地址解析请求,以获取根据所述请求中携带的录入地址文本确定的第二解析结果;
72.当所述第一解析结果指示自建通信地址解析服务对所述录入地址文本的解析失败时,便可调用第三方通信地址解析服务预定的第二解析接口处理所述通信地址解析请求,具体可将所述通信地址解析请求中携带的所述录入地址文本传参给该第二解析接口即可,然后等候该第二解析接口返回的第二解析结果。
73.第三方通信地址解析服务是标准化且公知的第三方服务,其所实现的功能是根据所述第二解析接口的调用方提供的录入地址文本,确定出其正确表述的标准地址文本及其相应的邮政编码和/或经纬度,对于本技术来说,只要调用了所述第二解析接口,便可预期获得相应的第二解析结果。至于第三方通信地址解析服务的具体实现,由第三方灵活设定即可,不影响本技术创造精神的体现。
74.步骤s1300、当所述第一解析结果或所述第二解析结果包含所述录入地址文本的标准地址文本及其解析信息时,将其推送给所述用户,且作为数据记录存储于所述标准数据库中,所述解析信息包括所述标准地址文本相对应的邮政编码和/或经纬度;
75.无论是默认采用自建通信地址解析服务用于处理通信地址解析请求,还是在自建通信地址解析服务解析失败后调用第三方通信地址解析服务用于处理通信地址解析请求,最终均会获得相应的解析结果,即所述的第一解析结果或所述的第二解析结果。因而,可以对最终获得的解析结果进行识别,如果其中返回了标准地址文本及其解析信息,即邮政编码和/或经纬度时,便可确认针对录入地址文本的解析成功,由此可将其推送给提交所述通
信地址解析请求的用户作为应答。由此可见,自建通信地址解析服务与第三方通信地址解析服务相配合,可以由自建通信地址解析服务复用第三方能脸庞地址解析服务产生的历史数据,避免频繁调用第三方通信地址解析服务提供的第二解析接口,而提供更快速、更低成本的地址解析服务。
76.另一方面,如前所述,由于最终确定的标准地址文本及其解析结果具有权威性,因而,可以将其存储到所述的标准数据库中以供自建通信地址解析服务调用。一个实施例中,对于第一解析结果所包含的标准地址文本及其解析信息来说,由于其取之标准数据库,因而,将其存储到标准数据库实际上便是替换旧有的数据记录,因而,也可无需针对第一解析结果进行存储操作。也即,重点在于将第二解析结果中的标准地址文本及其邮政编码和/或经纬度存储到所述的标准数据库中,必要时,还可在存储过程中对相同数据记录进行去重处理,或者对于已经存在相同数据记录的解析结果,可以无需做存储处理。
77.步骤s1400、响应定时任务触发事件,根据给定的地址样本应用所述神经网络模型确定其在标准数据库中的标准地址文本共同构成正样本,采用所述正样本对所述神经网络模型实施迭代训练,将其训练至收敛状态后重启服务。
78.如前所述,第三方通信地址解析服务所产生的历史数据存储于所述标准数据库中,标准数据库中的标准地址文本可以为自建通信地址解析服务提供召回源,除此之外,标准数据库中的标准地址文本还可以用于实施对本技术的所述的神经网络模型的训练,做到高度复用第三方通信地址解析服务产生的解析结果,提高对第三方通信地址解析服务付费的边际收益,有效降低每次响应通信地址解析请求的边际成本。
79.对所述神经网络模型的训练可以定期进行,因而,可以预设定时任务,例如每半年一次,或者自标准数据库最后一次全量更新之日起计达到既定周期,即可触发相应的定时任务触发事件,指示执行对所述神经网络模型的训练。
80.在实施训练之前,先获得一个地址样本列表,其中提供部分地址样本,然后,针对每个地址样本,调用已训练的所述神经网络模型,按照如前所述的方式,确定其标准地址文本,然后将该地址样本与其相应的标准地址文本构造为正样本,此外,也可将该地址文本与标准数据库中的其他标准地址文本共同构造为负样本,每个地址样本均可构造出其相应的正样本和负样本,由此,所述正样本和负样本均可作为训练样本组合构成一个训练数据集,可以采用这一训练数据集中的任意训练样本对所述神经网络模型实施再训练。
81.对所述神经网络模型的训练,可先从所述训练数据集中调用单个训练样本输入该神经网络模型,由该神经网络模型对该训练样本中的两个地址文本即所述的地址样本及其相关联的标准地址文本进行编码获得相应的嵌入向量,然后在各路嵌入向量的基础上提取其深层语义信息,再在彼此的深层语义信息的基础上计算两者的相似度,获得相似度向量,最后将相似度向量经分类器映射,然后适应所述训练样本为正样本或负样本而计算分类器的分类结果的损失值,在损失值未达到预设阈值或在迭代次数未到达预设次数时,修正所述神经网络模型的权重,继续从训练数据集中调用下一训练样本对所述神经网络模型实施迭代训练,直至所述损失值达到所述预设阈值或迭代次数达到所述预设次数时,即可判定所述神经网络模型达到收敛状态,便可终止对所述神经网络模型的再训练。
82.所述分类器中的分类结果,包括分类器所设定的分类空间的各个类别相对应的置信度,以概率值表示,其中一个类别被设定为正向类别,当该正向类别为最高置信度,表征
将所输入的训练样本识别为正样本,否则,所输入的训练样本被识别为负样本。因而,在计算损失值时,根据这一原则计算即可。后续在应用神经网络模型的分类结果时,不难理解,该正向类别所获得的置信度,便可直接确定为相应的地址对中的标准地址文本所获得的排序分值。
83.所述神经网络模型经过一段时间积累的历史标准地址文本的训练后,由于标准数据库中经过该段时间积累了更多的历史数据,实际上便等同于扩大了神经网络模型训练所需的训练数据的规模,因而,对神经网络模型的再训练,可以提升神经网络模型的泛化能力,提升其确定排序分值的准确度。可见,本技术不仅实现了对第三方通信地址解析服务所产生的历史数据的复用,而且可以通过持续循环更新机制,使自建通信地址解析服务中的神经网络模型确定排序分值的准确度得到不断的提升,从而持续提升整个自建通信地址解析服务的服务能力。
84.根据以上实施例可知,本技术优先将用户提交的通信地址解析请求交由自建通信地址服务进行处理,在自建通信地址服务未能获得对应的结果时,才将该通信地址解析请求交由第三方通信地址服务处理,尽量避免直接调用第三方通信地址服务以免产生高昂的解析成本,而且,对于第三方通信地址服务处理所述通信地址解析请求所产生的解析信息,由于具有权威性,因而会存储到标准数据库中再利用,可供本技术中的自建通信地址服务所采用的神经网络模型的训练和推理阶段使用,为其训练和推理过程召回多个标准地址文本,在训练阶段,利用这些召回的标准地址文本可以构造出神经网络模型训练所需的训练样本,在推理阶段,则可通过神经网络模型预测出各个标准地址文本相对应的排序分值进而确定其中的正确文本,以便依据正确文本获取其历史获得的解析信息返回给用户。由此可见,本技术能以较为低成本的方式,复用第三方数据,为电商平台提供高效精准的通信地址解析服务,并实现循环更新提升自建通信地址解析服务相对应的服务能力。
85.在本技术任意实施例的基础上,响应定时任务触发事件之前,包括:判断所述标准数据库自最后一次全量更新之后是否达到既定周期,当达到既定周期时,遍历所述标准数据库中的各个数据记录,以每个数据记录中的标准地址文本为传参,调用第二解析接口获取并更新所述数据记录中与所述标准地址文本相对应的解析信息。
86.考虑到各国行政区划动态变化以及其他信息更新因素导致第三方通信地址解析服务的权威信息产生变化的情况,可以定期对本技术的标准数据库中的全部数据进行定期全量更新,每次全量更新后标记其更新时间,初始的全量更新时间可设置为标准数据库的创建时间,由此,通过定期全量更新,适应第三方通信地址解析服务的最新信息变化,使自建通信地址解析服务所获得的解析结果尽量与第三方通信地址解析服务的真实结果相同步。
87.为此,先于响应定时任务触发事件的步骤,可以先判断所述标准数据库最后一次全量更新之后是否到达既定周期,例如半年,当达到既定周期后,便可针对标准数据库中的每条数据记录中的标准地址文本做全量更新,将每个标准地址文本作为传参调用第三方通信地址解析服务的第二解析接口,通过第二解析接口获取与所述标准地址文本最新的标准地址文本及其相应的解析信息,然后,对于相对于标准数据库中相应的历史数据记录发生变动的数据,可以最新的标准地址文本及其相应的解析信息替换该历史数据记录。
88.根据以上实施例可以看出,经过定期对标准数据库进行遍历更新,使历史沉淀的
全部标准地址文本及其相应的解析信息都能够得到及时的更新,确保为用户提供最准确最及时的通信地址解析服务。
89.在本技术任意实施例的基础上,请参阅图2,响应用户提交的通信地址解析请求,调用自建通信地址解析服务预定义的第一解析接口处理所述通信地址解析请求,以获取自建通信地址解析服务应用神经网络模型后获得的第一解析结果,所述神经网络模型用于从标准数据库中确定所述请求中携带的录入地址文本相对应的标准地址文本,所述标准数据库存储多个标准地址文本,包括:
90.步骤s1110、响应用户提交的通信地址解析请求,获取所述通信地址解析请求中的录入地址文本;
91.当用户提交所述通信地址解析请求并被服务器接收后,由服务器解析该请求而提取出其中携带的录入地址文本,所述的录入地址文本可能包括用于表示各级行政区划的前缀信息以及用于表示用户具体详情地址的后缀信息,一个实施例中,可以仅针对所述前缀信息进行处理,因而,可将所述前缀信息直接作为所述的录入地址文本,而对于后缀信息,由用户自行确定即可。
92.步骤s1120、从自建通信地址解析服务相对应的第一缓存区中查询是否存在所述录入地址文本相对应的解析信息,当存在所述解析信息时,将所述解析信息推送给所述用户;
93.本实施例中,所述自建通信地址解析服务对应预设一个第一缓存区,用于缓存其响应任意通信地址解析请求后所获得的第一解析结果,将每个通信地址解析请求的录入地址文本与其相应的第一解析结果缓存到第一缓存区中,由此,当响应一个通信地址解析请求时,首先根据该通信地址解析请求所携带的录入地址文本在第一缓存区中进行查询,如果存在该录入地址文本相对应的第一解析结果,具体是确认存在第一解析结果中的解析信息,即邮政编码和/或经纬度,当存在相应的解析信息时,便可直接将所述解析信息推送给提交所述通信地址解析请求的用户,完成解析服务,无需再继续其他步骤。
94.步骤s1130、当所述第一缓存区不存在所述解析信息时,调用自建通信地址解析服务预定义的第一解析接口处理所述通信地址解析请求,以获取包含标准地址文本及其相对应的解析信息的第一解析结果;
95.如果经查询之后确认第一缓存区不存在所述录入地址文本相对应的解析信息,此时,便可按照如前步骤s1100所说明的过程,调用自建通信地址解析服务的第一解析接口处理所述通信地址解析请求,以期获得相应的第一解析结果。其后续过程可同于前文实施例所揭示。
96.步骤s1140、当所述第一解析结果包含所述解析信息时,将所述标准地址文本及所述解析信息对应所述录入地址文本存储于所述第一缓存区中。
97.需要指出的是,当通过步骤s1130调用自建通信地址解析服务获得相应的第一解析结果后,便可将其关联所述录入地址文本存储到所述的第一缓存区中,从而实现将录入地址文本、标准地址文本以及相应的解析信息进行关联缓存,以备后续查询。
98.根据以上实施例,自建通信地址解析服务可通过其第一缓存区提供更快速的解析服务,避免服务器高负荷运转,降低运算量,取得规模化效用所带来的经济收益。
99.在本技术任意实施例的基础上,请参阅图3,当所述第一解析结果或所述第二解析
结果包含所述录入地址文本的标准地址文本及其解析信息时,将其推送给所述用户,且作为数据记录存储于所述标准数据库中,所述解析信息包括所述标准地址文本相对应的邮政编码和/或经纬度,包括:
100.步骤s1210、当所述第一解析结果指示解析失败时,从第三方通信地址解析服务相对应的第二缓存区中查询是否存在所述录入地址文本相对应的解析信息,当存在所述解析信息时,将所述解析信息推送给所述用户;
101.与前一实施例同理,本技术对应所述第三方通信地址解析服务所返回的第二解析结果,也预设有一个第二缓存区,用于缓存各个第二解析结果。由此,当自建通信地址解析服务返回的第一解析结果中指示解析失败时,先从第二缓存区中查询其中是否包含与所述录入地址文本相对应的解析信息,当存在所述解析信息时,便可直接调用该解析信息,将其返回给提交所述通信地址解析请求的用户,从而可以节省对第二解析接口的调用,且能更迅速地为用户获取结果。
102.步骤s1220、当所述第二缓存区不存在所述解析信息时,调用第三方通信地址解析服务预定义的第二解析接口处理所述通信地址解析请求,以获取第二解析结果;
103.与前一实施例同理,如果经查询之后确认第二缓存区不存在所述录入地址文本相对应的解析信息,此时,便可按照如前步骤s1200所说明的过程,调用第三方通信地址解析服务的第二解析接口处理所述通信地址解析请求,以期获得相应的第二解析结果。其后续过程可同于前文实施例所揭示。
104.步骤s1230、当所述第二解析结果包含所述解析信息时,将所述标准地址文本与所述解析信息对应所述录入地址文本存储于所述第二缓存区中。
105.需要指出的是,当通过步骤s1220调用第三通信地址解析服务获得相应的第二解析结果后,便可将其关联所述录入地址文本存储到所述的第一缓存区中,从而实现将录入地址文本、标准地址文本以及相应的解析信息进行关联缓存,以备后续查询。
106.根据以上实施例,第三方通信地址解析服务所获得的第二解析结果被关联录入地址文本存储于第二缓存区中,可通过其第二缓存区提供更快速的解析服务,可以有效降低对第二解析接口的频繁调用,取得规模化效用所带来的经济收益。
107.在本技术任意实施例的基础上,请参阅图4,所述自建通信地址解析服务被实现为执行如下步骤:
108.步骤s2100、从所述标准数据库中召回与所述录入地址文本相匹配的多个标准地址文本,构成候选列表;
109.自建通信地址解析服务在响应一个通信地址解析请求时,先通过其第一解析接口的传参获得所述请求中的录入地址文本,然后,可以对所述录入地址文本采用分词算法进行分词,获得其分词序列,将其转换为分词向量,同理,所述标准数据库中的各个标准地址文本也可预先通过采用相同的分词算法进行分词而预先获得其分词向量。由此,利用所述录入地址文本的分词向量计算其与标准数据库中的各个标准地址文本的分词向量之间的数据距离,可以对应确定各个标准地址文本的距离数值,该距离数值表征相应的标准地址文本的分词向量与该录入地址文本的分词向量之间的语义接近程度,据此,采用一个预设阈值,将距离数值高于该预设阈值的标准地址文本筛选出来,构造为候选列表,该候选列表实际上便是对应所述录入地址文本从标准数据库中粗召回所得到的召回地址集。
110.步骤s2200、调用所述神经网络模型,分别将所述候选列表中的每个标准地址文本与所述录入地址文本构造为输入信息,由该神经网络模型确定出该标准地址文本相对应的排序分值;
111.根据前文介绍的本技术的神经网络模型的功能可知,其适于为一个地址对确定出其中的两个地址文本映射到正向类别的置信度,当两个地址文本是录入地址文本及一个标准地址文本时,所述的置信度可以用于表征该标准地址文本的排序分值。因此,针对所述候选列表,可以将其中的每个标准地址文本与所述录入地址文本构造为地址对,然后,将地址对作为输入信息,输入所述神经网络模型中,由该神经网络模型确定出其相应的排序分值,将该排序分值关联该地址对中的标准地址文本进行存储以备后用。由此可知,所述候选列表中的每个标准地址文本,均可获得其相对应的排序分值。
112.步骤s2300、从所述候选列表中选取排序分值最高且超过预设阈值的标准地址文本作为所述录入地址文本相对应的正确文本;
113.对于所述候选列表中的各个标准地址文本,如果其所获得的排序分值最高,则理论上该标准地址文本是相对而言最接近于所述录入地址文本的,但是,该标准地址文本在所述神经网络模型所映射的正向类别中所取得的置信度也即所述排序分值的高低,本身也表征了该标准地址文本与所述录入地址文本在何种程度上相接近,因而,为确定为所述录入地址文本确定出正确的标准地址文本,可以提供一个预设阈值,该预设阈值可以是经验阈值或实验阈值,然后,将所述候选列表中的最高排序分值与所述预设阈值相比较,只有该最高排序分值高于所述预设阈值时,才将该最高排序分值相对应的标准地址文本确定为所述录入地址文本的正确文本。应用这一机制,实际上是将用户提交的录入地址文本校正为具有权威性的标准地址文本。
114.步骤s2400、根据所述正确文本确定其所指向的地理位置的经纬度和/或邮政编码;
115.适应从标准地址文本到相应的解析信息之间的映射关系,预先存在一个解析库,该解析库中用于存储各国行政区划到其相应的经纬度和/或邮政编码之间的映射关系,据此,当一个标准地址文本被确认为录入地址文本的正确文本之后,便可根据该正确文本查询所述解析库,利用映射关系,确定出所述正确文本相对应的经纬度和/或邮政编码。
116.步骤s2500、将所述邮政编码和/或经纬度作为解析信息,返回所述正确文本相对应的标准地址文本及所述解析信息,作为第一解析结果返回。
117.获得所述录入地址文本的正确文本相对应的邮政编码和/或经纬度后,将其封装为解析信息,与所述正确文本相对应的标准地址文本相关联,例如构造为键值对,将其作为第一解析结果返回即可。
118.根据以上实施例可知,本技术的自建通信地址解析服务能够实现对标准数据库的有效利用,先从标准数据库中粗召回获得一个存储标准地址文本的候选列表,再利用神经网络模型确定候选列表中各个标准地址文本的排序分值,将其中超过预设阈值的最高排序分值相对应的标准地址文本确定为所述录入地址文本的正确文本,据此查询确定其解析信息,整个业务过程均无需直接依赖第三方通信地址解析服务,却能利用本地资源更迅速地获得录入地址文本的解析信息,处理效率高,处理成本低。
119.在本技术任意实施例的基础上,请参阅图5所示的网络架构,根据图5可知,所述神
经网络模型被架构为双塔模型,即包含两个处理支路,每个处理支路均包含完全相同的网络结构,每个处理支路中,沿输入至输出的方向,包括编码层和特征提取层,然后,将两个处理支路的输出分别接入线性层进行语义相似度的计算,最后再将相似度向量输入分类器,在分类器中确定出排序分值。
120.进一步结合图6所示的流程图,图5的示例性神经网络模型执行如下步骤:
121.步骤s3100、应用编码层将所述输入信息中的录入地址文本和标准地址文本分别编码为嵌入向量;
122.首先,对于需要进行编码的两个地址文本,例如录入地址文本及标准地址文本,将两个地址文本分别输入所述神经网络模型的两个支路中,先进入各个支路的编码层进行编码,通过编码,获得每个地址文本相对应的多个嵌入向量。
123.在每个支路的编码层中,针对每个地址文本,对其进行两种粒度的分词,具体示例,可采用n-gram算法,分别将n设置为二元和三元,相当于实现两个以不同粒度分词的分词器,由该两个分词器对同一地址文本进行并行的分词处理,由此获得二元和三元相对应的分词序列。其中二元分词序列是以每次2个字符为滑动窗口长度对所述地址文本进行滑动取词获得的分词集合,三元分词序列则是以每次3个字符为滑动窗口长度对所述地址文本进行滑动取词获得的分词集合。
124.可见,针对需要计算语义相似度的两个地址文本,彼此均可并行进行分词序列的构造,并且,针对其中每一个地址文本,也是并行地进行不同粒度的分词序列的构造。
125.针对所述两个地址文本中的每个地址文本,通过分词已经获得多个分词序列,例如所述的二元分词序列和三元分词序列,据此,针对每个分词序列,通过引用预设的参考词表,查询该分词序列中的每个分词的编码数值,按照各个分词在其相应的分词序列中的对应位置,将所有分词的编码数值有序构造为一个嵌入向量,便实现对该分词序列的词嵌入。由此可见,根据如前示例,所述两个地址文本中,每个地址文本均可获得其相应的二元嵌入向量和三元嵌入向量。
126.根据本步骤可知,在对需要计算彼此之间的语义相似度的两个地址文本即所述的录入标准文本及所述候选列表中的任意一个标准地址文本计算语义相似度之前的向量化过程中,先对每个地址文本同步进行不同粒度的分词获得其多个嵌入向量,通过不同粒度的分词更精准地实现对地址文本的语义表达,例如,对于“广东省广州市黄埔区”,通过二元分词可以获得分词序列为[广东;东省;省广;广州;州市;市黄;黄埔;埔区],而通过三元分词可以获得分词序列为[广东省;东省广;省广州;广州市;州市黄;市黄埔;黄埔区],由此可见,二元分词序列中的分词[广东;广州;黄埔]可以起到精准表示地址的作用,三元分词序列中的分词[广东省;广州市;黄埔区]也可以起到精准表示地址的作用,可见,不同粒度的分词更能精准发现地址信息的各种可能表达,为后续进行语义挖掘提供必要的信息化基础,以使语义相似度的确定更为精准。
[0127]
步骤s3200、应用特征提取层为所述嵌入向量提取深层语义信息,获得相应的地址特征向量;
[0128]
在每个处理支路的编码层均获得其相应的地址文本的全部嵌入向量后,便可将全部嵌入向量输入其所在的处理支路的特征提取层以便构造出相应的地址特征向量。
[0129]
一种实施例中,所述特征提取层中可以包括两个模块以及一个拼接层,即注意力
层模块和池化操作模块,所述注意力层模块用于确定出以每个嵌入向量为查询向量相对应的关键特征向量,所述池化操作模块用于确定出每个嵌入向量的压缩特征向量,然后通过所述拼接层对全部关键特征向量和全部压缩特征向量进行拼接,从而获得相应的地址文本的地址特征向量。
[0130]
对于的所述特征提取器中,一种实施例中,可以按照如下过程工作以确定出各个嵌入向量相对应的关键特征向量:
[0131]
第一步,对于每个地址文本的全部嵌入向量,轮流将其中每个嵌入向量作为查询向量,同时将其余嵌入向量作为键向量和值向量,输入注意力层中执行注意力运算,获得其中各个嵌入向量相对应的关键特征向量:
[0132]
为了实现更为深层的语义挖掘,利用注意力层为每个地址文本的全部嵌入向量执行注意力运算,以获得相应的地址特征向量。
[0133]
注意力运算的机制是使用给定的查询向量从给定的键向量中查询出其中的关键权重信息,然后在所述关键权重信息的归一化结果的基础上从所述值向量中提取出关键特征向量。
[0134]
根据这一机制,本实施例中,对于每个地址文本的全部嵌入向量来说,确定其中的第一嵌入向量为查询向量,其他嵌入向量为键向量和值向量,然后查询出其第一嵌入向量相对应的第一关键特征向量。针对其中的每个嵌入向量,都轮流作为第一嵌入向量与其他嵌入向量做所述的注意力运算,由此,同一地址文本中的每个嵌入向量均可获得以其为查询向量相应确定的关键特征向量,因而,同一地址文本可以获得多个关键特征向量。例如,针对同一地址文本中的所述二元嵌入向量和三元嵌入向量,便可相应获得两个关键特征向量。
[0135]
本实施例中,逐一针对同一地址文本中的每个嵌入向量都确定其相应的关键特征向量,是为了实现不同嵌入向量之间的相互查询,确保最终获得的关键特征向量集合不会遗漏地址文本中的关键语义信息。
[0136]
不难理解,根据本步骤,每个地址文本均能获得其相应的关键特征向量集合,即每个地址文本均有与其嵌入向量数量相对应的多个关键特征向量。
[0137]
第二步,对每个地址文本的全部嵌入向量分别执行池化操作后拼接,获得其中各个嵌入向量相对应的压缩特征向量:
[0138]
尽管第一步骤能够挖掘出地址文本的深层语义,但地址文本的全部嵌入向量本身具有原始语义,也可在确定语义相似度时加以利用。据此,可以通过与前一步骤并行执行本步骤,采用所述的池化层对每个地址文本的全部嵌入向量分别执行池化操作,实现对各个嵌入向量的压缩,从而获得各个嵌入向量相对应的压缩特征向量,由此可见,每个地址文本的每个嵌入向量均会被进行特征压缩而获得其相应的压缩特征向量。所述压缩特征向量虽然维数更少,但其表示的语义相对原始,对于同一地址文本来说,该地址文本的压缩特征向量与该地址文本的关键特征向量刚好互为补充,相得益彰。
[0139]
第三步,对于每个地址文本,将其所有关键特征向量及所有压缩特征向量拼接为地址特征向量:
[0140]
为了简化对每个地址文本的特征表示,可采用所述的拼接层将每个地址文本相对应的全部关键特征向量及全部压缩特征向量进行前后拼接,其拼接顺序遵守统一的预设顺
序即可,由此便可获得该地址文本相对应的地址特征向量。
[0141]
根据以上过程不难理解,借助注意力层对每个地址文本的嵌入向量进行深度且全面的深层语义挖掘获得相应的关键特征向量,再结合对所述嵌入向量压缩获得的承载地址文本的原始语义的压缩特征向量,由关键特征向量和压缩特征向量共同构成地址文本的地址特征向量,可实现对地址文本的有效全面且精准的特征表示,为准确计算不同地址文本之间的语义相似度提供了可靠的信息基础。
[0142]
步骤s3300、应用线性层计算所述地址特征向量之间的相似度,获得相似度向量;
[0143]
当两个支路分别获得其相应输入的地址文本的地址特征向量之后,两个地址特征向量被输入所述神经网络模型的线性层中,由所述的线性层执行相似度运算,计算出两个地址特征向量之间的语义相似度,其可表示为一个相似度向量。
[0144]
具体而言,在确定所述两个地址文本各自相应的地址特征向量的基础上,便可通过线性层应用预设的任意一种数据距离算法用于计算它们之间的语义相似度。所述的数据距离算法,可为任意可用的数据距离算法,包括但不限于如下任意一种:余弦相似度算法、向量点积算法、欧氏距离算法、皮尔逊相关系数等。通过采用任意一种数据距离算法计算出所述两个地址文本之间的数据距离,即可转换为相应的语义相似度。至此可知,每个标准地址文本相对应的语义相似度,表征该标准地址文本与所述录入地址文本之间的语义关联程度,语义相似度越高,则两者的文本内容越一致,反之,语义相似度越低,则两者的文本内容越不一致。
[0145]
步骤s3400、应用分类器将所述相似度向量映射到预设的分类空间,获得其中正向类别相对应的分类概率作为所述输入信息中的标准地址文本的排序分值。
[0146]
最后,将所述相似度向量输入所述神经网络模型的分类器中,在该分类器中,先采用一个全连接层对所述相似度向量进行全连接后分类映射到输出层,由输出层应用softmax函数计算出所述相似度向量映射到预设的分类空间的各个类别的分类概率,然后将其中属于正向类别的分类概率直接作为输入信息的所述标准地址文本相对应的排序分值即可。
[0147]
所述分类空间中的正向类别,是指在对所述神经网络模型训练的过程中,被用于对应正样本的类别。所述的分类器可以是多分类器也可以是二分类器,但在训练阶段指定一个类别为正向类别,对应采用正样本监督其结果,而在推理阶段,相应采用该正向类别的分类概率用于表示排序分值。
[0148]
根据以上实施例,采用本技术的神经网络模型用于实现对所述录入地址文本与任意一个标准地址文本的排序分值的计算,更为快速,可以服务于大量请求,从而提升地址联想的服务效率。
[0149]
此外,本技术的神经网络模型在编码阶段采用了不同粒度的分词方式对地址文本进行分词可以获得更为丰富的原始语义,后续又通过深层语义挖掘获得地址特征向量,丰富的语义表示能力可有效防止过拟合,可以使整个神经网络模型更易训练至收敛,节约训练成本,提升训练效率。
[0150]
请参阅图7,适应本技术的目的之一而提供的一种通信地址解析服务更新装置,是对本技术的通信地址解析服务更新方法的功能化体现,该装置包括:自建服务调用模块1100、三方服务调用模块1200、结果推送存储模块1300,以及定时训练更新模块1400,其中,
所述自建服务调用模块1100,设置为响应用户提交的通信地址解析请求,调用自建通信地址解析服务预定义的第一解析接口处理所述通信地址解析请求,以获取自建通信地址解析服务应用神经网络模型后获得的第一解析结果,所述神经网络模型用于从标准数据库中确定所述请求中携带的录入地址文本相对应的标准地址文本,所述标准数据库存储多个标准地址文本;所述三方服务调用模块1200,设置为当所述第一解析结果指示解析失败时,调用第三方通信地址解析服务预定义的第二解析接口处理所述通信地址解析请求,以获取根据所述请求中携带的录入地址文本确定的第二解析结果;所述结果推送存储模块1300,设置为当所述第一解析结果或所述第二解析结果包含所述录入地址文本的标准地址文本及其解析信息时,将其推送给所述用户,且作为数据记录存储于所述标准数据库中,所述解析信息包括所述标准地址文本相对应的邮政编码和/或经纬度;所述定时训练更新模块1400,设置为响应定时任务触发事件,根据给定的地址样本应用所述神经网络模型确定其在标准数据库中的标准地址文本共同构成正样本,采用所述正样本对所述神经网络模型实施迭代训练,将其训练至收敛状态后重启服务。
[0151]
在本技术任意实施例的基础上,先于所述定时训练更新模块1400,包括:全量更新决策模块,设置为判断所述标准数据库自最后一次全量更新之后是否达到既定周期,当达到既定周期时,遍历所述标准数据库中的各个数据记录,以每个数据记录中的标准地址文本为传参,调用第二解析接口获取并更新所述数据记录中与所述标准地址文本相对应的解析信息。
[0152]
在本技术任意实施例的基础上,所述自建服务调用模块1100,包括:请求响应解析单元,设置为响应用户提交的通信地址解析请求,获取所述通信地址解析请求中的录入地址文本;第一缓存查询单元,设置为从自建通信地址解析服务相对应的第一缓存区中查询是否存在所述录入地址文本相对应的解析信息,当存在所述解析信息时,将所述解析信息推送给所述用户;自建服务执行单元,设置为当所述第一缓存区不存在所述解析信息时,调用自建通信地址解析服务预定义的第一解析接口处理所述通信地址解析请求,以获取包含标准地址文本及其相对应的解析信息的第一解析结果;第一缓存存储单元,设置为当所述第一解析结果包含所述解析信息时,将所述标准地址文本及所述解析信息对应所述录入地址文本存储于所述第一缓存区中。
[0153]
在本技术任意实施例的基础上,所述三方服务调用模块1200,包括:第二缓存查询单元,设置为当所述第一解析结果指示解析失败时,从第三方通信地址解析服务相对应的第二缓存区中查询是否存在所述录入地址文本相对应的解析信息,当存在所述解析信息时,将所述解析信息推送给所述用户;三方服务执行单元,设置为当所述第二缓存区不存在所述解析信息时,调用第三方通信地址解析服务预定义的第二解析接口处理所述通信地址解析请求,以获取第二解析结果;第二缓存存储单元,设置为当所述第二解析结果包含所述解析信息时,将所述标准地址文本与所述解析信息对应所述录入地址文本存储于所述第二缓存区中。
[0154]
在本技术任意实施例的基础上,所述自建通信地址解析服务被构造为包括:数据召回模块,设置为从所述标准数据库中召回与所述录入地址文本相匹配的多个标准地址文本,构成候选列表;分值推理模块,设置为调用所述神经网络模型,分别将所述候选列表中的每个标准地址文本与所述录入地址文本构造为输入信息,由该神经网络模型确定出该标
准地址文本相对应的排序分值;正本确定模块,设置为从所述候选列表中选取排序分值最高且超过预设阈值的标准地址文本作为所述录入地址文本相对应的正确文本;解析执行模块,设置为根据所述正确文本确定其所指向的地理位置的经纬度和/或邮政编码;结果返回模块,设置为将所述邮政编码和/或经纬度作为解析信息,返回所述正确文本相对应的标准地址文本及所述解析信息,作为第一解析结果返回。
[0155]
在本技术任意实施例的基础上,所述神经网络模型在运行时构造出如下模块:编码处理模块,设置为应用编码层将所述输入信息中的录入地址文本和标准地址文本分别编码为嵌入向量;特征提取模块,设置为应用特征提取层为所述嵌入向量提取深层语义信息,获得相应的地址特征向量;相似计算模块,设置为应用线性层计算所述地址特征向量之间的相似度,获得相似度向量;分类映射模块,设置为应用分类器将所述相似度向量映射到预设的分类空间,获得其中正向类别相对应的分类概率作为所述输入信息中的标准地址文本的排序分值。
[0156]
为解决上述技术问题,本技术实施例还提供计算机设备。如图8所示,计算机设备的内部结构示意图。该计算机设备包括通过系统总线连接的处理器、计算机可读存储介质、存储器和网络接口。其中,该计算机设备的计算机可读存储介质存储有操作系统、数据库和计算机可读指令,数据库中可存储有控件信息向量,该计算机可读指令被处理器执行时,可使得处理器实现一种通信地址解析服务更新方法。该计算机设备的处理器用于提供计算和控制能力,支撑整个计算机设备的运行。该计算机设备的存储器中可存储有计算机可读指令,该计算机可读指令被处理器执行时,可使得处理器执行本技术的通信地址解析服务更新方法。该计算机设备的网络接口用于与终端连接通信。本领域技术人员可以理解,图8中示出的结构,仅仅是与本技术方案相关的部分结构的框图,并不构成对本技术方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
[0157]
本实施方式中处理器用于执行图7中的各个模块及其子模块的具体功能,存储器存储有执行上述模块或子模块所需的程序代码和各类数据。网络接口用于向用户终端或服务器之间的数据传输。本实施方式中的存储器存储有本技术的通信地址解析服务更新装置中执行所有模块/子模块所需的程序代码及数据,服务器能够调用服务器的程序代码及数据执行所有子模块的功能。
[0158]
本技术还提供一种存储有计算机可读指令的存储介质,计算机可读指令被一个或多个处理器执行时,使得一个或多个处理器执行本技术任一实施例的通信地址解析服务更新方法的步骤。
[0159]
本技术还提供一种计算机程序产品,包括计算机程序/指令,该计算机程序/指令被一个或多个处理器执行时实现本技术任一实施例所述方法的步骤。
[0160]
本领域普通技术人员可以理解实现本技术上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,该计算机程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,前述的存储介质可为磁碟、光盘、只读存储记忆体(read-only memory,rom)等计算机可读存储介质,或随机存储记忆体(random access memory,ram)等。
[0161]
综上所述,本技术通过搭建自建通信地址解析服务,降低对第三方通信地址解析
服务的使用频度,实现对第三方通信地址解析服务所产生的历史数据的复用,从而能以较为低成本的方式,为电商平台提供高效精准的通信地址解析服务。
[0162]
本技术领域技术人员可以理解,本技术中已经讨论过的各种操作、方法、流程中的步骤、措施、方案可以被交替、更改、组合或删除。进一步地,具有本技术中已经讨论过的各种操作、方法、流程中的其他步骤、措施、方案也可以被交替、更改、重排、分解、组合或删除。进一步地,现有技术中的具有与本技术中公开的各种操作、方法、流程中的步骤、措施、方案也可以被交替、更改、重排、分解、组合或删除。
[0163]
以上所述仅是本技术的部分实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本技术原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本技术的保护范围。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1