专利名称:确定目标网点的方法和装置的制作方法
技术领域:
本发明涉及物流技术,特别是涉及确定目标网点的方法和装置。
背景技术:
目前,物流行业呈现出迅猛的发展趋势,出现了大量的物流企业。物流企业维护着自己一系列的运营网点,每个网点都会覆盖特定的地理区域。运营网点的作用是供物流企业在实现派送物品的业务中,确定派送的路径节点。在物流派送过程中,经常需要根据用户提供的地址确定目标网点。这种目标网点可以是末端的取件网点或者是送件网点。比如,当一个用户需要寄送一份文件时,该用户可以向物流企业提供用户所在的始发地的详细地址,以便物流企业的人员能够到准确的地点去取件,此时,物流企业就需要根据用户提供的详细地址从维护的运营网点中确定目标网点,即一个具体的取件网点,之后就可以由取件网点的人员进行实际的取件工作。再如,当根据接收方的详细地址确定准确的送件网点时,物流企业也需要根据用户提供的接收方的详细地址从维护的运营网点中确定目标网点,即一个具体的送件网点,之后就可以由确定的送件网点的人员进行实际的送件工作。在目前,物流企业一般都是采用人工确定目标网点的方法。也就是说,由工作人员根据用户提供的地址人为查找并确定目标网点,比如人为确认具体取件的网点或者具体送件的网点。此种人为确定目标网点的方法效率低下,大大增加了工作量,并且很容易出错, 从而也大大降低了业务服务质量。
发明内容
本发明提供了确定目标网点的方法和装置,能够自动确定目标网点,提高准确性。为了达到上述目的,本发明的技术方案是这样实现的确定目标网点的方法,包括步骤一、根据分词词典中包括的区域名称,从地址信息中依次切分出各个分词;步骤二、根据得到的各个分词依次在保存的运营网点中查找匹配的运营网点;步骤三、根据匹配到的运营网点确定目标网点。其中,所述分词词典进一步包括区域级别;则步骤一中进一步包括将分词词典中的区域名称结合区域级别,从地址信息中依次切分出各个分词;禾口/ 或,所述分词词典进一步包括干扰词;则步骤一之前进一步包括根据分词词典中的干扰词去除外部输入的地址信息中的干扰词;则步骤一中的地址信息为去除干扰词后的地
址f曰息。优选地,进一步包括根据各行政区域的上下级关系,将已有的各个运营网点保存为树形结构;
所述步骤二包括A、从切分后得到的各个分词中依次选定当前未进行查找匹配处理的当前分词,在树形结构中查找是否有与其匹配的运营网点,如果是,执行步骤B,否则,执行如下步骤31 ;B、如果该当前分词之前没有上一个分词,则返回步骤A,否则,根据所述树形结构判断该上一个分词是否为该当前分词的父节点,如果是,返回步骤A ;所述步骤三包括步骤31、将最后匹配到的运营网点确定为目标网点。优选地,所述将所有的运营网点保存为树形结构包括根据各行政区域之间的上下级关系,将已有的各个运营网点对应的区域名称和/或区域简称保存在树形结构的节点中;步骤A中,所述在树形结构中查找是否有匹配的运营网点包括在树形结构的节点中查找是否有与所述当前分词相同的区域名称或区域简称。可选地,所述查找为遍历查找;在步骤二中,如果地址信息中的一个分词匹配到树形结构中的多个运营网点。贝"J步骤二与步骤三之间进一步包括将在树形结构中匹配到的多个运营网点的信息提供给用户以供选择;步骤三中,所述最后匹配到的运营网点为用户选择的运营网点。可选地,所述将在树形结构中匹配到的多个运营网点的信息提供给用户包括按照该多个运营网点以往被用户选择次数的顺序,将在树形结构中匹配到的该多个运营网点的信息顺序提供给用户。优选地,该方法进一步包括接收用户输入的新增的运营网点信息,根据该新增的运营网点更新所述树形结构;和/ 或,该方法进一步包括接收用户输入的已有运营网点的新增的简称,当该新增的简称被输入的次数大于预定值时,将该新增的简称添加到所述分词词典的区域名称中,和/ 或在所述树形结构的对应节点中增加该已有运营网点的新增的简称。确定目标网点的装置,包括切分模块,用于根据分词词典中包括的区域名称,从地址信息中依次切分出各个分词;查找模块,用于根据所述切分模块得到的各个分词依次在保存的运营网点中查找匹配的运营网点;确定模块、用于根据匹配到的运营网点确定目标网点。优选地,所述切分模块进一步用于,将区域名称结合分词词典中的区域级别,从地址信息中依次切分出各个分词;和/或,在进行切分之前,根据分词词典中的干扰词去除地址信息中的干扰词;和/ 或,该装置进一步包括扩展模块,用于接收用户输入的新增的运营网点信息,根据该新增的运营网点更新所述保存模块中保存的已有各个运营网点组成的树形结构;和/ 或,
该装置进一步包括接收用户输入的已有运营网点的新增的简称,当该新增的简称被输入的次数大于预定值时,将该新增的简称添加到所述分词词典的区域名称中,和/ 或在保存模块中所述树形结构的对应节点中增加该已有运营网点的新增的简称。较佳地,该装置进一步包括保存模块,用于保存已有的各个运营网点组成的树形结构,该树形结构根据各行政区域的上下级关系形成;所述查找模块包括第一查找子模块,用于从切分后得到的各个分词中依次选定当前未进行查找匹配处理的当前分词,在树形结构中查找是否有与其匹配的运营网点,如果否,触发所述确定模块,如果是,在该当前分词之前没有上一个分词时,返回执行所述选定的处理,在该当前分词之前有上一个分词时,根据所述树形结构判断该上一个分词是否为该当前分词的父节点,如果是,返回执行所述选定的处理;所述确定模块包括第一确定子模块,用于在受到触发时,将第一查找子模块最后匹配到的运营网点确定为目标网点。由以上描述可以看出,在本发明提出的确定目标网点的方法和装置中,考虑到在物流行业中需要处理并分词的信息是与行政区域地点相关的信息,因此,预先设置了分词词典,该分词词典中包括了区域名称。本发明利用包括区域名称的分词词典来对地址信息进行切词,这样,则能够保证切分出的分词能够准确反映出实际的地理区域,根据该种分词匹配具体的运营网点时,则能够匹配到更为准确的目标运营网点,从而大大提高了确定出的目标网点的准确性,另外,由于本发明直接由计算机系统自动执行切分词、查找、匹配及确定目标网点,处理过程无需人为参与,因此实现了过程的自动化处理。
为了更清楚地说明本发明实施例或现有技术中的技术方案,以下将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,以下描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员而言,在不付出创造性劳动的前提下,还可以根据这些附图所示实施例得到其它的实施例及其附图。图1是本发明确定目标网点的基本流程图;图2是在本发明一个优选实施例中确定目标网点的流程图;图3是在本发明一个实施例中查找匹配运营网点的流程图;图4是在本发明一个实施例中的确定目标网点的装置的基本结构图;图5是在本发明一个实施例中确定目标网点的装置的优选结构图。
具体实施例方式以下将结合附图对本发明各实施例的技术方案进行清楚、完整的描述,显然,所描述的实施例仅仅是本发明的一部分实施例,而不是全部的实施例。基于本发明中的实施例, 本领域普通技术人员在没有做出创造性劳动的前提下所得到的所有其它实施例,都属于本发明所保护的范围。在目前,分词技术已经在其它领域被广泛地应用,比如,在互联网的搜索引擎中, 会通过分词技术进行分词进而搜索用户感兴趣的文章等。分词技术能够将一个序列切分成一个一个单独的词,从而进行文本挖掘,达到计算机自动识别语句含义的效果。本发明将分词技术应用于物流行业中,用来确定目标网点。在具体实现时,因为已有的分词技术都应用于其它领域,没有充分考虑并结合物流行业的特点,无法使用。因此, 经过对物流行业特点的深入分析及创造性劳动,本发明提供了独特的适合物流行业特点的分词方式,以及基于该独特的分词方式的确定目标网点的方法,参见图1,其核心思想包括步骤101、根据分词词典中包括的区域名称,从地址信息中依次切分出各个分词; 步骤102、根据得到的各个分词依次在保存的运营网点中查找匹配的运营网点;步骤103、 根据匹配到的运营网点确定目标网点。可见,在本发明提出的确定目标网点的方法中,考虑到在物流行业中需要处理并分词的信息是与行政区域地点相关的信息,因此,预先设置了分词词典,该分词词典中包括了区域名称。之后,本发明利用包括区域名称的分词词典来对地址信息进行切词,这样,则能够保证切分出的分词能够准确反映出实际的地理区域,根据该种分词匹配具体的运营网点时,则能够匹配到更为准确的目标运营网点,从而大大提高了确定出的目标网点的准确性,另外,由于本发明直接由计算机系统自动执行切分词、查找、匹配及确定目标网点,处理过程无需人为参与,因此实现了过程的自动化处理。因为地址信息是人工输入的,经常会存在地址信息中的地名不规范或者随意输入产生的干扰词,为了进一步提高本发明查找匹配目标网点的能力,在本发明的一个实施例中,分词词典中可以进一步包括区域级别和/或干扰词,这样,在根据分词词典对地址信息进行切分时,就可以进一步根据区域级别和/或干扰词来切分,从而得到更为准确的分词。在本发明的一个较佳实施例中,为了提高切分出的分词匹配运营网点的速度和准确度,利用树形结构来保存已有的各个运营网点。进一步地,考虑到物流业务的特殊性,比如,各个运营网点之间存在上下级关系,任一一个运营网点可能存在一个或者多个简称,因此,本发明提出了独特地利用树形结构保存运营网点信息的方法,以及基于此方法来在树形结构中查找匹配出目标网点的方法。下面,结合一个具体的例子来详细说明本发明的实现过程。图2是在本发明一个优选实施例中确定目标网点的流程图。参见图2,在本发明一个优选的实施例中,确定目标网点的过程包括以下步骤步骤201 预先设置分词词典。在本步骤中,结合物流业务的特点来设置专用的分词词典。在具体实现时,可以设置该分词词典包括区域名称,并且进一步地,还可以包括区域级别和/或干扰词。在分词词典中,区域名称主要是各级行政区域的名称。比如包括中国的各级行政区域的名称,诸如北京市、上海市、浙江省、江苏省、西湖区、牛街镇、城关乡、清河中街等。为了在后续业务过程中,针对用户输入地址中的地名不规范的情况也能够进一步进行准确分词及匹配运营网点,本步骤进一步在分词词典中设置了区域级别。区域级别主要表示各级行政区域的级别,比如省、自治区、直辖市、市、县、镇、乡、街等。为了在后续业务过程中,针对用户随意输入地址使得地址中包括干扰词的情况也能够进一步进行准确分词及匹配运营网点,本步骤进一步在分词词典中设置了干扰词。干扰词主要是一些相对于地址没有实际意义的词,比如的、了、呢等。
这样,在一种较佳情况下,分词词典包括三部分区域名称、区域级别和干扰词。步骤202 预先将已有的各个运营网点保存为树形结构。这里,可以根据各行政区域的上下级关系,将已有的各个运营网点保存为树形结构。通过树形结构,能够准确地体现出从企业总部到各个运营网点的各级网点的路径信息。 本步骤中,可以将各个运营网点对应的区域名称保存在树形结构的相应节点中。另外,由于地址信息通常是人工输入的,因此,地址信息往往存在不规范性,比如, 用户输入一个地名时,未写该地名的全称而是输入了该地名的简称,并且,不同用户输入的简称还可能不同,比如对于“乌鲁木齐市”,一个用户输入的可能是简称“乌市”,另一个用户输入的可能是另一简称“乌齐市”。为了在后续过程中,针对地名简称也可能进行运营网点的查找和匹配处理,在本发明一个可选实施例中,可以进一步将运营网点的一个或者多个区域名称的简称也保存在树形结构的相应节点中。在具体实现中,可以采用一种称为“自然区域结点”(NaturalZoneNode,以下简称 “结点”)的结构来保存网点信息,如下表1所示
权利要求
1.确定目标网点的方法,其特征在于,步骤一、根据分词词典中包括的区域名称,从地址信息中依次切分出各个分词;步骤二、根据得到的各个分词依次在保存的运营网点中查找匹配的运营网点;步骤三、根据匹配到的运营网点确定目标网点。
2.如权利要求1所述的确定目标网点的方法,其特征在于,所述分词词典进一步包括区域级别;则步骤一中进一步包括将分词词典中的区域名称结合区域级别,从地址信息中依次切分出各个分词;和/或,所述分词词典进一步包括干扰词;则步骤一之前进一步包括根据分词词典中的干扰词去除外部输入的地址信息中的干扰词;则步骤一中的地址信息为去除干扰词后的地址信肩、ο
3.如权利要求1或2所述的确定目标网点的方法,其特征在于,进一步包括根据各行政区域的上下级关系,将已有的各个运营网点保存为树形结构;所述步骤二包括A、从切分后得到的各个分词中依次选定当前未进行查找匹配处理的当前分词,在树形结构中查找是否有与其匹配的运营网点,如果是,执行步骤B,否则,执行如下步骤31 ;B、如果该当前分词之前没有上一个分词,则返回步骤A,否则,根据所述树形结构判断该上一个分词是否为该当前分词的父节点,如果是,返回步骤A ;所述步骤三包括步骤31、将最后匹配到的运营网点确定为目标网点。
4.如权利要求1 3中任一所述的确定目标网点的方法,其特征在于,所述将所有的运营网点保存为树形结构包括根据各行政区域之间的上下级关系,将已有的各个运营网点对应的区域名称和/或区域简称保存在树形结构的节点中;步骤A中,所述在树形结构中查找是否有匹配的运营网点包括在树形结构的节点中查找是否有与所述当前分词相同的区域名称或区域简称。
5.如权利要求1 4所述的确定目标网点的方法,其特征在于,在步骤二中,如果地址信息中的分词匹配到树形结构中的多个运营网点。则步骤二与步骤三之间进一步包括将在树形结构中匹配到的多个运营网点的信息提供给用户以供选择;步骤三中,所述最后匹配到的运营网点为用户选择的运营网点。
6.如权利要求5所述的确定目标网点的方法,其特征在于,所述将在树形结构中匹配到的多个运营网点的信息提供给用户包括按照该多个运营网点以往被用户选择次数的顺序,将在树形结构中匹配到的该多个运营网点的信息顺序提供给用户。
7.如权利要求1 6所述的确定目标网点的方法,其特征在于,该方法进一步包括获取需更新的行政区域信息,根据该行政区域信息更新所述分词词典以及调整所述树形结构;和/或,该方法进一步包括获取需更新的运营网点的信息,根据该运营网点信息调整所述树形结构;和/或,该方法进一步包括接收用户输入的已有运营网点的新增的简称,当该新增的简称被输入的次数大于预定值时,将该新增的简称添加到所述分词词典的区域名称中,和/或在所述树形结构的对应节点中增加该已有运营网点的新增的简称。
8.确定目标网点的装置,用于实现权利要求1 7中任一的确定目标网点的方法,其特征在于,包括切分模块,用于根据分词词典中包括的区域名称,从地址信息中依次切分出各个分词;查找模块,用于根据所述切分模块得到的各个分词依次在保存的运营网点中查找匹配的运营网点;确定模块、用于根据匹配到的运营网点确定目标网点。
9.如权利要求8所述的确定目标网点的装置,其特征在于,所述切分模块进一步用于,将区域名称结合分词词典中的区域级别,从地址信息中依次切分出各个分词;和/或,在进行切分之前,所述切分模块进一步用于根据分词词典中的干扰词去除地址信息中的干扰词;和/或,该装置进一步包括第一扩展模块,用于获取需更新的行政区域信息,根据该行政区域信息更新所述分词词典以及调整所述树形结构;和/或,用于获取需更新的运营网点的信息,根据该运营网点信息调整所述树形结构;和/或,该装置进一步包括第二扩展模块,接收用户输入的已有运营网点的新增的简称,当该新增的简称被输入的次数大于预定值时,将该新增的简称添加到所述分词词典的区域名称中,和/或在保存模块中所述树形结构的对应节点中增加该已有运营网点的新增的简称。
10.如权利要求8、9所述的确定目标网点的装置,其特征在于,该装置进一步包括保存模块,用于保存已有的各个运营网点组成的树形结构,该树形结构根据各行政区域的上下级关系形成;所述查找模块包括第一查找子模块,用于从切分后得到的各个分词中依次选定当前未进行查找匹配处理的当前分词,在树形结构中查找是否有与其匹配的运营网点,如果否,触发所述确定模块, 如果是,在该当前分词之前没有上一个分词时,返回执行所述选定的处理,在该当前分词之前有上一个分词时,根据所述树形结构判断该上一个分词是否为该当前分词的父节点,如果是,返回执行所述选定的处理;所述确定模块包括第一确定子模块,用于在受到触发时,将第一查找子模块最后匹配到的运营网点确定为目标网点。
全文摘要
本发明涉及确定目标网点的方法和装置。该方法包括步骤一、根据分词词典中包括的区域名称,从地址信息中依次切分出各个分词;步骤二、根据得到的各个分词依次在保存的运营网点中查找匹配的运营网点;步骤三、根据匹配到的运营网点确定目标网点。该装置包括切分模块、查找模块、确定模块。本发明利用包括区域名称的分词词典来对地址信息进行切词,保证切分出的分词能够准确反映出实际的地理区域,根据该种分词匹配具体的运营网点时,则能够匹配到更为准确的目标运营网点,大大提高了确定出的目标网点的准确性,另外,由于本发明直接由计算机系统自动执行切分词、查找、匹配及确定目标网点,处理过程无需人为参与,因此实现了过程的自动化处理。
文档编号G06F17/30GK102289467SQ20111020669
公开日2011年12月21日 申请日期2011年7月22日 优先权日2011年7月22日
发明者杜文廉 申请人:浙江百世技术有限公司