一种生成p0i数据的方法及装置制造方法
【专利摘要】本发明公开了一种生成P0I数据的方法及装置,以解决现有技术中生成P0I数据的时延长、效率低、质量差以及消耗人力和物力资源较大的问题。方法包括:获取P0I原始数据;根据P0I原始数据的来源所对应的字段设置规则,对所述P0I原始数据进行处理,得到P0I标准数据;在预置的P0I数据库中的P0I数据,匹配与所述P0I标准数据描述同一个P0I的P0I数据;若匹配不到,则将所述P0I标准数据添加至所述P0I数据库中;若匹配到,则对所述P0I标准数据与其匹配的P0I数据进行融合处理,用融合处理得到的P0I数据更新所述匹配的P0I数据。本发明技术方案,提高了生成P0I数据的速度、效率和质量。
【专利说明】一种生成POI数据的方法及装置
【技术领域】
[0001] 本发明涉及数据处理领域,尤其涉及一种生成Ρ0Ι数据的方法及装置。
【背景技术】
[0002] 目前,地图数据库中的兴趣点(Point Of Interest,P0I)数据,主要通过以下方式 生成得到:外业人员进行外业实地采集,将采集得到的原始数据发送给内业人员进行加工、 处理,以得到符合规范的Ρ0Ι数据;并且,当采集得到的多条Ρ0Ι数据是描述同一 Ρ0Ι时,从 该多条Ρ0Ι数据中选取一条信息描述较为准确、丰富的Ρ0Ι数据作为该Ρ0Ι对应的Ρ0Ι数 据,其他Ρ0Ι数据删除。这种生成Ρ0Ι数据的方式,会存在以下技术缺陷:
[0003] 缺陷1、P0I数据量庞大,若采用现有的Ρ0Ι数据处理方式,每条Ρ0Ι数据均需要通 过外业人员实地采集,不仅处理周期较长、效率较低,而且还需要消耗大量的人力、物力资 源;并且,后续对地图数据库中的Ρ0Ι数据进行更新,也需要进行大量的采集、处理工作,更 新周期也比较长、效率较低;
[0004] 缺陷2、针对某一 Ρ0Ι,若有多条Ρ0Ι数据时,仅是将其中的一条作为该Ρ0Ι对应的 Ρ0Ι数据,而一条Ρ0Ι数据其所包含的信息往往是比较有限的,因此,采用这种方式生成Ρ0Ι 数据,丰富性和准确性相对较差,即质量较差。
【发明内容】
[0005] 针对现有生成Ρ0Ι数据的方式所存在的时延长、效率低的技术问题,本发明实施 例提供一种生成P0I数据的方法及装置,以实现在节省人力、物力资源的情况下提高生成 Ρ0Ι数据的速度、效率和质量。
[0006] 一种生成Ρ0Ι数据的方法,包括:
[0007] 获取Ρ0Ι原始数据;
[0008] 根据Ρ0Ι原始数据的来源所对应的字段设置规则,对所述Ρ0Ι原始数据进行处理, 得到Ρ0Ι标准数据;
[0009] 在预置的Ρ0Ι数据库中的Ρ0Ι数据,匹配与所述Ρ0Ι标准数据描述同一个Ρ0Ι的 Ρ0Ι数据;
[0010] 若匹配不到,则将所述Ρ0Ι标准数据添加至所述Ρ0Ι数据库中;
[0011] 若匹配到,则对所述Ρ0Ι标准数据与其匹配的Ρ0Ι数据进行融合处理,用融合处理 得到的Ρ0Ι数据更新所述匹配的Ρ0Ι数据。
[0012] 一种生成Ρ0Ι数据的装置,包括:
[0013] 原始数据获取单元,用于获取Ρ0Ι原始数据;
[0014] 数据生成单元,用于根据Ρ0Ι原始数据的来源所对应的字段设置规则,对所述Ρ0Ι 原始数据进行处理,得到P0I标准数据;
[0015] 第一匹配单元,用于在预置的Ρ0Ι数据库中的Ρ0Ι数据,匹配与所述Ρ0Ι标准数据 描述同一个Ρ0Ι的P0I数据,若匹配不到则触发第一存储单元,若匹配到则触发数据融合单 元;
[0016] 第一存储单元,用于将所述Ρ0Ι标准数据添加至所述Ρ0Ι数据库中;
[0017] 数据融合单元,用于对所述Ρ0Ι标准数据与其匹配的Ρ0Ι数据进行融合处理,用融 合处理得到的Ρ0Ι数据更新所述匹配的Ρ0Ι数据。
[0018] 本发明实施例中提供的生成Ρ0Ι数据的方法,能够对不同来源的Ρ0Ι原始数据进 行处理得到Ρ0Ι标准数据,并且在Ρ0Ι数据库中不存在该Ρ0Ι标准数据时,直接将该Ρ0Ι标 准数据存储至Ρ0Ι数据库中,在Ρ0Ι数据库中存在与该Ρ0Ι标准数据描述同一 Ρ0Ι的Ρ0Ι 数据时,对该Ρ0Ι标准数据和该Ρ0Ι数据进行融合处理,用融合处理得到的P0I数据更新所 述匹配的Ρ0Ι数据。采用本发明技术方案,一方面,不仅实现了自动化的对不同来源的Ρ0Ι 原始数据进行处理,以得到Ρ0Ι数据,与现有技术只通过人工外业实地采集P0I原始数据来 得到Ρ0Ι数据的方式相比,提高了 Ρ0Ι数据的生成速度和效率,而且还及时的丰富Ρ0Ι数据 库;另一方面,在Ρ0Ι数据库中存在与该Ρ0Ι标准数据描述同一 Ρ0Ι的Ρ0Ι数据时,对该标 准数据和该Ρ0Ι数据进行融合处理,更进一步丰富Ρ0Ι数据的信息以及准确性,使得P0I数 据更能够完整、准确的描述Ρ0Ι,提高Ρ0Ι数据的质量。
【专利附图】
【附图说明】
[0019] 图1为本发明实施例中生成Ρ0Ι数据的方法流程图之一;
[0020] 图2为本发明实施例中生成Ρ0Ι数据的方法流程图之二;
[0021] 图3为本发明实施例中生成Ρ0Ι数据的方法流程图之三;
[0022] 图4为本发明实施例中生成Ρ0Ι数据的方法流程图之四;
[0023] 图5为本发明实施例中生成Ρ0Ι数据的方法流程图之五;
[0024] 图6为本发明实施例中生成Ρ0Ι数据的方法流程图之六;
[0025] 图7为本发明实施例中生成Ρ0Ι数据的方法流程图之七;
[0026] 图8为本发明实施例中将标准数据与Ρ0Ι数据库中的Ρ0Ι数据进行匹配的方法流 程图;
[0027] 图9为本发明实施例中生成Ρ0Ι数据装置的结构示意图之一;
[0028] 图10为本发明实施例中生成Ρ0Ι数据装置的结构示意图之二;
[0029] 图11为本发明实施例中生成Ρ0Ι数据装置的结构示意图之三;
[0030] 图12为本发明实施例中生成Ρ0Ι数据装置的结构示意图之四;
[0031] 图13为本发明实施例中生成Ρ0Ι数据装置的结构示意图之五;
[0032] 图14为本发明实施例中生成Ρ0Ι数据装置的结构示意图之六;
[0033] 图15为本发明实施例中生成Ρ0Ι数据装置的结构示意图之七。
【具体实施方式】
[0034] 针对现有生成Ρ0Ι数据的方式所存在的时延长、效率低的技术问题,本发明实施 例提供一种生成P0I数据的方法及装置,以实现在节省人力、物力资源的情况下提高生成 Ρ0Ι数据的速度、效率和质量。
[0035] 下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完 整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于 本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他 实施例,都属于本发明保护的范围。
[0036] 参见图1,为本发明实施例中生成Ρ0Ι数据的方法流程图,该方法包括:
[0037] 步骤101、获取Ρ0Ι原始数据。
[0038] 步骤102、根据Ρ0Ι原始数据的来源所对应的字段设置规则,对所述Ρ0Ι原始数据 进行处理,得到Ρ0Ι标准数据。
[0039] 步骤103、在预置的Ρ0Ι数据库中的Ρ0Ι数据,匹配与所述Ρ0Ι标准数据描述同一 个Ρ0Ι的Ρ0Ι数据,若匹配不到则执行步骤104,若匹配到则执行步骤105。
[0040] 步骤104、将所述Ρ0Ι标准数据添加至所述Ρ0Ι数据库中。
[0041] 步骤105、对所述Ρ0Ι标准数据与其匹配的Ρ0Ι数据进行融合处理,用融合处理得 到的Ρ0Ι数据更新所述匹配的Ρ0Ι数据。
[0042] 本发明实施例中,Ρ0Ι原始数据可以是传统的通过外业人员实地采集得到的数据、 商务合作的数据、网络抓取得到的数据和用户反馈的纠错数据等,其中网络抓取得到的Ρ0Ι 原始数据具有深度信息丰富的特点。不同来源的Ρ0Ι原始数据的数据格式可能不同,如来 源1的Ρ0Ι原始数据的格式为"名称+地址+电话+··· ",来源2的Ρ0Ι原始数据的格式为"名 称+城市代码+电话+地址",且即使是相同的字段,其格式也可能不一至,比如电话号码, 来源1的电话号码的格式为010-80004000,来源2的电话号码的格式为010-8000-4000,来 源3的电话号码的格式为01080004000。因此,需要对不同来源的Ρ0Ι原始数据进行处理, 以得到具有统一格式的Ρ0Ι标准数据。具体地,预先需要对不同来源的Ρ0Ι原始数据进行 分析,得到各来源的数据格式,为各Ρ0Ι数据来源生成对应的数据字段设置规则,并预先存 储Ρ0Ι数据来源与来源数据字段设置规则的对应关系。在前述图1所述的流程的步骤101 之后,包括步骤l〇la和步骤101b,此时的步骤102可以用以下的步骤1021?步骤1022替 代,如图2所示,其中:
[0043] 步骤10la、获取Ρ0Ι原始数据的来源;
[0044] 步骤101b、在预存的Ρ0Ι数据来源与来源数据字段设置规则的对应关系中,查找 所述Ρ0Ι原始数据的来源对应的字段设置规则;
[0045] 步骤1021、按照所述Ρ0Ι原始数据的来源对应的字段设置规则,从所述Ρ0Ι原始数 据中提取相应字段的内容;
[0046] 步骤1022、将提取出的字段的内容按照Ρ0Ι数据库中Ρ0Ι数据格式组织成Ρ0Ι标 准数据。
[0047] 优选地,为确保生成的Ρ0Ι标准数据的有效性,前述图2所述的方法流程的步骤 1021与步骤1022之间还包括步骤1021a?步骤1021b,如图3所示,其中:
[0048] 步骤1021a、判断所述提取字段的内容中是否不包含地址和经纬度坐标,若是则执 行步骤1021b,否则执行步骤1022 ;
[0049] 步骤1021b、确定所述Ρ0Ι原始数据为无效数据,丢弃所述Ρ0Ι原始数据。
[0050] 优选地,为确保生成的标准数据的信息完整性,在前述图3所示的流程图中,在步 骤1022之后还包括步骤1022a?步骤1022b,如图4所示,其中:
[0051] 步骤1022a、判断所述Ρ0Ι标准数据是否存在内容为空的字段,若不存在,则执行 步骤103,若存在,则执行步骤1022b ;
[0052] 步骤1022b、根据所述Ρ0Ι标准数据中与内容为空的字段有关的字段的内容,获取 内容为空的字段的内容,并将获取到的内容添加至到所述Ρ0Ι标准数据相应的字段中,并 执行步骤103。
[0053] 前述步骤1022b,具体为执行以下任意一个或多个操作:A、若内容为空的是地址 字段,则采用逆地理编码算法根据经纬度坐标字段中的经纬度坐标得到地址,并将得到的 地址补充到所述Ρ0Ι标准数据的地址字段中;B、若内容为空的是经纬度坐标字段,采用地 理编码算法根据地址字段中的地址,得到经纬度坐标,并将获取的经纬度坐标补充到所述 Ρ0Ι标准数据的经纬度坐标字段中;C、若内容为空的是类别字段,则根据所述Ρ0Ι标准数据 中的名称字段判断所述Ρ0Ι的类别,并获取所述类别对应的代码,将获取的代码补充到所 述Ρ0Ι标准数据的类别字段中。
[0054] 本发明实施例中,Ρ0Ι标准数据包括基础信息字段,其中基础信息字段包括Ρ0Ι名 称、地址、经纬度坐标、所属类别(如停车场、加油站、餐馆、商场等)和电话等。优选地,为提 高Ρ0Ι标准数据的丰富性,本发明实施例中的Ρ0Ι标准数据还进一步的包括深度信息字段, 其中深度信息字段包括Ρ0Ι的点评信息、简介信息、图片、内部环境、周边乘车站点等。
[0055] 优选地,为进一步提高融合处理后的Ρ0Ι数据的基础信息字段的准确性,根据历 史数据预先分析出每个基础信息字段的各个来源的优先级,即预先建立字段与来源的优先 级的对应关系。如描述同一 Ρ0Ι的三条数据分别的来源分别为来源A、来源B、来源C,就基 础信息字段的经纬度坐标字段而言,该三条数据的经纬度坐标的精确性从高到低依次为来 源B、来源A、来源C,则来源A、来源B、来源C在经纬度坐标字段的优先级从高到低依次为 来源B、来源A、来源C ;就地址字段而言,该三条数据的地址字段精确度从高到低依次为来 源A、来源C、来源B,则来源A、来源B、来源C在地址字段的优先级从高到低依次为来源A、 来源C、来源B,依此类推。因此,前述步骤105中,对所述Ρ0Ι标准数据与其匹配的Ρ0Ι数 据进行融合处理,具体包括:获取Ρ0Ι标准数据的基础信息字段中的每个字段的来源与其 匹配的Ρ0Ι数据的基础信息字段中的对应字段的来源;若来源不一致,则从预置的字段与 来源的优先级的对应关系中获取Ρ0Ι标准数据的该字段的来源的优先级和所述Ρ0Ι数据的 该字段的来源的优先级,将优先级高的字段的内容确定为融合处理得到的Ρ0Ι数据的基础 字段中对应字段的内容;若来源一致,则将该Ρ0Ι标准数据或与该Ρ0Ι标准数据匹配的Ρ0Ι 数据的该字段的内容作为融合处理得到的P0I数据的对应字段的内容。
[0056] 优选地,为进一步提高深度信息字段的丰富性,前述步骤105对所述Ρ0Ι标准数据 与其匹配的Ρ0Ι数据进行融合处理,还进一步包括:将所述Ρ0Ι标准数据的深度信息字段中 的每个字段的内容与其匹配的Ρ0Ι数据的深度信息字段中的对应字段的内容进行合并处 理,将合并处理得到的内容确定为融合处理得到的Ρ0Ι数据的深度信息字段中的对应字段 的内容。本发明实施例中,合并处理是指若Ρ0Ι标准数据的某个字段的内容与匹配Ρ0Ι数 据的相应字段的内容一致,则保留其中一个字段的内容作为融合处理后的Ρ0Ι数据的对应 字段的内容,若某个字段的内容与匹配P0I数据的相应字段的不一致,则保留两个字段的 内容,并将两个字段的内容均作为融合处理后的Ρ0Ι数据的对应字段的内容。
[0057] 本发明实施例中,步骤103的具体实现可如下:计算所述Ρ0Ι标准数据的基础信息 字段与所述Ρ0Ι数据库中的每一条P0I数据的基础信息字段的相似度;当计算得到的相似 度均小于预置的相似度阈值时,则确定匹配不到与所述Ρ0Ι标准数据描述同一个Ρ0Ι的Ρ0Ι 数据;当计算得到的至少一个相似度大于或等于所述相似度阈值时,则将相似度中最大的 一个对应的POI数据确定为与所述POI标准数据描述同一个POI的POI数据。本发明实施 例中计算POI标准数据的基础信息字段与所述POI数据的基础信息字段的相似度可计算如 下:首先,针对POI标准数据的基础信息字段中的每一个字段,计算该字段与POI数据的基 础信息字段中的相应字段的相似度;然后,再计算各个字段的相似度的平均值(如几何平均 值或算术平均值)或和值;最后,将所述平均值或和值作为所述POI标准数据的基础信息字 段与POI数据的基础信息字段的相似度。
[0058] 本发明实施例,可以是周期性或定期的(如一星期、半个月或一个月,可以根据需 要灵活设置)从各来源获取Ρ0Ι原始数据,将本次获取的Ρ0Ι原始数据存储至用于存储Ρ0Ι 标准数据和Ρ0Ι原始数据的存储空间中;该存储空间还保留前一次获取的Ρ0Ι原始数据,本 次Ρ0Ι原始数据、前一次Ρ0Ι原始数据以及标准数据三类数据分别存储在存储空间的不同 区域块中。
[0059] 优选地,为提高对Ρ0Ι原始数据进行处理的速度和效率,本发明实施例中,可以将 本次获取的Ρ0Ι原始数据与前一次获取的Ρ0Ι原始数据进行比较,只对新增加或者有修改 的原始Ρ0Ι原始数据进行处理,因此,在前述图1所示的方法流程的步骤101与步骤102之 间,还可包括以下步骤101A?步骤101B,如图5所示:
[0060] 步骤101A、将本次获取的Ρ0Ι原始数据与前一次从各来源获取的Ρ0Ι原始数据进 行比较,根据比较结果对本次和前一次获取的Ρ0Ι原始数据的状态标记进行设置;
[0061] 步骤101B、提取本次获取的Ρ0Ι原始数据的状态标记,当所述Ρ0Ι原始数据的状态 标记为新增标记或修改标记时,执行所述步骤102。当Ρ0Ι原始数据的状态标记为删除标记 时,结束流程。
[0062] 前述步骤101A中,根据比较结果对本次和前一次获取的Ρ0Ι原始数据的状态标记 进行设置,具体包括:针对本次获取的每一条Ρ0Ι原始数据,执行以下步骤:若本次获取的 Ρ0Ι原始数据不包含在前一次获取的Ρ0Ι原始数据中,则将本次获取的Ρ0Ι原始数据的状态 标记设置为新增标记;若本次获取的Ρ0Ι原始数据包含在前一次获取的Ρ0Ι原始数据中且 字段有更新,则将本次获取的Ρ0Ι原始数据的状态标记设置为修改标记,若字段没有更新, 则不对本次获取的Ρ0Ι原始数据的状态标记进行处理;以及,若前一次获取的Ρ0Ι原始数据 不包含在本次获取的Ρ0Ι原始数据中,则将前一次获取的Ρ0Ι原始数据的状态标记设置为 删除标记。
[0063] 优选地,在前述图5所示的步骤102之后,还包括以下步骤102A?步骤102D,如图 6所示:
[0064] 步骤102A、将本次得到的Ρ0Ι标准数据的状态标记设置为与其对应的Ρ0Ι原始数 据的状态标记一致;
[0065] 步骤102B、将本次得到的状态标记为新增标记的Ρ0Ι标准数据添加到用于存储 Ρ0Ι标准数据的存储空间中;
[0066] 步骤102C、用本次得到的状态标记为修改标记的Ρ0Ι标准数据替换所述存储空间 中对应的Ρ0Ι标准数据;
[0067] 步骤102D、将存储空间中与前一次获得的且状态标记为删除标记的Ρ0Ι原始数据 所对应的Ρ0Ι标准数据的状态标记修改为删除标记。
[0068] 举一具体实例如下:前一次获取的Ρ0Ι原始数据为A、B、C,本次获取的Ρ0Ι原始数 据为A、B、D、E,其中本次A与前一次的A相比有字段更新,本次B与前一次B相比字段没有 变化。比较前一次获取的Ρ0Ι原始数据和本次获取的Ρ0Ι原始数据可知,D和E为新增数 据,则将D和E的状态标记设置为新增标记,并将D和E对应的标准数据D'和E'的状态标 记也设置为新增标记;A有更新,则将A的状态标记设置为修改标记,并将A对应的标准数 据A'的状态标记设置为修改标记;C为需要删除的数据,因此将C的状态标记设置为删除 标记,并将C对应的标准数据C'的状态标记设置为删除标记。将D'和E'添加到存储空间 中;将A'替换存储空间中相应的标准数据。
[0069] 优选地,为进一步优化和扩充Ρ0Ι数据库中Ρ0Ι数据,本发明实施例,当本次得到 的Ρ0Ι标准数据的状态标记为修改标记,且在预置的Ρ0Ι数据库中能匹配与所述Ρ0Ι标准 数据描述同一个Ρ0Ι的Ρ0Ι数据时,在前述图6所示的流程中还包括步骤105A?步骤105B, 如图7所示:
[0070] 步骤105A、判断与所述Ρ0Ι标准数据匹配成功的Ρ0Ι数据是否为前一次与所述 Ρ0Ι标准数据匹配成功的Ρ0Ι数据,若是则结束流程,否则执行步骤105B ;
[0071] 步骤105B、将所述存储空间中的前一次与所述Ρ0Ι标准数据匹配同一 Ρ0Ι数据且 状态标记为非删除标记的其他Ρ0Ι标准数据,分别与所述Ρ0Ι数据库中的Ρ0Ι数据进行匹 配,并在匹配到Ρ0Ι数据时,执行对所述其他Ρ0Ι标准数据与其匹配的Ρ0Ι数据进行融合处 理,用融合处理得到的Ρ0Ι数据更新所述匹配的Ρ0Ι数据的步骤。
[0072] 在具体的实际应用中,本发明实施例中,当Ρ0Ι标准数据与Ρ0Ι数据库中的某条 Ρ0Ι数据匹配时,在存储空间中将该Ρ0Ι标准数据的基础ID设置为与其匹配的Ρ0Ι数据的 ID。在对存储空间中的Ρ0Ι标准数据与Ρ0Ι数据库中的Ρ0Ι数据进行匹配处理时,首先读 取该Ρ0Ι标准数据的状态标记,对状态标记为新增标记的Ρ0Ι标准数据,直接将该Ρ0Ι标准 数据与Ρ0Ι数据库进行匹配;对状态标记为删除标记的P0I标准数据,不进行匹配处理;对 状态标记为修改标记的Ρ0Ι标准数据,将该Ρ0Ι标准数据与Ρ0Ι数据库进行重新匹配,并且 本次与Ρ0Ι标准数据重新匹配成功的Ρ0Ι数据与前一次与该Ρ0Ι标准数据匹配成功的Ρ0Ι 数据不一致时,将存储空间中前一次与所述Ρ0Ι标准数据匹配于同一 Ρ0Ι数据的其他Ρ0Ι 标准数据(即其他Ρ0Ι标准数据是指存储空间中基础ID与所述Ρ0Ι标准数据的基础ID - 致的Ρ0Ι标准数据),分别与所述Ρ0Ι数据库中的Ρ0Ι数据进行重新匹配,并在匹配成功时, 对所述其他Ρ0Ι标准数据与其匹配的Ρ0Ι数据进行融合处理,用融合处理得到的P0I数据 更新所述匹配的P0I数据。
[0073] 为进一步的使本领域技术人员更容易理解本发明实施例中Ρ0Ι标准数据与Ρ0Ι数 据的匹配过程,下面结合具体的流程图对前述过程进行详细的描述。
[0074] 参见图8,为本发明实施例中Ρ0Ι标准数据与Ρ0Ι数据库中的Ρ0Ι数据进行匹配的 方法流程图,该方法包括:
[0075] 步骤8001、获取当前Ρ0Ι标准数据的状态标记;
[0076] 步骤8002、判断所述状态标记是否为新增标记,若是则执行步骤8003,否则执行 步骤8004 ;
[0077] 步骤8003、将当前Ρ0Ι标准数据与Ρ0Ι数据库中的Ρ0Ι数据进行匹配,并执行步骤 8010 ;
[0078] 步骤8004、判断所述状态标记是否为删除标记,若否则执行步骤8005,否则执行 步骤8010 ;
[0079] 步骤8005、判断所述状态标记是否为修改标记,若是则执行步骤8006,否则执行 步骤8010 ;
[0080] 步骤8006、将当前Ρ0Ι标准数据与Ρ0Ι数据库中的Ρ0Ι数据进行重新匹配;
[0081] 步骤8007、判断与当前Ρ0Ι标准数据匹配的Ρ0Ι数据与前一次与Ρ0Ι标准数据匹 配的Ρ0Ι数据是否一致,若不一致则执行步骤8008,否则执行步骤8010 ;
[0082] 步骤8008、从存储空间中获取所有与当前Ρ0Ι标准数据匹配于同一 Ρ0Ι数据的其 他Ρ0Ι标准数据(即存储空间中所有基础ID与当前Ρ0Ι标准数据的基础ID相一致的其他 Ρ0Ι标准数据);
[0083] 步骤8009、对每个其他Ρ0Ι标准数据与Ρ0Ι数据库中的Ρ0Ι数据进行重新匹配。
[0084] 步骤8010、判断当前Ρ0Ι标准数据是否为存储空间中的最后一条Ρ0Ι标准数据,若 是则结束流程,若否则以存储空间中的下一条Ρ0Ι标准数据作为当前P0I标准数据重复执 行步骤8001。
[0085] 本发明实施例中,存储在存储空间中的Ρ0Ι标准数据主要是用于为各种应用接口 调用提供数据支撑,如P0I数据库的更新、搜索引擎、数据统计等。
[0086] 基于前述方法流程的相同构思,本发明实施例还提供一种生成Ρ0Ι数据的装置, 该装置的结构如图9所示,包括:
[0087] 原始数据获取单元901,用于获取Ρ0Ι原始数据;
[0088] 数据生成单元902,用于根据Ρ0Ι原始数据的来源所对应的字段设置规则,对所述 Ρ0Ι原始数据进行处理,得到Ρ0Ι标准数据;
[0089] 第一匹配单元903,用于在预置的Ρ0Ι数据库中的Ρ0Ι数据,匹配与所述Ρ0Ι标准 数据描述同一个Ρ0Ι的Ρ0Ι数据,若匹配不到则触发第一存储单元904,若匹配到则触发数 据融合单元905 ;
[0090] 第一存储单元904,用于将所述Ρ0Ι标准数据添加至所述Ρ0Ι数据库中;
[0091] 数据融合单元905,用于对所述Ρ0Ι标准数据与其匹配的Ρ0Ι数据进行融合处理, 用融合处理得到的Ρ0Ι数据更新所述匹配的Ρ0Ι数据;
[0092] 本发明实施例中,在前述图9所示的装置上还包括来源获取单元906和字段设置 规则查找单元907,所述数据生成单元902包括字段内容提取子单元9021和数据生成子单 元9022,如图10所示,其中:
[0093] 来源获取单元906,用于在所述原始数据获取单元901获取Ρ0Ι原始数据之后,获 取Ρ0Ι原始数据的来源;
[0094] 字段设置规则查找单元907,用于在预存的Ρ0Ι数据来源与来源数据字段设置规 则的对应关系中,查找所述P0I原始数据的来源对应的字段设置规则;
[0095] 字段内容提取子单元9021,用于按照所述Ρ0Ι原始数据的来源对应的字段设置规 贝1J,从所述Ρ0Ι原始数据中提取相应字段的内容;
[0096] 数据生成子单元9022,用于将字段内容提取子单元9021提取出的字段的内容按 照Ρ0Ι数据库中Ρ0Ι数据格式组织成P0I标准数据。
[0097] 优选地,本发明实施例中,图10所示的装置还包括第一判断单元908,如图11所 示,其中:
[0098] 第一判断单元908,用于判断所述字段内容提取子单元9021提取字段的内容中是 否不包含地址和经纬度坐标,若是则确定所述Ρ0Ι原始数据为无效数据,丢弃所述Ρ0Ι原始 数据,若否则触发数据生成子单元9022。
[0099] 优选地,本发明实施例中,图11所示的装置还包括第二判断单元909和字段补充 单元910,如图12所示,其中 :
[0100] 第二判断单元909,用于在所述数据生成单元902的数据生成子单元9022得到 Ρ0Ι标准数据之后,判断所述Ρ0Ι标准数据是否存在内容为空的字段,若存在,则触发字段 补充单元910,若不存在内容为空的字段则触发第一匹配单元903 ;
[0101] 字段补充单元910,根据所述Ρ0Ι标准数据中与内容为空的字段有关的字段的内 容,获取内容为空的字段的内容,并将获取到的内容添加至到所述Ρ0Ι标准数据相应的字 段中,并触发第一匹配单元903。
[0102] 所述字段补充单元910,具体用于:若内容为空的是地址字段或经纬度字段,则采 用逆地理编码算法根据经纬度坐标字段中的经纬度坐标得到地址,并将得到的地址补充到 所述Ρ0Ι标准数据的地址字段中或采用地理编码算法根据地址字段中的地址,得到经纬度 坐标,并将获取的经纬度坐标补充到所述Ρ0Ι标准数据的经纬度坐标字段中;
[0103]和 / 或,
[0104] 若内容为空的是类别字段,则根据所述Ρ0Ι标准数据中的名称字段判断所述Ρ0Ι 的类别,并获取所述类别对应的代码,将获取的代码补充到所述Ρ0Ι标准数据的类别字段 中。
[0105] 优选地,所述Ρ0Ι标准数据包括基础信息字段,所述数据融合单元905对所述Ρ0Ι 标准数据与其匹配的Ρ0Ι数据进行融合处理,具体用于:
[0106] 获取Ρ0Ι标准数据的基础信息字段中的每个字段的来源与其匹配的Ρ0Ι数据的基 础信息字段中的对应字段的来源,若来源不一致,则从预置的字段与来源的优先级的对应 关系中获取Ρ0Ι标准数据的该字段的来源的优先级和所述Ρ0Ι数据的该字段的来源的优先 级,将优先级高的字段的内容确定为融合处理得到的Ρ0Ι数据的基础字段中对应字段的内 容。
[0107] 优选地,所述Ρ0Ι标准数据还包括深度信息字段,所述数据融合单元905对所述 Ρ0Ι标准数据与其匹配的Ρ0Ι数据进行融合处理,还进一步用于:
[0108] 将所述Ρ0Ι标准数据的深度信息字段中的每个字段的内容与其匹配的Ρ0Ι数据的 深度信息字段中的对应字段的内容进行合并处理,将合并处理得到的内容确定为融合处理 得到的Ρ0Ι数据的深度信息字段中的对应字段的内容。
[0109] 优选地,所述第一匹配单元903具体用于:计算所述Ρ0Ι标准数据的基础信息字段 与所述Ρ0Ι数据库中的每一条Ρ0Ι数据的基础信息字段的相似度;
[0110] 当计算得到的相似度均小于预置的相似度阈值时,则确定匹配不到与所述Ρ0Ι标 准数据描述同一个Ρ0Ι的Ρ0Ι数据;
[0111] 当计算得到的至少一个相似度大于或等于所述相似度阈值时,则将相似度中最大 的一个对应的Ρ0Ι数据确定为与所述Ρ0Ι标准数据描述同一个Ρ0Ι的Ρ0Ι数据。
[0112] 优选地,本发明实施例中,图9所示的装置还包括第一状态标记设置单元911和状 态标记获取单元912,如图13所示,其中:
[0113] 所述Ρ0Ι原始数据获取单元901,具体应用于:周期性或定期地从各来源获取Ρ0Ι 原始数据;
[0114] 第一状态标记设置单元911,用于将所述Ρ0Ι原始数据获取单元901本次获取的 Ρ0Ι原始数据与前一次从各来源获取的Ρ0Ι原始数据进行比较,根据比较结果对本次和前 一次获取的Ρ0Ι原始数据的状态标记进行设置;
[0115] 状态标记获取单元912,用于提取本次获取的Ρ0Ι原始数据的状态标记,当所述 Ρ0Ι原始数据的状态标记为新增标记或修改标记时,触发所述数据生成单元902。
[0116] 优选地,所述第一状态标记设置单元911根据比较结果对本次和前一次获取的 Ρ0Ι原始数据的状态标记进行设置,具体用于:
[0117] 针对本次获取的每一条Ρ0Ι原始数据,执行以下步骤:若本次获取的Ρ0Ι原始数 据不包含在前一次获取的Ρ0Ι原始数据中,则将本次获取的Ρ0Ι原始数据的状态标记设置 为新增标记;若本次获取的Ρ0Ι原始数据包含在前一次获取的Ρ0Ι原始数据中且字段有更 新,则将本次获取的Ρ0Ι原始数据的状态标记设置为修改标记,若字段没有更新,则不对本 次获取的Ρ0Ι原始数据的状态标记进行处理;
[0118] 若前一次获取的Ρ0Ι原始数据不包含在本次获取的Ρ0Ι原始数据中,则将前一次 获取的Ρ0Ι原始数据的状态标记设置为删除标记。
[0119] 优选地,本发明实施例中,在图13所示的装置中还包括第二状态标记设置单元 913、第二存储单元914、数据更新单元915,如图14所示,其中 :
[0120] 第二状态标记设置单元913,用于在所述数据生成单元902得到Ρ0Ι标准数据之 后,将本次得到的Ρ0Ι标准数据的状态标记设置为与其对应的Ρ0Ι原始数据的状态标记一 致;
[0121] 第二存储单元914,用于将本次得到的状态标记为新增标记的Ρ0Ι标准数据添加 到用于存储Ρ0Ι标准数据和Ρ0Ι原始数据的存储空间中;
[0122] 数据更新单元915,用于用本次得到的状态标记为修改标记的Ρ0Ι标准数据替换 所述存储空间中对应的Ρ0Ι标准数据;以及,将存储空间中与前一次获得的且状态标记为 删除标记的Ρ0Ι原始数据所对应的Ρ0Ι标准数据的状态标记修改为删除标记。
[0123] 优选地,本发明实施例中,当本次得到的Ρ0Ι标准数据的状态标记为修改标记,且 在预置的Ρ0Ι数据库中能匹配与所述Ρ0Ι标准数据描述同一个Ρ0Ι的Ρ0Ι数据时,在图14 所示的装置中还包括第三判断单元916和第二匹配单元917,如图15所示,其中 :
[0124] 第三判断单元916,用于判断与所述Ρ0Ι标准数据匹配成功的Ρ0Ι数据是否为前一 次与所述Ρ0Ι标准数据匹配成功的Ρ0Ι数据,若否则触发第二匹配单元917 ;
[0125] 第二匹配单元917,用于将所述存储空间中的前一次与所述Ρ0Ι标准数据匹配同 一Ρ0Ι数据且状态标记为非删除标记的其他Ρ0Ι标准数据,分别与所述Ρ0Ι数据库中的Ρ0Ι 数据进行匹配,并在匹配到Ρ0Ι数据时触发数据融合单元905 ;
[0126] 数据融合处理单元905进一步用于,对所述其他Ρ0Ι标准数据与其匹配的Ρ0Ι数 据进行融合处理,用融合处理得到的Ρ0Ι数据更新所述匹配的Ρ0Ι数据。
[0127] 本发明实施例中提供的生成Ρ0Ι数据的方法,能够对不同来源的Ρ0Ι原始数据进 行处理得到Ρ0Ι标准数据,并且在Ρ0Ι数据库中不存在该Ρ0Ι标准数据时,直接将该Ρ0Ι标 准数据存储至POI数据库中,在POI数据库中存在与该POI标准数据描述同一 POI的POI 数据时,对该P0I标准数据和该P0I数据进行融合处理,用融合处理得到的P0I数据更新所 述匹配的P0I数据。采用本发明技术方案,一方面,不仅实现了自动化的对不同来源的P0I 原始数据进行处理,以得到P0I数据,与现有技术只通过人工外业实地采集P0I原始数据来 得到P0I数据的方式相比,提高了 P0I数据的生成速度和效率,而且还及时的丰富P0I数据 库;另一方面,在P0I数据库中存在与该P0I标准数据描述同一 P0I的P0I数据时,对该标 准数据和该P0I数据进行融合处理,更进一步丰富P0I数据的信息以及准确性,使得P0I数 据更能够完整、准确的描述P0I,提高P0I数据的质量。
[0128] 需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实 体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存 在任何这种实际的关系或者顺序。而且,术语"包括"、"包含"或者其任何其他变体意在涵 盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要 素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备 所固有的要素。在没有更多限制的情况下,由语句"包括一个……"限定的要素,并不排除 在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
[0129] 本发明可以在由计算机执行的计算机可执行指令的一般上下文中描述,例如程序 模块。一般地,程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组 件、数据结构等等。也可以在分布式计算环境中实践本发明,在这些分布式计算环境中,由 通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中,程序模块可以 位于包括存储设备在内的本地和远程计算机存储介质中。
[0130] 显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精 神和范围。这样,倘若对本发明的这些修改和变型属于本发明权利要求及其等同技术的范 围之内,则本发明也意图包含这些改动和变型在内。
【权利要求】
1. 一种生成POI数据的方法,其特征在于,包括: 获取P0I原始数据; 根据P0I原始数据的来源所对应的字段设置规则,对所述P0I原始数据进行处理,得到 P0I标准数据; 在预置的P0I数据库中的P0I数据,匹配与所述P0I标准数据描述同一个P0I的P0I 数据; 若匹配不到,则将所述P0I标准数据添加至所述P0I数据库中; 若匹配到,则对所述P0I标准数据与其匹配的P0I数据进行融合处理,用融合处理得到 的P0I数据更新所述匹配的P0I数据。
2. 根据权利要求1所述的方法,其特征在于,获取P0I原始数据之后,还包括: 获取P0I原始数据的来源; 在预存的P0I数据来源与来源数据字段设置规则的对应关系中,查找所述P0I原始数 据的来源对应的字段设置规则; 根据P0I原始数据的来源所对应的字段设置规则,对该P0I原始数据进行处理,得到 P0I标准数据,具体为: 按照所述P0I原始数据的来源对应的字段设置规则,从所述P0I原始数据中提取相应 字段的内容; 将提取出的字段的内容按照P0I数据库中P0I数据格式组织成P0I标准数据。
3. 根据权利要求2所述的方法,其特征在于,从所述P0I原始数据中提取相应字段的内 容之后,还包括: 判断所述提取字段的内容中是否不包含地址和经纬度坐标; 若是,则确定所述P0I原始数据为无效数据,丢弃所述P0I原始数据;若否,则执行所述 将提取出的字段内容按照P0I数据库中的P0I数据的格式组织成P0I标准数据的步骤。
4. 根据权利要求3所述的方法,其特征在于,在得到P0I标准数据之后,还包括: 判断所述P0I标准数据是否存在内容为空的字段,若存在,则根据所述P0I标准数据中 与内容为空的字段有关的字段的内容,获取内容为空的字段的内容,并将获取到的内容添 加至到所述P0I标准数据相应的字段中。
5. 根据权利要求4所述的方法,其特征在于,根据所述P0I标准数据中与空字段有关的 字段的内容,获取空字段的内容,并将获取的内容添加至到所述空字段中,具体包括: 若内容为空的是地址字段或经纬度字段,则采用逆地理编码算法根据经纬度坐标字段 中的经纬度坐标得到地址,并将得到的地址补充到所述P0I标准数据的地址字段中,或采 用地理编码算法根据地址字段中的地址,得到经纬度坐标,并将获取的经纬度坐标补充到 所述P0I标准数据的经纬度坐标字段中; 和/或, 若内容为空的是类别字段,则根据所述P0I标准数据中的名称字段判断所述P0I的类 另IJ,并获取所述类别对应的代码,将获取的代码补充到所述P0I标准数据的类别字段中。
6. 根据权利要求4所述的方法,其特征在于,所述P0I标准数据包括基础信息字段,对 所述P0I标准数据与其匹配的P0I数据进行融合处理,具体包括: 获取P0I标准数据的基础信息字段中的每个字段的来源与其匹配的P0I数据的基础信 息字段中的对应字段的来源,若来源不一致,则从预置的字段与来源的优先级的对应关系 中获取POI标准数据的该字段的来源的优先级和所述POI数据的该字段的来源的优先级, 将优先级高的字段的内容确定为融合处理得到的POI数据的基础字段中对应字段的内容。
7. 根据权利要求6所述的方法,其特征在于,所述POI标准数据还包括深度信息字段, 对所述POI标准数据与其匹配的POI数据进行融合处理,还包括: 将所述POI标准数据的深度信息字段中的每个字段的内容与其匹配的POI数据的深度 信息字段中的对应字段的内容进行合并处理,将合并处理得到的内容确定为融合处理得到 的POI数据的深度信息字段中的对应字段的内容。
8. 根据权利要求6所述的方法,其特征在于,在预置的POI数据库中的POI数据,匹配 与所述POI标准数据描述同一个POI的POI数据,具体包括: 计算所述POI标准数据的基础信息字段与所述POI数据库中的每一条POI数据的基础 信息字段的相似度; 当计算得到的相似度均小于预置的相似度阈值时,则确定匹配不到与所述POI标准数 据描述同一个POI的POI数据; 当计算得到的至少一个相似度大于或等于所述相似度阈值时,则将相似度中最大的一 个对应的POI数据确定为与所述POI标准数据描述同一个POI的POI数据。
9. 根据权利要求1所述的方法,其特征在于,所述获取POI原始数据,具体为:周期性 或定期地从各来源获取POI原始数据; 在获取到POI原始数据之后,还包括: 将本次获取的POI原始数据与前一次从各来源获取的POI原始数据进行比较,根据比 较结果对本次和前一次获取的POI原始数据的状态标记进行设置; 提取本次获取的POI原始数据的状态标记,当所述POI原始数据的状态标记为新增标 记或修改标记时,执行所述根据POI原始数据的来源所对应的字段设置规则,对所述POI原 始数据进行处理,得到POI标准数据步骤。
10. 根据权利要求9所述的方法,其特征在于,根据比较结果对本次和前一次获取的 POI原始数据的状态标记进行设置,具体包括: 针对本次获取的每一条POI原始数据,执行以下步骤:若本次获取的POI原始数据不包 含在前一次获取的POI原始数据中,则将本次获取的POI原始数据的状态标记设置为新增 标记;若本次获取的POI原始数据包含在前一次获取的POI原始数据中且字段有更新,则将 本次获取的POI原始数据的状态标记设置为修改标记,若字段没有更新,则不对本次获取 的POI原始数据的状态标记进行处理; 若前一次获取的POI原始数据不包含在本次获取的POI原始数据中,则将前一次获取 的POI原始数据的状态标记设置为删除标记。
11. 根据权利要求10所述的方法,其特征在于,得到POI标准数据之后,还包括: 将本次得到的POI标准数据的状态标记设置为与其对应的POI原始数据的状态标记一 致; 将本次得到的状态标记为新增标记的POI标准数据添加到用于存储POI标准数据和 POI原始数据的存储空间中; 以及,用本次得到的状态标记为修改标记的POI标准数据替换所述存储空间中对应的 P01标准数据; 以及,将存储空间中与前一次获得的且状态标记为删除标记的POI原始数据所对应的 P0I标准数据的状态标记修改为删除标记。
12. 根据权利要求11所述的方法,其特征在于,当本次得到的P0I标准数据的状态标 记为修改标记,且在预置的P0I数据库中能匹配与所述P0I标准数据描述同一个P0I的P0I 数据时,方法还包括: 判断与所述P0I标准数据匹配成功的P0I数据是否为前一次与所述P0I标准数据匹配 成功的P0I数据; 若否,则将所述存储空间中的前一次与所述P0I标准数据匹配同一 P0I数据且状态标 记为非删除标记的其他P0I标准数据,分别与所述P0I数据库中的P0I数据进行匹配,并在 匹配到P0I数据时,执行对所述其他P0I标准数据与其匹配的P0I数据进行融合处理,用融 合处理得到的P0I数据更新所述匹配的P0I数据的步骤。
13. -种生成P0I数据的装置,其特征在于,包括: 原始数据获取单元,用于获取P0I原始数据; 数据生成单元,用于根据P0I原始数据的来源所对应的字段设置规则,对所述P0I原始 数据进行处理,得到P0I标准数据; 第一匹配单元,用于在预置的P0I数据库中的P0I数据,匹配与所述P0I标准数据描述 同一个P0I的P0I数据,若匹配不到则触发第一存储单元,若匹配到则触发数据融合单元; 第一存储单元,用于将所述P0I标准数据添加至所述P0I数据库中; 数据融合单元,用于对所述P0I标准数据与其匹配的P0I数据进行融合处理,用融合处 理得到的P0I数据更新所述匹配的P0I数据。
14. 根据权利要求13所述的装置,其特征在于,装置还包括: 来源获取单元,用于在所述原始数据获取单元获取P0I原始数据之后,获取P0I原始数 据的来源; 字段设置规则查找单元,用于在预存的P0I数据来源与来源数据字段设置规则的对应 关系中,查找所述P0I原始数据的来源对应的字段设置规则; 所述数据生成单元,具体包括: 字段内容提取子单元,用于按照所述P0I原始数据的来源对应的字段设置规则,从所 述P0I原始数据中提取相应字段的内容; 数据生成子单元,用于将字段内容提取子单元提取出的字段的内容按照P0I数据库中 P0I数据格式组织成P0I标准数据。
15. 根据权利要求14所述的装置,其特征在于,所述装置还包括: 第一判断单元,用于判断所述字段内容提取子单元提取字段的内容中是否不包含地址 和经纬度坐标,若是则确定所述P0I原始数据为无效数据,丢弃所述P0I原始数据,若否则 触发数据生成子单元。
16. 根据权利要求15所述的装置,其特征在于,装置还包括: 第二判断单元,用于在所述数据生成子单元得到P0I标准数据之后,判断所述P0I标 准数据是否存在内容为空的字段,若存在,则触发字段补充单元; 字段补充单元,根据所述P0I标准数据中与内容为空的字段有关的字段的内容,获取 内容为空的字段的内容,并将获取到的内容添加至到所述POI标准数据相应的字段中。
17. 根据权利要求16所述的装置,其特征在于,所述字段补充单元,具体用于: 若内容为空的是地址字段或经纬度字段,则采用逆地理编码算法根据经纬度坐标字段 中的经纬度坐标得到地址,并将得到的地址补充到所述P0I标准数据的地址字段中或采用 地理编码算法根据地址字段中的地址,得到经纬度坐标,并将获取的经纬度坐标补充到所 述P0I标准数据的经纬度坐标字段中; 和/或, 若内容为空的是类别字段,则根据所述P0I标准数据中的名称字段判断所述P0I的类 另IJ,并获取所述类别对应的代码,将获取的代码补充到所述P0I标准数据的类别字段中。
18. 根据权利要求16所述的装置,其特征在于,所述P0I标准数据包括基础信息字段, 所述数据融合单元对所述P0I标准数据与其匹配的P0I数据进行融合处理,具体用于: 获取P0I标准数据的基础信息字段中的每个字段的来源与其匹配的P0I数据的基础信 息字段中的对应字段的来源,若来源不一致,则从预置的字段与来源的优先级的对应关系 中获取P0I标准数据的该字段的来源的优先级和所述P0I数据的该字段的来源的优先级, 将优先级高的字段的内容确定为融合处理得到的P0I数据的基础字段中对应字段的内容。
19. 根据权利要求18所述的装置,其特征在于,所述P0I标准数据还包括深度信息字 段,所述数据融合单元对所述P0I标准数据与其匹配的P0I数据进行融合处理,还进一步用 于: 将所述P0I标准数据的深度信息字段中的每个字段的内容与其匹配的P0I数据的深 度信息字段中的对应字段的内容进行合并处理,将合并处理得到的内容确定为融合处理得 到的P0I数据的深度信息字段中的对应字段的内容。
20. 根据权利要求19所述的装置,其特征在于,所述第一匹配单元,具体用于: 计算所述P0I标准数据的基础信息字段与所述P0I数据库中的每一条P0I数据的基础 信息字段的相似度; 当计算得到的相似度均小于预置的相似度阈值时,则确定匹配不到与所述P0I标准数 据描述同一个P0I的P0I数据; 当计算得到的至少一个相似度大于或等于所述相似度阈值时,则将相似度中最大的一 个对应的P0I数据确定为与所述P0I标准数据描述同一个P0I的P0I数据。
21. 根据权利要求13所述的装置,其特征在于,所述装置还包括第一状态标记设置单 元和状态标记获取单元; 所述P0I原始数据获取单元,具体应用于:周期性或定期地从各来源获取P0I原始数 据; 第一状态标记设置单元,用于将所述P0I原始数据获取单元本次获取的P0I原始数 据与前一次从各来源获取的P0I原始数据进行比较,根据比较结果对本次和前一次获取的 P0I原始数据的状态标记进行设置; 状态标记获取单元,用于提取本次获取的P0I原始数据的状态标记,当所述P0I原始数 据的状态标记为新增标记或修改标记时,触发所述数据生成单元。
22. 根据权利要求21所述的装置,其特征在于,所述第一状态标记设置单元根据比较 结果对本次和前一次获取的P0I原始数据的状态标记进行设置,具体用于: 针对本次获取的每一条POI原始数据,执行以下步骤:若本次获取的POI原始数据不包 含在前一次获取的P0I原始数据中,则将本次获取的P0I原始数据的状态标记设置为新增 标记;若本次获取的P0I原始数据包含在前一次获取的P0I原始数据中且字段有更新,则将 本次获取的P0I原始数据的状态标记设置为修改标记,若字段没有更新,则不对本次获取 的P0I原始数据的状态标记进行处理; 若前一次获取的P0I原始数据不包含在本次获取的P0I原始数据中,则将前一次获取 的P0I原始数据的状态标记设置为删除标记。
23. 根据权利要求22所述的装置,其特征在于,还包括: 第二状态标记设置单元,用于在所述数据生成单元得到P0I标准数据之后,将本次得 到的P0I标准数据的状态标记设置为与其对应的P0I原始数据的状态标记一致; 第二存储单元,用于将本次得到的状态标记为新增标记的P0I标准数据添加到用于存 储P0I标准数据和P0I原始数据的存储空间中; 数据更新单元,用于用本次得到的状态标记为修改标记的P0I标准数据替换所述存储 空间中对应的P0I标准数据;以及,将存储空间中与前一次获得的且状态标记为删除标记 的P0I原始数据所对应的P0I标准数据的状态标记修改为删除标记。
24. 根据权利要求23所述的装置,其特征在于,当本次得到的P0I标准数据的状态标 记为修改标记,且在预置的P0I数据库中能匹配与所述P0I标准数据描述同一个P0I的P0I 数据时,所述装置还包括第三判断单元和第二匹配单元,其中: 第三判断单元,用于判断与所述P0I标准数据匹配成功的P0I数据是否为前一次与所 述P0I标准数据匹配成功的P0I数据,若否则触发第二匹配单元; 第二匹配单元,用于将所述存储空间中的前一次与所述P0I标准数据匹配同一 P0I数 据且状态标记为非删除标记的其他P0I标准数据,分别与所述P0I数据库中的P0I数据进 行匹配,并在匹配到P0I数据时触发数据融合单元; 数据融合处理单元进一步用于,对所述其他P0I标准数据与其匹配的P0I数据进行融 合处理,用融合处理得到的P0I数据更新所述匹配的P0I数据。
【文档编号】G06F17/30GK104216895SQ201310211754
【公开日】2014年12月17日 申请日期:2013年5月31日 优先权日:2013年5月31日
【发明者】彭钊 申请人:高德软件有限公司