一种基于字符串匹配的标识异构识别方法及系统与流程

文档序号:23706655发布日期:2021-01-23 13:45阅读:68来源:国知局
一种基于字符串匹配的标识异构识别方法及系统与流程

[0001]
本发明涉及标识异构识别技术领域,特别是涉及一种基于字符串匹配的标 识异构识别方法及系统。


背景技术:

[0002]
标识是由一串字符组成,用于对一定场景下的某一特定物品进行表达,通 过标识解析可以将各个物品与数据建立联系,且各个独立物品之间还能建立关 联,这样能够对物品进行有效地管理,因此标识在信息化时代的今天确实发挥 着至关重要的作用。
[0003]
但现阶段已经出现了多种主流的标识编码规则,如handle(doi)、oid、 ecode、epc,且不同的编码系统不光编码规则不同,标识解析系统不互通, 且缺乏统一的标识编码结构,因此不同标识系统的解析服务无法兼容,出现了 标识异构的问题,这对工业互联网中的互联互通提出了挑战,阻碍了工业互联 网互联互通的发展。
[0004]
相关的解决方法主要是改变现阶段已有的标准标识编码结构,主要包括: 1.提出新的标识编码,2.对不同标识系统的标识重新再编码,转换成同一种标 识,3.在需要兼容的标识上加入一段额外的兼容字段,实现兼容解析。这些解 决方法在一定程度上能够解决存在的标识异构问题,但这些方法并没有从根本 上解决工业互联网由于标识服务而产生的信息交流受阻,若重新采用新的标识 编码,很难起到统一的作用,反而会进一步加剧了标识的异构问题。而且从某 种意义上来说,当标识重新添加一段,已经违反了原有标识的编码规则,使得 原有的解析服务无法进行解析,因此标识异构问题在较长的一段时间内会存在 在工业互联网中的每一个生产阶段。


技术实现要素:

[0005]
本发明的目的是提供一种基于字符串匹配的标识异构识别方法及系统,解 决了工业互联网中存在的异构标识编码冲突问题和异构标识解析协议冲突问 题。
[0006]
为实现上述目的,本发明提供了如下方案:
[0007]
一种基于字符串匹配的标识异构识别方法,包括:
[0008]
获取标识信息;
[0009]
对所述标识信息进行解析,判断是否能够得到解析结果,得到第一判断结 果;若所述第一判断结果为是,则将所述解析结果输出;若所述第一判断结果 为否,则根据所述标识信息中的字符对所述标识信息进行初步识别,得到初步 识别结果;所述初步识别结果包括一种或多种标识解析体系;
[0010]
选取所述初步识别结果中的一种标识解析体系;
[0011]
获取与选取的标识解析体系对应的匹配模式;所述匹配模式包括模式整体 和匹配模式片段,所述模式整体和所述匹配模式片段根据标准标识的编码结构 确定;
[0012]
根据所述匹配模式对所述标识信息的编码格式进行匹配,判断所述标识信 息是否与所述匹配模式对应的标识解析体系匹配,得到第二判断结果;若所述 第二判断结果为
否,则输出匹配失败结果;若所述第二判断结果为是,则确定 所述匹配模式的匹配模式片段在所述标识信息中的位置;
[0013]
根据所述匹配模式的匹配模式片段在所述标识信息中的位置采用标识编 码规则进行校验,得到校验结果;若所述校验结果为选取的标识解析体系与所 述标识信息匹配,则将所述标识信息发送至与所述选取的标识解析体系对应的 标识解析服务器中进行解析;若所述校验结果为选取的标识解析体系与所述标 识信息不匹配,则输出匹配失败结果。
[0014]
可选的,在所述第二判断结果为否,则输出匹配失败结果,之后还包括:
[0015]
判断是否选取完所述初步识别结果中的所有标识解析体系;若是,则输出 所述标识信息为非标准标识,并结束运行;若否,则更新标识解析体系,然后 返回步骤“获取与选取的标识解析体系对应的匹配模式”。
[0016]
可选的,在所述校验结果为选取的标识解析体系与所述标识信息不匹配, 则输出匹配失败结果,之后还包括:
[0017]
返回步骤“判断是否选取完所述初步识别结果中的所有标识解析体系”。
[0018]
可选的,所述根据所述标识信息中的字符对所述标识信息进行初步识别, 得到初步识别结果,具体包括:
[0019]
判断所述标识信息中的字符是否包括“/”;
[0020]
若包括“/”,则将所述标识信息确定为第一标识解析体系类型;所述第一 标识解析体系类型包括handle类和doi类;
[0021]
若不包括“/”,则判断所述标识信息中的字符是否包括“.”;
[0022]
若包括“.”,则所述标识信息确定为第二标识解析体系类型;所述第二标 识解析体系类型包括oid类和epc类;
[0023]
若不包括“.”,则将所述标识信息确定为第三标识解析体系类型;所述第 三标识解析体系类型包括ecode类。
[0024]
可选的,
[0025]
与oid类对应的匹配模式包括与oid类对应的模式整体φ.φ.φ.φ和与oid 类对应的匹配模式片段p
11
=p
21
=p
31
='.';其中,p
11
、p
21
和p
31
分别为与oid类 对应的匹配模式片段第一字符、第二字符和第三字符,φ为通配字符;
[0026]
与epc类对应的匹配模式包括与epc类对应的模式整体φ.φ.φ.φ和与epc 类对应的匹配模式片段p
12
=p
22
=p
32
='.';其中,p
12
、p
22
和p
32
分别为与epc类 对应的匹配模式片段第一字符、第二字符和第三字符;
[0027]
与handle类对应的匹配模式包括与handle类对应的模式整体φ.φ.φ/φ和与 handle类对应的匹配模式片段p
13
=p
23
='.',p
33
='/';其中,p
13
、p
23
和p
33
分别为 与handle类对应的匹配模式片段第一字符、第二字符和第三字符;
[0028]
与doi类对应的匹配模式包括与doi类对应的模式整体10.φ/φ和与doi 类对应的匹配模式片段p
14
='1',p
24
='0',p
34
='.',p
44
='/';其中,p
14
、p
24
、p
34
和p
44
分别为与doi类对应的匹配模式片段第一字符、第二字符、第三字符和第四 字符;
[0029]
与ecode类对应的匹配模式包括与ecode类对应的模式整体e=φ和与 ecode类对应的匹配模式片段p
15
='e',p
25
='=';其中,p
15
和p
25
分别为与ecode 类对应的匹配模式片
段第一字符和第二字符,e表示ecode标识。
[0030]
可选的,所述根据所述匹配模式对所述标识信息的编码格式进行匹配,判 断所述标识信息是否与所述匹配模式对应的标识解析体系匹配,得到第二判断 结果,具体包括:
[0031]
从所述标识信息的第一个字符开始,判断是否出现所述匹配模式的匹配模 式片段中所有的字符;
[0032]
若出现所述匹配模式的匹配模式片段中所有的字符,则所述标识信息与所 述匹配模式对应的标识解析体系匹配。
[0033]
可选的,所述确定所述匹配模式的匹配模式片段在所述标识信息中的位 置,具体包括:
[0034]
确定所述匹配模式的匹配模式片段中最后一个字符在所述标识信息中的 位置,得到末端位置;
[0035]
从所述末端位置开始,向所述标识信息的首端字符方向确定所述匹配模式 的匹配模式片段中所有的字符在所述标识信息中的位置,得到匹配模式的匹配 模式片段在所述标识信息中的位置。
[0036]
可选的,所述根据所述匹配模式的匹配模式片段在所述标识信息中的位置 采用标识编码规则进行校验,得到校验结果,具体包括:
[0037]
当所述选取的标识解析体系为handle类时,采用occ(p
13
)<occ(p
33
), occ(p
23
)<occ(p
33
),occ(p
13
)<4进行校验;
[0038]
当所述选取的标识解析体系为doi类时,采用occ(p
14
)=1,occ(p
24
)=2, occ(p
34
)=3,occ(p
44
)>4进行校验;
[0039]
当所述选取的标识解析体系为ecode类时,采用occ(p
15
)=1,occ(p
25
)=2 进行校验;
[0040]
其中,occ(
·
)表示字符位于标识信息中的位置。
[0041]
本发明还提供一种基于字符串匹配的标识异构识别系统,包括:
[0042]
标识信息获取模块,用于获取标识信息;
[0043]
解析模块,用于对所述标识信息进行解析,判断是否能够得到解析结果, 得到第一判断结果;若所述第一判断结果为是,则执行解析结果输出模块;若 所述第一判断结果为否,则执行初步识别模块;
[0044]
执行解析结果输出模块,用于将所述解析结果输出;
[0045]
初步识别模块,用于根据所述标识信息中的字符对所述标识信息进行初步 识别,得到初步识别结果;所述初步识别结果包括一种或多种标识解析体系;
[0046]
标识解析体系选取模块,用于选取所述初步识别结果中的一种标识解析体 系;
[0047]
匹配模式获取模块,用于获取与选取的标识解析体系对应的匹配模式;所 述匹配模式包括模式整体和匹配模式片段,所述模式整体和所述匹配模式片段 根据标准标识的编码结构确定;
[0048]
编码格式匹配模块,用于根据所述匹配模式对所述标识信息的编码格式进 行匹配,判断所述标识信息是否与所述匹配模式对应的标识解析体系匹配,得 到第二判断结果;若所述第二判断结果为否,则执行匹配失败输出模块;若所 述第二判断结果为是,则执行位置确定模块;
[0049]
位置确定模块,用于确定所述匹配模式的匹配模式片段在所述标识信息中 的位置;
[0050]
校验模块,用于根据所述匹配模式的匹配模式片段在所述标识信息中的位 置采用标识编码规则进行校验,得到校验结果;若所述校验结果为选取的标识 解析体系与所述标识信息匹配,则执行信息发送模块;若所述校验结果为选取 的标识解析体系与所述标识信息不匹配,则执行匹配失败输出模块;
[0051]
信息发送模块,用于将所述标识信息发送至与所述选取的标识解析体系对 应的标识解析服务器中进行解析;
[0052]
匹配失败输出模块,用于输出匹配失败结果。
[0053]
可选的,还包括:
[0054]
判断模块,用于判断是否选取完所述初步识别结果中的所有标识解析体 系;若是,则执行非标准标识输出模块;若否,则执行标识解析体系更新模块;
[0055]
非标准标识输出模块,用于输出所述标识信息为非标准标识,并结束运行;
[0056]
标识解析体系更新模块,用于更新标识解析体系,然后执行所述匹配模式 获取模块。
[0057]
与现有技术相比,本发明的有益效果是:
[0058]
本发明提出了一种基于字符串匹配的标识异构识别方法及系统,对标识信 息进行解析,若不能够得到解析结果,则根据标识信息中的字符对标识信息进 行初步识别,选取初步识别结果中的一种标识解析体系;获取与选取的标识解 析体系对应的匹配模式;根据匹配模式对标识信息的编码格式进行匹配,若标 识信息是与匹配模式对应的标识解析体系匹配,则确定匹配模式的匹配模式片 段在标识信息中的位置,并根据位置采用标识编码规则进行校验,解决了工业 互联网中存在的异构标识编码冲突问题和异构标识解析协议冲突问题。
附图说明
[0059]
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施 例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是 本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性 的前提下,还可以根据这些附图获得其他的附图。
[0060]
图1为本发明实施例中基于字符串匹配的标识异构识别方法流程图;
[0061]
图2为本发明实施例中对等网络示意图;
[0062]
图3为本发明实施例中标识异构解析流程图;
[0063]
图4为本发明实施例中标识信息转发流程图。
具体实施方式
[0064]
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清 楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是 全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造 性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
[0065]
本发明的目的是提供一种基于字符串匹配的标识异构识别方法及系统,解 决了工业互联网中存在的异构标识编码冲突问题和异构标识解析协议冲突问 题。
[0066]
为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和 具体实施方式对本发明作进一步详细的说明。
[0067]
工业互联网存在着不同的标识体系,主流的几种标准标识系统包括: handle(doi)、oid、ecode、epc,这四种不同的标识系统对应的其标识解 析系统不同,其中epc、oid采用的均为域名系统(dns)解析,ecode可以 采用域名系统(dns)和轻量目录访问协议(ldap)两种方式实现解析,handle 的标识解析协议则完全不同于dns的handle system进行解析。
[0068]
由此可见,物联网标识不仅在编码层面存在异构冲突问题,还在对应的解 析协议层面也存在异构标识解析协议冲突问题,导致采用不同标识解析协议的 物联网标识之间无法统一解析。且现阶段还没有出现统一的标识体系,因此不 同标识存在着标识不互通的问题,这不利于各行业之间的数据交流,且阻碍了 工业互联网的互联互通。
[0069]
因此本发明旨在解决工业互联网中存在的标识异构问题,设计一个能够实 现任意一个标识解析端输入,可以对不同标识体系下的标识提供解析服务,提 供了一种基于字符串匹配的标识异构识别方法及系统。该方法首先利用标识载 体读取标识信息,发送至本地解析服务器,如果该标识解析系统能够解析,便 直接解析返回解析结果给客户端,如果不能解析,便向上传送到对等网络中, 利用建立的基于字符串模式匹配的异构识别机制,能够区别出该标识属于哪种 标识解析系统,接着在对等网络中,利用相应的转发机制,便把标识信息发送 给了相应的标识解析系统,最后再返回解析结果,实现了异构标识之间存在着 无法互通解析的问题,若在异构识别机制中匹配失败,直接返回输入错误结果 返回客户端。
[0070]
实施例
[0071]
图1为本发明实施例中基于字符串匹配的标识异构识别方法流程图,如图 1所示,一种基于字符串匹配的标识异构识别方法,包括:
[0072]
步骤101:获取标识信息。
[0073]
步骤102:对标识信息进行解析,判断是否能够得到解析结果,得到第一 判断结果;若第一判断结果为是,则执行步骤103;若第一判断结果为否,则 执行步骤104。
[0074]
步骤103:输出解析结果。
[0075]
步骤104:根据标识信息中的字符对标识信息进行初步识别,得到初步识 别结果;初步识别结果包括一种或多种标识解析体系。
[0076]
具体的,客户端首先向本地标识解析服务器发起标识解析请求,如果能实 现解析,则直接输出解析结果,如果无法解析,则将解析请求向上转发,当标 识根解析服务器能够解析时,输出解析结果,当标识根解析服务器不能解析时, 再传送到对等网络中进行进一步标识信息的识别,得到识别结果则发送到相应 的解析服务器中,若无法识别,则返回为非标准标识的解析结果。
[0077]
步骤104,具体包括:
[0078]
判断标识信息中的字符是否包括“/”;
[0079]
若包括“/”,则将标识信息确定为第一标识解析体系类型;第一标识解析 体系类
型包括handle类和doi类;
[0080]
若不包括“/”,则判断标识信息中的字符是否包括“.”;
[0081]
若包括“.”,则标识信息确定为第二标识解析体系类型;第二标识解析体 系类型包括oid类和epc类;
[0082]
若不包括“.”,则将标识信息确定为第三标识解析体系类型;第三标识解 析体系类型包括ecode类。
[0083]
步骤105:选取初步识别结果中的一种标识解析体系。
[0084]
步骤106:获取与选取的标识解析体系对应的匹配模式;匹配模式包括模 式整体和匹配模式片段,模式整体和匹配模式片段根据标准标识的编码结构确 定。
[0085]
与oid类对应的匹配模式包括与oid类对应的模式整体φ.φ.φ.φ和与oid 类对应的匹配模式片段p
11
=p
21
=p
31
='.';其中,p
11
、p
21
和p
31
分别为与oid类 对应的匹配模式片段第一字符、第二字符和第三字符;φ表示该模式整体中的 通配字符,即可以匹配任意字符;
[0086]
与epc类对应的匹配模式包括与epc类对应的模式整体φ.φ.φ.φ和与epc 类对应的匹配模式片段p
12
=p
22
=p
32
='.';其中,p
12
、p
22
和p
32
分别为与epc类 对应的匹配模式片段第一字符、第二字符和第三字符;
[0087]
与handle类对应的匹配模式包括与handle类对应的模式整体φ.φ.φ/φ和与 handle类对应的匹配模式片段p
13
=p
23
='.',p
33
='/';其中,p
13
、p
23
和p
33
分别为 与handle类对应的匹配模式片段第一字符、第二字符和第三字符;
[0088]
与doi类对应的匹配模式包括与doi类对应的模式整体10.φ/φ和与doi 类对应的匹配模式片段p
14
='1',p
24
='0',p
34
='.',p
44
='/';其中,p
14
、p
24
、p
34
和p
44
分别为与doi类对应的匹配模式片段第一字符、第二字符、第三字符和第四 字符;
[0089]
与ecode类对应的匹配模式包括与ecode类对应的模式整体e=φ和与 ecode类对应的匹配模式片段p
15
='e',p
25
='=';其中,p
15
和p
25
分别为与ecode 类对应的匹配模式片段第一字符和第二字符,e表示ecode标识。
[0090]
步骤107:根据匹配模式对标识信息的编码格式进行匹配,判断标识信息 是否与匹配模式对应的标识解析体系匹配,得到第二判断结果;若第二判断结 果为否,则执行步骤111;若第二判断结果为是,则执行步骤108。
[0091]
步骤107,具体包括:
[0092]
从标识信息的第一个字符开始,判断是否按顺序依次出现匹配模式的匹配 模式片段中所有的字符;顺序为匹配模式的匹配模式片段中的字符排列顺序;
[0093]
若按顺序依次出现匹配模式的匹配模式片段中所有的字符,则标识信息与 匹配模式对应的标识解析体系匹配;
[0094]
若未按顺序依次出现匹配模式的匹配模式片段中所有的字符,则标识信息 与匹配模式对应的标识解析体系不匹配。
[0095]
步骤108:确定匹配模式的匹配模式片段在标识信息中的位置。
[0096]
步骤108,具体包括:
[0097]
确定匹配模式的匹配模式片段中最后一个字符在标识信息中的位置,得到 末端位置;
[0098]
从末端位置开始,向标识信息的首端字符方向按顺序依次确定匹配模式的 匹配模式片段中所有的字符在标识信息中的位置,得到匹配模式的匹配模式片 段在标识信息中的位置。
[0099]
步骤109:根据匹配模式的匹配模式片段在标识信息中的位置采用标识编 码规则进行校验,得到校验结果;若校验结果为选取的标识解析体系与标识信 息匹配,则执行步骤110;若校验结果为选取的标识解析体系与标识信息不匹 配,则执行步骤111。
[0100]
步骤109,具体包括:
[0101]
当选取的标识解析体系为handle类时,采用occ(p
13
)<occ(p
33
), occ(p
23
)<occ(p
33
),occ(p
13
)<4进行校验;
[0102]
当选取的标识解析体系为doi类时,采用occ(p
14
)=1,occ(p
24
)=2, occ(p
34
)=3,occ(p
44
)>4进行校验;
[0103]
当选取的标识解析体系为ecode类时,采用occ(p
15
)=1,occ(p
25
)=2进行 校验。
[0104]
其中,occ(
·
)表示字符位于标识信息中的位置。
[0105]
步骤110:将标识信息发送至与选取的标识解析体系对应的标识解析服务 器中进行解析。
[0106]
步骤111:输出匹配失败结果。
[0107]
步骤112:判断是否选取完初步识别结果中的所有标识解析体系;若是, 则执行步骤113;若否,则执行步骤114。
[0108]
步骤113:输出标识信息为非标准标识,并结束运行;
[0109]
步骤114:更新标识解析体系,然后返回步骤106。
[0110]
一种基于字符串匹配的标识异构识别系统,包括:
[0111]
标识信息获取模块,用于获取标识信息。
[0112]
解析模块,用于对标识信息进行解析,判断是否能够得到解析结果,得到 第一判断结果;若第一判断结果为是,则执行解析结果输出模块;若第一判断 结果为否,则执行初步识别模块。
[0113]
执行解析结果输出模块,用于将解析结果输出。
[0114]
初步识别模块,用于根据标识信息中的字符对标识信息进行初步识别,得 到初步识别结果;初步识别结果包括一种或多种标识解析体系。
[0115]
标识解析体系选取模块,用于选取初步识别结果中的一种标识解析体系。
[0116]
匹配模式获取模块,用于获取与选取的标识解析体系对应的匹配模式;匹 配模式包括模式整体和匹配模式片段,模式整体和匹配模式片段根据标准标识 的编码结构确定。
[0117]
编码格式匹配模块,用于根据匹配模式对标识信息的编码格式进行匹配, 判断标识信息是否与匹配模式对应的标识解析体系匹配,得到第二判断结果; 若第二判断结果为否,则执行匹配失败输出模块;若第二判断结果为是,则执 行位置确定模块。
[0118]
位置确定模块,用于确定匹配模式的匹配模式片段在标识信息中的位置。
[0119]
校验模块,用于根据匹配模式的匹配模式片段在标识信息中的位置采用标 识编码规则进行校验,得到校验结果;若校验结果为选取的标识解析体系与标 识信息匹配,则执行信息发送模块;若校验结果为选取的标识解析体系与标识 信息不匹配,则执行匹配失败输出模块。
[0120]
信息发送模块,用于将标识信息发送至与选取的标识解析体系对应的标识 解析服务器中进行解析。
[0121]
匹配失败输出模块,用于输出匹配失败结果。
[0122]
判断模块,用于判断是否选取完初步识别结果中的所有标识解析体系;若 是,则执行非标准标识输出模块;若否,则执行标识解析体系更新模块。
[0123]
非标准标识输出模块,用于输出标识信息为非标准标识,并结束运行;
[0124]
标识解析体系更新模块,用于更新标识解析体系,然后执行匹配模式获取 模块。
[0125]
对于实施例公开的系统而言,由于其与实施例公开的方法相对应,所以描 述的比较简单,相关之处参见方法部分说明即可。
[0126]
具体采用如下例子说明本发明的基于字符串匹配的标识异构识别方法及 系统。
[0127]
如图2-3所示,本发明利用标识读取载体得到物品标识,发送至本地解析 服务器进行解析。若本地解析服务器能够解析,直接返回解析结果,若无法解 析,向上发送至对等网络层。通过对等网络层的异构识别机制判别属于哪一类 标识。通过对等网络层中的转发机制进行转发,发送至相应的标识解析服务器 进行解析,并返回解析结果。
[0128]
对等网络属于一种网络结构的思想,它改变了现阶段占据主导地位的客户 端/服务器的结构,采用了一种不存在中心服务器的网络构架,在该对等网络 中,每一个节点的地位都是均等的,既能充当服务器,也能为其他节点提供服 务,还能享用其他节点提供的服务。
[0129]
本发明将各标识体系的根解析服务系统组成对等网络的形式,在该对等网 路下,各标识系统相互独立,各自维护自己的标识解析服务,对所属体系的标 识享有完整的解析权利,而各个标识系统之间可以通过对等网络中的转发机制 进行信息的传递。
[0130]
将多种标准标识体系的根解析服务形成p2p网络,搭建如图2的结构,各 节点之间能直接点对点地进行数据交互,通过此对等网络结构,在不需要受任 何一方的控制前提下,每个标识体系的管理机构维护各自的标识解析服务,对 所属标识解析系统有完整的控制权,共同实现异构标识体系下的互联互通。各 解析服务本身的实现方式和解析过程保持原有模式,能完成各标识体系下的标 识解析服务即可。在根对等层利用设计的基于字符串匹配的异构标识识别方 法,能使标识找到其对应的解析系统标识类别,并发送到相应的解析系统中。
[0131]
在本发明中,当解析系统读取了标识的信息,如果本地服务器能够进行解 析,就直接返回解析结果,如果不能解析,便向上传送到对等网络中,利用异 构识别机制,能够区别出该标识属于哪种标识解析系统,接着在对等网络中, 利用相应的转发机制,便把标识信息发送给了相应的标识解析系统,最后再返 回解析结果,实现了异构标识之间存在着的无法解析的问题,具体流程如图3 所示。
[0132]
利用一个实例来表达,如在物联网标识解析过程中,由handle解析服务 接收到物联网标识解析请求,先送入本地解析服务器看是否能够接解析,如果 刚好本地解析服务器接收到的是handle标识直接解析,如果不是通过异构标 识识别方法得知的标识,假设为epc码时,此标识查询请求将被转发到ons 根解析服务,再进一步地使用基于dns迭代式的解析,最后实现完整的解析。 由于中心化的对等网络将多种标识体系根节点整合起来,能够使得不需要任何 一方单方面控制整个解析体系,保证了各标识体系之间各自独立的管
理,且实 现了异构标识体系下标识解析服务之间相互解析,用对等网络的模式而不是将 一种标识体系隶属于另一种标识体系的模式,实现真正的对等解析网络。图4 为标识信息转发流程示意图。
[0133]
本发明涉及到不同标识体系对物品的编码和解析过程,在对识别机制进行 说明前,先对不同的标识体系进行解释说明。
[0134]
handle编码:主要由两部分组成,一部分是命名权限权威域(前缀), 另一部分是命名权限的本地名称,两部分之间是通过ascii字符“/”进行分隔, 对于每一单独的编码部分来说,各层级之间均可以用ascii字符“.”分隔开, 且权威域除了doi标识外均采用三层级的结构。权威域由数字组成,本地名称 则由企业内部的编码规则决定,由数字或者字母组成,其写成规则的形式为:
ꢀ“
权威域(前缀)/本地名称(后缀)”,每个物品编码唯一。
[0135]
doi编码:是一种特定的handle编码,它是handle系统分配了一个特定 的权威域模式“10.注册者代码”,命名规则完全遵从于handle编码,其写成规 则的形式为:“10.注册者代码/自定义字符串”,物品编码唯一。
[0136]
oid标识:oid是网络通信中用于标识对象/客体唯一身份的标识符,oid 的结构是一种树状结构,不同层次之间用“.”分隔,oid名称包括数字和字母 数字两种形式,数字名称的值是一个大于0小于16000000的正整数,字母数 字名称形式的值是一个不少于1个字符并且不大于100个字符的可变长度字符 串,物品编码唯一,写成编码规则的形式为:“国家的oid编码+自定义编码 (长度不定)”,其中国家的一段oid编码有三个层级。
[0137]
ecode标识:作为物联网统一标识体系,它的特点在于无明显的层级界限 符,但是总的编码结构在解析内容上可以分为三段,均采用数字或者字母的形 式,归纳成为编码规则的形式为:“e=版本+编码体系标识+主码”。
[0138]
epc标识:产品电子代码(electronic product code)是下一代产品标识代码, 采用层级结构进行编码,不同的层级之间的分隔符选用的是ascii中的“.”, epc的每一层级的编码均是由数字和字母组成,每一层级代表着不同的含义, 可以写成编码规则形式为:“版本号+epc域名管理+对象分类+序列号”,不同版 本的编码规则如表1。
[0139]
表1 epc不同版本下的编码规则
[0140][0141]
首先根据各类标准标识的编码规则,寻找各类标识的识别特点,并建立各 类标识的识别规则如表2。
[0142]
表2标识的识别规则
[0143][0144][0145]
根据该识别规则的发现,部分标识的特点较为明显,因而可以通过初筛对 标识进行分类,建立的初筛规则为:
[0146]
1.是否具有字符“/”,筛选出handle类、doi类
[0147]
2.是否具有字符“.”,筛选出oid类、epc类
[0148]
3.两者均无,筛选出ecode类。
[0149]
通过这样的一个筛选机制可以对不同标识进行预处理,大大降低了字符串 模式匹配的次数,提高了标识匹配的效率。
[0150]
标识是由字符构成的一条字符串构成的,因而标识的匹配可以完全视为一 种字符串的匹配,对于识别特定的标准标识而言,只需要匹配的标识的格式能 够完全匹配上,该标识便能够算作为该类标识,因此该问题可以处理为一种带 有通过含通配符的字符串的模式匹配来实现。通过总结各类标准标识的特点, 建立可以用于进行字符串模式匹配的、含有通配符的标识模式串,该含通配符 的模式串主要是用于对标识的编码格式进行匹配,标识中某些特点的字符串以 及位置要求则可用于建立标准标识的模式片段进行匹配,其他位置的字符串可 以通过通配符进行匹配。
[0151]
给定一个物体标识可以表示成这样格式的有限字符集合的形式,记为:
[0152]
s=s
1
s
2

s
n
(n≥0)
[0153]
其中,s指代的是一个物体标识,s
i
(1≤i≤n)标识的是组成标识的字符,且 s[i]=s
i
(1≤i≤n)表示的是标识s中的第i个字符,其中n表示的是一个完整标识 中字符串的长度,包括了层级标识符“.”和“/”。
[0154]
含有通配符的模式p=p
1
φ

φp
j
φ

φp
m
定义为模式整体,其中p
i
代表一个字 符串,在该识别过程中均表示的是长度为1的字符,m表示精确字符串的个数, φ表示通配符,即在模式匹配中可以匹配任何字符,包括空字符串。
[0155]
将含有通配符的模式整体依据通配符的分割可以分解为一个由需要精确 匹配的模式片段的集合seg(p)={p
i
|1≤i≤m},其中p
i
为不含通配符的模式片段, 即需要精确匹配的模式字符。
[0156]
如果标识中的字符串能够被匹配上,则返回该字符串中与模式片段能够相 互匹配上的位置,即可以表示为occ(p
i
),匹配上的全部结果组成匹配集合, 可以表示为occ={occ(p
1
),...,occ(p
m
)}。
[0157]
该匹配方法基于sail方法的思想,主要分为三个阶段:第一阶段为前项搜 索,用
于缩小匹配的范围,第二阶段为反向回溯,返回最佳匹配结果,第三阶 段检验阶段,用于检验匹配结果是否符合要求。且匹配时设立的规则如下:
[0158]
1)方法在扫描文本时会动态构建表格,进行模式字符串匹配时一旦识别 到一个完整的模式整体p时,便会停止动态构建表格,马上进入反向溯回阶段。
[0159]
2)每次匹配时,文本和模式串中的每个字母只能用于匹配一次,进行匹 配时,是按照含通配符的模式串中需要精确匹配的字符出现的先后顺序依次匹 配的,且一旦匹配上便能够将匹配上的原字符串的位置被记录。用符号语言表 示为:
[0160]
s[i]=p
1
,则得到occ
1
(p
1
)={i},直到所有的模式片段均匹配完成,最后返 回总的匹配集合occ
1

[0161]
3)处于反向溯回阶段时,同样的是文本和模式串中的每个字母只能用于 匹配一次,在进行字符匹配时,是按照含通配符的模式串中需要精确匹配的字 符出现的逆向顺序依次匹配的,返回最终的匹配结果。
[0162]
若s[i]=p
1
,则得到occ
2
(p
1
)={i},直到所有的模式片段均匹配完成,最后 返回总的匹配集合occ
2

[0163]
4)若匹配时第二阶段反向溯回阶段与第一次前向搜索矛盾时,以第二次 反向溯回阶段为准,最后的匹配结果occ=occ
2

[0164]
这是因为前项搜索只是为了确保该字符串中至少含有一个模式整体,为了 缩小匹配范围而设立的,但由于每次字符串和模式串均只能匹配一次,因此实 际有多种可能组合,而基于标识匹配的要求,在匹配阶段所有的位置匹配结果 选用的是靠近最后一个精确模式串被匹配上的位置为准,因而返回的结果是以 反向溯回阶段结果为准。
[0165]
5)为了进一步保证标识匹配的准确性,最后需要对通配符的位置和长度 进行检验,减少错误解析的概率。
[0166]
依据各类标识的编码规则,提取出该类标准标识的编码结构,建立含有通 配符的模式整体,并根据通配符的位置划分出需要精确匹配的模式片段,进而 得到各标识的模式整体和模式片段建立如下。
[0167]
oid:φ.φ.φ.φ,其中需要精确匹配的模式片段为p
1
=p
2
=p
3
='.'。
[0168]
epc:φ.φ.φ.φ,其中需要精确匹配的模式片段为p
1
=p
2
=p
3
='.'。
[0169]
handle:φ.φ.φ/φ,其中需要精确匹配的模式片段为p
1
=p
2
='.',p
3
='/'。
[0170]
doi:10.φ/φ,其中需要精确匹配的模式片段为p
1
='1',p
2
='0',p
3
='.',p
4
='/'。
[0171]
ecode:e=φ,其中需要精确匹配的模式片段为p
1
='e',p
2
='='。
[0172]
其中φ表示通配符,可以匹配任意字符。
[0173]
对于能够准确匹配上的标识并不能完全表示该标识就能够完全属于该类 标准标识,需要建立检验机制,通配符的位置和长度进行检验,减少错误解析 的概率,保证是否符合该类标准标识的编码原则。建立的每一类标识的检验机 制为:
[0174]
oid:occ(p
1
)=2,s
1
=0,1,2。
[0175]
epc-64i型:occ(p
1
)=3,occ(p
2
)=25,occ(p
3
)=43。
[0176]
epc-64ii型:occ(p
1
)=3,occ(p
2
)=19,occ(p
3
)=33。
[0177]
epc-64iii型:occ(p
1
)=3,occ(p
2
)=30,occ(p
3
)=44。
[0178]
epc-96型:occ(p
1
)=9,occ(p
2
)=38,occ(p
3
)=63。
[0179]
epc-256i型:occ(p
1
)=9,occ(p
2
)=42,occ(p
3
)=99。
[0180]
epc-256ii型:occ(p
1
)=9,occ(p
2
)=74,occ(p
3
)=131。
[0181]
epc-256iii型:occ(p
1
)=9,occ(p
2
)=138,occ(p
3
)=195。
[0182]
handle:occ(p
1
)<occ(p
3
),occ(p
2
)<occ(p
3
),occ(p
1
)<4。
[0183]
doi:occ(p
1
)=1,occ(p
2
)=2,occ(p
3
)=3,occ(p
4
)>4。
[0184]
ecode:occ(p
1
)=1,occ(p
2
)=2。
[0185]
进而建立全部标准标识的模式匹配规则和检验规则如表3所示,这部分是 该基于含通配符字符串模式匹配的基础。
[0186]
表3含通配符的模式串匹配
[0187][0188][0189]
基于上述描述,则整体的标识匹配方法的过程如下所示,包括以下三个阶 段。
[0190]
第一阶段前向搜索,动态构建匹配表,逐个精确字符串进行构建表格并进 行比对,其步骤包括:
[0191]
1)从标识中的第一个字符开始扫描标识,每次仅扫描一个字符,按照含 通配符的模式整体中需要精确匹配的字符所出现的先后顺序,动态构建该扫描 字符串(即标识)的匹配结果的表格。
[0192]
2)依次动态构建表格,进行逐个精确字符串的模式匹配,一旦识别到一 个完整的模式整体p时,即所有的精确匹配字符刚好匹配完成时,便会停止动 态构建表格,并记录下该匹配位置的匹配集合occ
1
,并马上进入反向溯回阶 段。
[0193]
第二阶段反向匹配,重新从匹配上的最后一个字符串开始匹配,反向匹配 按照字符串中字符出现的反向顺序依次进行匹配,直至匹配至所有的字符串均 能完全匹配上,将反向匹配的结果进行输出。
[0194]
1)从前向搜索到的最后一个字符开始从后往前扫描标识,每次仅扫描一 个字符,按照含通配符的模式整体中需要精确匹配的字符出现的先后顺序的反 向顺序,动态构建该扫描字符的匹配结果的表格,能够匹配上该表格处标上1, 如果无法匹配上,该表格便会标上0。
[0195]
2)依次动态构建表格,进行逐个精确字符串的模式匹配,一旦识别到一 个完整的模式整体p时,即所有的精确匹配字符刚好匹配完成时,便会停止反 向溯回阶段,并记录下该匹配位置的匹配集合occ
2

[0196]
第三阶段检验,对照检验规则,对标识匹配的结果进行检验,进一步确定 标识匹配结果。
[0197]
因此,整个标识识别机制包括标识预处理和含通配符的标识匹配两个步 骤,为了更好地说明,可以写出示例过程为:
[0198]
对一个标识:86.1.8.100/myhandle
[0199]
1.标识预处理:handle类
[0200]
2.进行handle类的模式匹配
[0201]
(handle的匹配模式为φ.φ.φ/φ,精确匹配模式片段为p
1
=p
2
='.',p
3
='/')
[0202]
1)前向搜索
[0203]
建立的向前搜索示意表格如表4所示。
[0204]
表4向前搜索示意表格
[0205]
ꢀꢀ
s
1
s
2
s
3
s
4
s
5
s
6
s
7
s
9
s
10
s
11
s
12
ꢀꢀ
86.1.8.100/p
1
.00

100000000p
2
.0000

1000000p
3
/00000000001
[0206]
构建表格直到最后一个精确字符串被匹配为止,其中
“→”
表示前向阶段匹 配结果,匹配集合表示为occ
1
={3,5,12}。
[0207]
2)反向溯回
[0208]
建立的反向溯回搜索示意表格如表5所示。
[0209]
表5反向溯回示意表格
[0210][0211]
停止匹配直到所有的精确字符串被匹配为止,其中
“↑”
表示反向溯回阶段 匹配结果,匹配集合表示为occ
2
={5,7,12}。
[0212]
因此最后的匹配结果为:occ=occ
2
={5,7,12}。
[0213]
3)检验阶段
[0214]
occ(p
1
)<occ(p
3
),occ(p
2
)<occ(p
3
)均满足,而occ(p
1
)>4,属于非标准 handle
标识,直接返回匹配失败结果。
[0215]
本发明针对标准标识异构系统在编码和解析均存在异构的情况,提供了一 种从同一标识解析系统输入的异构网络,当一种标识从同一输入端口送入本地 解析服务器中时,若本地标识能够进行解析,则返回解析结果,若本地标识无 法进行解析,则将该标识发送到对等网络中,通过异构识别方法,可以发送至 响应的标识解析系统中。本发明实现了多种标识系统共存的问题,实现了各个 标识解析系统对各自标识的全部管理权限。本发明提出了一种标识异构识别方 法,将标准标识如handle(doi)、oid、ecode、epc标识视为字符串,判断 是否满足该类解析系统的编码要求。标识异构识别方法首先采用了标识预处 理,基于最典型的编码标准进行筛选,可以减少标识匹配的次数,提高标识识 别效率。标识匹配方法包括前向搜素、反向溯回、检验三个阶段,提高了匹配 的精度,同时减少了由于识别错误而造成的多余的解析过程。
[0216]
本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施 例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的 一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变 之处。综上,本说明书内容不应理解为对本发明的限制。
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1