对象描述方法及装置、标识体系、电子设备和存储介质与流程

文档序号:18192227发布日期:2019-07-17 05:38阅读:128来源:国知局
对象描述方法及装置、标识体系、电子设备和存储介质与流程
本发明涉及数据库
技术领域
,尤其涉及一种基于语义的对象描述方法及装置、标识体系、电子设备和存储介质。
背景技术
:随着信息技术的发展,很多实体或信息都需要抽象成信息存储到网络中,例如,对于物联网中物联网实体需要进行标识,并对物联网实体的各种属性进行描述。但是在现有技术中,不同的国家和地区都推出了自己的标识体系。不同的标识体系仅可以在支持该标识体系的系统中才能够被识别被解析,从而导致了标识的互通性差及兼容性差的问题。在现有技术中存在handle,oid及ecode三种标识系统试图解决互通性差的问题。但是,可以通过对现有的物联网编码技术进行重新编码与解析的方式,在一定程度上对现有的其它标识技术进行兼容,但是这三种标识体系之间依然存在标识结构异构。此外,当定义一个对象时,除了给该对象分配标识,以标识该对象,还会根据该对象的自身的属性,产生依赖于该标识的且用于描述该对象的属性的预定信息。现有技术中上述三种体系会采用自身的描述规则产生对应的预定信息,故上述三种体系目前均不支持预定信息的互通和兼容。技术实现要素:有鉴于此,本发明实施例期望提供一种基于语义的对象描述方法及装置、标识体系、电子设备和存储介质,至少部分解决上述问题。为达到上述目的,本发明的技术方案是这样实现的:第一方面,本发明实施例提供一种基于语义的对象描述方法,应用于第一体系中,包括:获取目标对象的第一预定信息,其中,所述第一预定信息包括:所述目标对象的标识信息及描述所述目标对象的属性的第一描述信息;根据所述标识信息查询属性库,确定所述目标对象的编码类型对应的编码类型信息,其中,不同编码类型对应不同的标识体系;根据所述第一描述信息查询所述属性库,通过语义匹配将所述第一描述信息映射成使用所述属性库中提供的标准词语的第二描述信息;其中,所述编码类型信息、所述标识信息及所述第二描述信息,共同形成所述目标对象的第二预定信息。可选地,所述属性库包括:公共属性库及专有属性库;所述根据所述标识信息查询属性库,确定所述目标对象的编码类型对应的编码类型信息,包括:根据所述标识信息查询所述公共属性库,确定所述目标对象的编码类型对应的编码类型信息,其中,不同编码类型对应不同的标识体系;所述根据所述第一描述信息查询所述属性库,通过语义匹配将所述第一描述信息映射成使用所述属性库中提供的标准词语的第二描述信息,包括:根据所述第一描述信息查询所述专有属性库,通过语义匹配将所述第一描述信息映射成使用所述专有属性库中提供的标准词语的第二描述信息。可选地,所述方法还包括:根据所述第一预定信息,确定所述目标对象的类型;根据所述类型,查询本体知识模型中类型与专有属性库的关联关系,确定出存储有描述所述目标对象的标准词语的专有属性库;和/或,根据所述类型,查询所述本体知识模型中类型与所述公共属性库的关联关系,确定出存储有所述目标对象的标识信息的编码类型信息的公共属性库。可选地,所述根据所述第一描述信息查询属性库,通过语义匹配将所述第一描述信息映射成使用所述属性库中提供的标准词语的第二描述信息,包括:从所述属性库中提取标准词语;将所述第一描述信息的词语与所述标准词语进行语义匹配;根据所述语义匹配的匹配度,选择标准词语替换所述第一描述信息中的词语,以形成所述第二描述信息。可选地,所述从所述属性库中提取标准词语,包括:从所述属性库中提取标准词语矩阵;所述标准词语矩阵的一个元素为一个所述标准词语;所述将所述第一描述信息的词语与所述标准词语进行语义匹配,包括:将所述第一描述信息使用的词语转换成待替换词语矩阵;将所述待替换词语矩阵的每一个行元素分别与所述标准词语矩阵中的各行元素进行语义匹配;根据所述语义匹配的结果,确定所述待替换词语矩阵中每一行元素在所述标准词语矩阵中的最优匹配行;利用所述最优匹配行中的标准词语替换所述待替换词语矩阵对应行的元素。可选地,所述根据所述语义匹配的结果,确定所述待替换词语矩阵中每一行元素在所述标准词语矩阵中的最优匹配行,包括以下至少之一:若所述待替换词语矩阵中第x行元素包括与所述标准词语矩阵中的第i行第j列的元素之间的语义匹配度大于第一阈值的元素,则在赋值矩阵中第i行第j列写入第一取值;x,i及j均为自然数;若所述待替换词语矩阵中第x行元素所有元素与所述标准词语矩阵中的第i行第j列元素之间的语义匹配度小于第二阈值,则在所述赋值矩阵中第i行第j列写入第二取值;当所述标准词语矩阵中的第i行第j列元素空缺时,则在所述赋值矩阵中第i行第j列写入第三取值;在完成待替换词语矩阵中的第x行元素与所述标准词语矩阵中每一行元素的匹配后,计算所述赋值矩阵中每一行的赋值之和;根据所述赋值之和选择出所述标准词语矩阵中与所述第x行元素匹配度最高的所述最优匹配行。可选地,所述方法还包括:接收携带有查询对象至少一个描述信息的查询语句;基于所述查询语句查询本体知识模型,获取查询信息。可选地,所述基于所述查询语句查询本体知识模型,获取查询信息,包括以下至少之一:查询所述查询对象所属类型的母类的类型信息;查询所述查询对象所述类型的子类的类型信息;查询所述查询对象的编码类型信息;查询所述查询对象的描述信息。第二方面,本发明实施例提供一种基于语义的对象描述装置,其特征在于,应用于第一体系中,包括:获取单元,用于获取目标对象的第一预定信息,其中,所述第一预定信息包括:所述目标对象的标识信息及描述所述目标对象的属性的第一描述信息;确定单元,用于根据所述标识信息查询属性库,确定所述目标对象的编码类型对应的编码类型信息,其中,不同编码类型对应不同的标识体系;匹配单元,用于根据所述第一描述信息查询所述属性库,通过语义匹配将所述第一描述信息映射成使用所述属性库中提供的标准词语的第二描述信息;其中,所述编码类型信息、所述标识信息及所述第二描述信息,共同形成所述目标对象的第二预定信息。第三方面,本发明实施例提供一种标识体系,包括:属性库,用于存储有不同标识体系的编码类型信息及标准词语,其中,所述标准词语用于生成描述目标对象的描述信息;本体知识模型,存储有描述对象与所述属性库中编码类型信息及标准词语的关联关系,用于基于所述关联关系查询目标对象的标识信息的编码类型信息及描述所述目标对象的标准词语,并形成预定信息,其中,所述预定信息包括:所述标识信息、编码类型信息及利用所述标准词语描述所述目标对象属性的描述信息。可选地,所述属性库包括:公共属性库,用于存储有不同标识体系的编码类型的编码类型信息;专有属性库,用于存储标准词语,其中,所述标准词语用于生成描述目标对象的描述信息。第四方面,本发明实施例提供一种电子设备,包括:存储器、处理器及存储在所述存储器上并由所述处理器执行的计算机程序;所述处理器,与所述存储器连接,用于通过执行所述计算机程序,实现前述一个或多个技术方案提供的基于语义的对象描述方法,或执行一个或多个技术方案提供的标识体系的构建方法。第五方面,本发明实施例提供一种计算机存储介质,所述计算机存储介质存储有计算机程序;所述计算机程序被执行后,能够实现前述一个或多个技术方案提供的基于语义的对象描述方法,或执行一个或多个技术方案提供的标识体系的构建方法。本发明实施例提供的基于语义的对象描述方法及装置、标识体系、电子设备和存储介质,在获得第一预定信息之后,一方面,会根据标识信息确定出分配该第一预定信息中标识信息的编码类型的编码类型信息,从而后续可以根据编码类型信息采用对应的标识体系的编码规则解析该标识信息,从而实现标识信息异构的处理,实现不同标识体系的标识信息的互通和兼容。另一方面,会将第一预定信息中的第一描述信息使用的词语与属性库中的标准词语进行语义匹配,基于语义匹配的结果进行第一描述信息中词语的替换,从而形成使用标准词语形成的第二描述信息,这样的话,实现了描述信息的异构的处理,实现了不同标识体系提供的描述信息的兼容和互通。附图说明图1为本发明实施例提供的第一种基于语义的对象描述方法的流程示意图;图2为本发明实施例提供的第一种第一描述信息和第二描述信息中词语的映射关系示意图;图3为本发明实施例提供的一种属性库的结构示意图;图4为本发明实施例提供的一种属性库与本体知识模型的关联关系示意图;图5为本发明实施例提供的一种语义匹配的示意图;图6为本发明实施例提供的一种基于语义的对象描述装置的结构示意图;图7为本发明实施例提供的一种标识体系的构建方法的流程示意图;图8为本发明实施例提供的一种本体知识模型的类型层级结构的示意图;图9为本发明实施例提供的一种标识体系的构建装置的结构示意图;图10为本发明实施例提供的一种标识体系的结构示意图;图11为本发明实施例提供的一种处理节点的结构示意图;图12为本发明实施例提供的一种标识异构解析系统的结构示意图;图13为本发明实施例提供的一种语义匹配的流程示意图。具体实施方式以下结合说明书附图及具体实施例对本发明的技术方案做进一步的详细阐述。如图1所示,本实施例提供一种基于语义的对象描述方法,应用于第一体系中,包括:步骤s110:获取目标对象的第一预定信息,其中,所述第一预定信息包括:所述目标对象的标识信息及描述所述目标对象的属性的第一描述信息;步骤s120:根据所述标识信息查询属性库,确定所述目标对象的编码类型对应的编码类型信息,其中,不同编码类型对应不同的标识体系;步骤s130:根据所述第一描述信息查询所述属性库,通过语义匹配将所述第一描述信息映射成使用所述属性库中提供的标准词语的第二描述信息;其中,所述编码类型信息、所述标识信息及所述第二描述信息,共同形成所述目标对象的第二预定信息。本实施例的基于语义的对象描述方法,可为应用于第一体系中的方法。所述第一体系可为定义了如何描述一个对象的描述规则的体系。在本实施例中所述目标对象可为各种需要进行信息描述对象,例如,可为物联网中物联网实体,例如,连接到物联网中的物联网设备的设备信息、使用物联网设备的商品信息等。在本实施例中,所述步骤s110可包括:从用户设备接收所述第一预定信息,这里的第一预定信息可为用户输入的信息,又可以称之为所述用户注册信息。例如,用户向系统内倒入一个新产品的信息时,可能会向自身习惯使用的标识体系申请一个标识,对应的标识体系就会给该商品分配一个标识号,该标识号可为该体系分配的编码序列等,是所述标识信息的一种。用户可能会按照自己的语言表达习惯来描述该新产品的属性,例如,该新产品的类型、该新产品的个数、该新产品的生产日期、生产厂商以及使用的原材料等属性。但是用户随手输入的信息,可能并非使用标词语描述的信息。显然不同的用户有不同的描述习惯,导致对同一个属性的描述使用不同的属性名或属性标识,从而导致的预定信息中描述信息的多种多样,即描述信息的异构,从而导致互通性差的问题。在本实施例中所述属性库中存储有标准词语,在一些实施例中还存储有标准描述方式,例如,该标准描述方式指示了描述一个目标对象使用的数据结构。所述第二描述信息可是按照该数据局结构且使用标准词语形成的信息。在还有些实施例中,所述步骤s110还包括:从第二体系接收所述第一预定信息,则此时第一预定信息中携带有第二体系分配该目标对象的标识信息和按照第二体系的描述规则形成的第一描述信息。若第二体系有多个时,则本实施例中第一体系则会接收到不同识别体系给出使用不同的描述词语和/或描述结构描述的第一描述信息,显然存在互通性差的问题。在本实施例中,首先会根据标识信息,确定出使用的编码类型标识,该编码类型标识可为不同体系的体系标识,也可以为本实施例中第一体系对其他体系的编码类型分配的编码类型信息。其次,会利用属性库中的标准词语,基于语义匹配,使用标准词语替换掉第一描述信息中的非标准词语,从而生成完全由第一体系下标准词语组成的第二描述信息。第二描述信息、标识信息及编码类型信息共同构成了第二预定信息。在本实施例中,所述标准词语可为描述目标对象的属性的属性名,该属性名对应的属性值是可以不用匹配的。通过属性名所使用词语的标准化,就实现了描述信息的标准化。由于第二预定信息中有编码类型信息,可以利用该编码类型信息查找到对应的标识体系进行该标识信息的解码,同时由于采用标准词语对该第一描述信息进行了映射,从而不存在由于描述信息异构导致的无法识别的问题。故本实施例提供的基于语义的对象描述方法,不仅可以兼容不同的标识体系的标识信息,同时还可以通过基于语义匹配的映射,实现预定信息异构的问题。在本实施例中所述语义匹配,基于不同词语表达的含义进行匹配。若两个词语匹配表明这两个词语表达的含义相同或者近似度高于预定值。如图2所示,最左边一列表示的为对a商品的第一描述信息,最右边一列为对b商品的第一描述信息;属性库中存储有标准词条。通过语义匹配,可以发现a商品的第一描述信息中的“商品名”与属性库中“商品名称”的语义相同,a商品的第一描述信息中的“公司地址”与属性库中“企业地址”的近似度大于预设近似度。在图2中利用箭头表示的第一描述信息中使用的词语与属性库中的标准词语之间的映射关系。在一些实施例中所述方法还包括:将所述第二预定信息存储到描述数据库中,如此,该第二预定信息是实现了不同标识体系的互通和描述信息的互通的,解决了标识异构及描述信息的异构的问题的。在一些实施例中,所述属性库可为一个综合数据库,同时存储有不同标识体系的编码类型标识,还存储标准词语。在另一些实施例中,在本实施例中为了方便标识信息和描述信息的分别处理。所述属性库包括:公共属性库及专有属性库;所述步骤s120可包括:根据所述标识信息查询所述公共属性库,确定所述目标对象的编码类型对应的编码类型信息,其中,不同编码类型对应不同的标识体系;所述步骤s130可包括:根据所述第一描述信息查询所述专有属性库,通过语义匹配将所述第一描述信息映射成使用所述专有属性库中提供的标准词语的第二描述信息。在本实施例中,所述专有属性库有多个,不同类型的描述对象具有不同的专有数据库。例如,描述对象为超市时,具有超市属性库;描述对象为零售商品时,具有零售商品属性库。专有属性库中至少存储有定义描述对象的描述信息的标准词语。在一些实施例中,所述专有属性库还存储有标准化描述的标准化描述方式。所述标识体系可包括oid、handle及ecode中的一个或多个。在一些实施力中,所述体系标识还可以是其他标识体系,不限于该oid、handle及ecode。图3为本发明实施例提供的一种属性库的结构示意图,该属性库包括公共属性库和专有属性,在图3中专有属性库包括:零售商品属性库和超市属性库。不同的专有属性库中存储有不同的用于形成所述第二描述信息的标准词语。例如,在图3中,超市属性库中描述信息将使用的标准词语“地理位置”、“营业时间”等,在零售商品属性库中就没有。在一些实施例中,所述方法还包括:根据所述第一预定信息,确定所述目标对象的类型;根据所述类型,查询本体知识模型中类型与专有属性库的关联关系,确定出存储有描述所述目标对象的标准词语的专有属性库;和/或,根据所述类型,查询所述本体知识模型中类型与所述公共属性库的关联关系,确定出存储有所述目标对象的标识信息的编码类型信息的公共属性库。在本实施例中所述第一体系包括本体知识模型,该本体知识模型存储有不同类型的目标对象的类型与专有数据库的关联关系,这样当收到一个目标对象的第一预定信息之后,可以根据第一预定信息中的标识信息和/或第一描述信息确定出该目标对象的类型,并基于关联关系查找到对应的专有属性库。在一些实施例中,不同类型的目标对象可能使用的标识体系也不同,则此时,不同类型的目标对象可能使用到的公共属性库也会不同,则此时所述本体知识模型还会建立有类型与公共属性库的关联关系。例如,当一个目标对象为物联网对象和普通移动网络的对象,使用的标识体系可能是不同,则此时本体知识模型会建立不同类型与公共属性库的关联关系。图4所示一种本体知识模型与属性库的关联关系。本体知识模型的类型“零售商品”与零售商品属性库建立有挂关联关系。整个本体知识模型与公共属性库均有关联关系。类型“超市”与超市属性库具有关联关系。可选地,如图5所示,所述步骤s130可包括:步骤s131:从属性库中提取标准词语;步骤s132:将所述第一描述信息的词语与所述标准词语进行语义匹配;步骤s133:根据所述语义匹配的匹配度,选择标准词语替换所述第一描述信息中的词语,以形成所述第二描述信息。将第一描述信息中使用的词语与标准词语进行语义匹配,从而查找到专有数据库中能够替换第一描述信息中对应词语的合适的标准词语,从而通过具有相同语义的词语的替换,生成使用标准词语组成的第二描述信息。在进行所述语义匹配时,可以通过逐个词语的匹配,选择出何时的标准词语进行第二属性的生成。在本实施例中为了简化语义匹配,采用词语矩阵方式进行词语的快速匹配和最优标准词语的快速确定。所述步骤s131包括:从所述属性库中提取标准词语矩阵;所述标准词语矩阵的一个元素为一个所述标准词语;所述步骤s132可包括:将所述第一描述信息使用的词语转换成待替换词语矩阵;将所述待替换词语矩阵的每一个行元素分别与所述标准词语矩阵中的各行元素进行语义匹配;根据所述语义匹配的结果,确定所述待替换词语矩阵中每一行元素在所述标准词语矩阵中的最优匹配行;利用所述最优匹配行中的标准词语替换所述待替换词语矩阵对应行的元素。在本实施例中进行逐行匹配,通过行匹配,确定出标准词语矩阵中与待替换词语矩阵中对应元素行匹配程度最高的最优匹配行。在进行各行元素匹配时,可以调整所述待替换词语矩阵中同一行元素中的列号。以下表1为一种标准词语矩阵的示例:商品名称商品规格生产日期商品零售价格企业地址表1从上述表1可知,一个标准词语矩阵中,并非每一个元素都存储有标准词语;同一个标准词语可能会出现在不同的元素中。以下表2为一个待替换词语矩阵的示例:产品名称规格产品生产日期价格表2在构建待替换词语矩阵时,通常根据对应的专有数据库提供的标准词语矩阵的行列数进行构建,例如,待替换词语矩阵的列数等于标准词语矩阵中的列数,以方便进行行匹配。在一些实施例中,构建待替换词语矩阵时,也不局限于根据标准词语矩阵的行列数进行构建,可以利用第一描述信息中使用的各个词之间的关联度,例如,出现的位置,确定是否建一条描述依据中的不同词语是否设置为待替换矩阵中的同一行的元素。可选地,所述根据所述语义匹配的结果,确定所述待替换词语矩阵中每一行元素在所述标准词语矩阵中的最优匹配行,包括:若所述待替换词语矩阵中第x行元素包括与所述标准词语矩阵中的第i行第j列的元素之间的语义匹配度大于第一阈值的元素,则在赋值矩阵中第i行第j列写入第一取值;若所述待替换词语矩阵中第x行元素所有元素与所述标准词语矩阵中的第i行第j列元素之间的语义匹配度小于第二阈值,则在所述赋值矩阵中第i行第j列写入第二取值;x,i及j均为自然数,对应的是对应矩阵的行号或列号。当所述标准词语矩阵中的第i行第j列元素空缺时,则在所述赋值矩阵中第i行第j列写入第三取值;在完成待替换词语矩阵中的第x行元素与所述标准词语矩阵中每一行元素的匹配后,计算所述赋值矩阵中每一行的赋值之和;根据所述赋值之和选择出所述标准词语矩阵中与所述第x行元素匹配度最高的所述最优匹配行。若所述第一取值大于第二取值,则所述第三取值小于所述第一取值并大于所述第二取值,则所述最优匹配行为赋值之和最大的行。若所述第一取值小于第二取值,则所述第三取值小于第二取值并大于所述第一取值,则所述最优匹配行为赋值之和最小的行。例如,所述x行等于1,则会将表2中所有的元素分别与表1中5行元素进行逐一匹配,若第一取值为1,第二取值为0,且第3取值为0,则表2中待替换矩阵中的第1行元素与表2中各行元素进行语义匹配之后,形成的赋值矩阵如下表3:110.5100.500.50.510000.50.5表3显然通过赋值之和计算,得到当前最优匹配行为表1中的第1行。在一些实施例中为了减少计算量,在计算所述赋值之和之前,会筛选出所述赋值矩阵中不包括所述第一取值的行,仅计算出包括所述第一取值的赋值矩阵中对应行的赋值之和。显然这样的话,可以减少赋值和的计算,及赋值矩阵中不同赋值之和的比较。可选地,所述方法还包括:接收携带有查询对象至少一个描述信息的查询语句;基于所述查询语句查询本体知识模型,获取查询信息。在本实施例中所述第一体系包括本体知识模型,该本体知识模型支持模糊查询语句。在本实施例中所述模糊查询语句为无需携带标识信息进行的单个查询对象的精准查询。该查询语句仅需携带一个或多个描述信息,所述本体知识模型就可以基于该描述信息查询出查询信息。例如,所述基于所述查询语句查询本体知识模型,获取查询信息,包括以下至少之一:查询所述查询对象所属类型的母类的类型信息;查询所述查询对象所述类型的子类的类型信息;查询所述查询对象的编码类型信息;查询所述查询对象的描述信息。在本实施例中所述本体知识模型可为类型层级结构的模型,构架某一个大类型性各个小类型之间的归属关系。例如,若类型a归属于类型b,则类型a为类型b的子类;所述类型b为类型a的母类。在本实施例中,可以查询某一个查询对象的所述类型的母类的类型信息及下属的子类的类型信息。查询该查询对象的编码类型信息。不同的描述对象可使用的标识体系可能有限,则此时可以根据该查询对象的属性确定出其类型,并确定出其可以使用的编码类型信息。在还有一些实施例中还可以查询该查询对喜的描述信息。所述描述信息可包括以下中的一个或多个:数量信息、生产日期、生产厂商、生成地址、价格及产品规格。例如,所述本体知识模型可以采用sparql进行上述查询。如图6所示,本实施例提供一种基于语义的对象描述装置,应用于第一体系中,包括:获取单元110,用于获取目标对象的第一预定信息,其中,所述第一预定信息包括:所述目标对象的标识信息及描述所述目标对象的属性的第一描述信息;确定单元120,用于根据所述标识信息查询属性库,确定所述目标对象的编码类型对应的编码类型信息,其中,不同编码类型对应不同的标识体系;匹配单元130,用于根据所述第一描述信息查询所述属性库,通过语义匹配将所述第一描述信息映射成使用所述属性库中提供的标准词语的第二描述信息;其中,所述编码类型信息、所述标识信息及所述第二描述信息,共同形成所述目标对象的第二预定信息。所述获取单元110可对应于通信接口,可以从其他设备接收所述第一预定信息。在一些实施例中还可对应于人机交互接口,可以从人机交互接口接收所述第一预定信息。所述确定单元120及所述匹配单元130,均可对应于一个或多个处理器,可以通过信息处理获取所述编码类型信息及所述第一描述信息到第二描述信息的映射。所述处理器可包括:中央处理器、微处理器、数字信号处理器、应用处理器、可编程阵列或专用集成电路等。在一些实施例中所述装置还可包括:存储单元。所述存储单元可对应于描述数据库,该描述数据库可用于存储所述第二预定信息。通过编码类型信息的引入,方便采对该第二预定信息中的表示信息使用对应标识体系的标识规则进行识别,通过第一描述信息到第二描述信息的映射,生成的是使用第一体系中标准词语表达的第二描述信息,故该信息在查询时是可被本体系识别的,从而通过描述信息的语义匹配和标准词语替换,实现了描述信息的异构转换。可选地,所述属性库包括:公共属性库及专有属性库;所述确定单元120,具体用于根据所述标识信息查询所述公共属性库,确定所述目标对象的编码类型对应的编码类型信息,其中,不同编码类型对应不同的标识体系;所述匹配单元130,可用于根据所述第一描述信息查询所述专有属性库,通过语义匹配将所述第一描述信息映射成使用所述专有属性库中提供的标准词语的第二描述信息。在一些实施例中,所述确定单元120,具体用于根据所述第一预定信息,确定所述目标对象的类型;所述装置还包括:第一查询单元,可对应于处理器,可用于根据所述类型,查询本体知识模型中类型与专有属性库的关联关系,确定出存储有描述所述目标对象的标准词语的专有属性库;和/或,根据所述类型,查询所述本体知识模型中类型与所述公共属性库的关联关系,确定出存储有所述目标对象的标识信息的编码类型信息的公共属性库。可选地,所述匹配单元130,具体用于从属性库中提取标准词语;将所述第一描述信息的词语与所述标准词语进行语义匹配;根据所述语义匹配的匹配度,选择标准词语替换所述第一描述信息中的词语,以形成所述第二描述信息。可选地,所述匹配单元130,具体用于从所述属性库中提取标准词语矩阵;所述标准词语矩阵的一个元素为一个所述标准词语;将所述第一描述信息使用的词语转换成待替换词语矩阵;将所述待替换词语矩阵的每一个行元素分别与所述标准词语矩阵中的各行元素进行语义匹配;根据所述语义匹配的结果,确定所述待替换词语矩阵中每一行元素在所述标准词语矩阵中的最优匹配行;利用所述最优匹配行中的标准词语替换所述待替换词语矩阵对应行的元素。进一步地,所述匹配单元130,具体用于若所述待替换词语矩阵中第x行元素包括与所述标准词语矩阵中的第i行第j列的元素之间的语义匹配度大于第一阈值的元素,则在赋值矩阵中第i行第j列写入第一取值;若所述待替换词语矩阵中第x行元素所有元素与所述标准词语矩阵中的第i行第j列元素之间的语义匹配度小于第二阈值,则在所述赋值矩阵中第i行第j列写入第二取值;当所述标准词语矩阵中的第i行第j列元素空缺时,则在所述赋值矩阵中第i行第j列写入第三取值;在完成待替换词语矩阵中的第x行元素与所述标准词语矩阵中每一行元素的匹配后,计算所述赋值矩阵中每一行的赋值之和;根据所述赋值之和选择出所述标准词语矩阵中与所述第x行元素匹配度最高的所述最优匹配行。进一步地,所述装置还包括:接收单元,可对应于通信接口或人机交互接口,可用于接收携带有查询对象至少一个描述信息的查询语句;第二查询单元,可对应于处理器,可用于基于所述查询语句查询本体知识模型,获取查询信息。可选地,所述第二查询单元,具体用于包括以下至少之一:查询所述查询对象所属类型的母类的类型信息;查询所述查询对象所述类型的子类的类型信息;查询所述查询对象的编码类型信息;查询所述查询对象的描述信息。如图7所示,本实施例提供一种标识体系的构建方法,包括:步骤s210:构建属性库,其中,所述属性库存储有不同标识体系的编码类型的编码类型信息及标准词语;所述标准词语用于生成描述目标对象的描述信息;步骤s220:构建本体知识模型,其中,所述本体知识模型存储有描述对象与所述属性库中编码类型信息及标准词语的关联关系。在本实施例中所述第一体系包括属性库和本体知识模型。所述属性库可为一种属性库,至少存储有不同标识体系的编码类型信息及标准词语。所述本体知识模型可为生成前述第二预定信息的信息处理模型。该本体知识模型至少存存储有描述对象与所述属性库中编码类型信息及标准词语的关联关系。可选地,所述步骤s210可包括:构建公共属性库,其中,所述公共属性库存储有不同标识体系的编码类型的编码类型信息;构建专有属性库,其中,所述专有属性库中存储标准词语,所述标准词语用于生成描述目标对象的描述信息。在本实施例中属性库分为公共属性库和专有属性库,公共属性库是被多种同类型的描述对象或目标对象所共享属性库,而专有属性库可能仅是被一种类型的描述对象或目标对象所使用的属性库。可选地,所述步骤s220可包括:确定所述描述对象的类型;确定所述类型与所述属性库的所述关联关系。所述构建本体知识模型,还包括:基于所确定类型的归属关系,构建类型层级结构;在所述类型层级结构包括:第i类的母类和/或第i类的子类;所述确定所述类型与所述属性库的所述关联关系,包括:构建第i类的最顶层母类与所述属性库的关联关系。若基于所述类型层级架构的母类和子类之间的对应关系,绘制层级树的话,则位于树的根节点的类型即为所述最顶层母类。图8所述为本体知识模型提供的一种类型层级结构,零售商品类型下,包括子类有:食品、日用品、水果、饮料;饮料包括的子类有:碳酸饮料、水、果汁、茶饮及奶饮品等。茶饮包括的子类有:冰红茶、绿茶及茉莉花茶等。类型超市和零售商品均为最顶层母类,所述本体知识模型,还存储有具有预定关系的最顶层母类之间的关联关系,方便后续进一步描述信息的延展。例如,利用描述信息中描述当前商品位于哪一个超市出售,则可能需要使用到超市属性模型的标准词语。如图9所示,本实施例提供一种标识体系的构建装置,包括:第一构建单元210,用于构建属性库,其中,所述属性库存储有不同标识体系的编码类型的编码类型信息及标准词语;所述标准词语用于生成描述目标对象的描述信息;第二构建单元220,用于构建本体知识模型,其中,所述本体知识模型存储有描述对象与所述属性库中编码类型信息及标准词语的关联关系。所述第一构建单元210和第二构建单元220,均可对应于处理器,可以通过信息处理实现属性库的建立及本体知识模型的建立。可选地,所述第一构建单元210,具体用于构建公共属性库,其中,所述公共属性库存储有不同标识体系的编码类型的编码类型信息;构建专有属性库,其中,所述专有属性库中存储标准词语,所述标准词语用于生成描述目标对象的描述信息。可选地,所述第二构建单元220,具体用于确定所述描述对象的类型;确定所述类型与所述属性库的所述关联关系。进一步地,所述第二构建单元220,具体用于基于所确定类型的归属关系,构建类型层级结构;在所述类型层级结构包括:第i类的母类和/或第i类的子类;并构建第i类的最顶层母类与所述属性库的关联关系。如图10所示,本实施例提供一种标识体系,包括:属性库310,用于存储有不同标识体系的编码类型信息及标准词语,其中,所述标准词语用于生成描述目标对象的描述信息;本体知识模型320,存储有描述对象与所述属性库310中编码类型信息及标准词语的关联关系,用于基于所述关联关系查询目标对象的标识信息的编码类型信息及描述所述目标对象的标准词语,并形成预定信息,其中,所述预定信息包括:所述标识信息、编码类型信息及利用所述标准词语描述所述目标对象属性的描述信息。在本实施例提供的标识体系中提供属性库310和本体识别模型,该属性库310存储有其他识别体系的编码类型信息,是可以兼容其他标识体系的标识信息的。同时属性存储有标准词语,可以通过标准词语的映射,可以将异构的描述信息转换成标准的描述信息,从而实现描述信息异构问题的处理。可选地,所述属性库310包括:公共属性库,用于存储有不同标识体系的编码类型的编码类型信息;专有属性库,用于存储标准词语,其中,所述标准词语用于生成描述目标对象的描述信息。如图11所示,本实施例提供一种电子设备,包括:存储器410、处理器420及存储在所述存储器410上并由所述处理器420执行的计算机程序;所述处理器420,与所述存储器410连接,用于通过执行所述计算机程序,实现前述任意一个技术方案提供的基于语义的对象描述方法或标识体系的构建方法。所述存储器410存储有各种存储介质,可以存储所述计算机程序;所述处理器420,可为各种类型的处理器420,可通过集成电路总线等与所述存储器410连接,可以用于实现前述的基于语义的对象描述方法中的一个或多个技术方案的实现,也可以用于实现前述的标识体系的构建方法中的一个或多个技术方案的描述。本实施例还提供一种计算机存储介质,所述计算机存储介质存储有计算机程序;所述计算机程序被执行后,能够可以用于实现前述的基于语义的对象描述方法中的一个或多个技术方案的实现,或可以用于实现前述的标识体系的构建方法中的一个或多个技术方案的描述。所述计算机存储介质可包括:移动存储设备、只读存储器(rom,read-onlymemory)、随机存取存储器(ram,randomaccessmemory)、磁碟或者光盘等各种可以存储程序代码的介质。可选地,所述计算机存储介质为非瞬间存储介质。以下结合上述任意实施例提供几个具体示例:示例1:本示例提出了一种基于语义技术的异构解析系统,该系统建立了本体知识模型和属性库,并建立了本体知识模型与属性库之间的关联,通过本体知识模型与公共属性库的关联,实现了对handle、ecode、oid等不同解析系统的异构解析,解决了标识异构的问题。通过构建属性库以及属性库与用户预定信息的最优模板匹配的方式,实现了属性库的标准化映射。通过属性库的标准化映射,解决了预定信息异构问题。通过语义技术还可以实现高级查询,解决handle、ecode、oid编码体系智能进行精确查询的缺陷,提高了查询功能。本示例通过以上技术解决了编码标识体系之间的标识结构异构、预定信息异构、以及高级查询问题。实现了物联网实体之间的互联互通以及数据互认。本示例提出了一种基于语义技术的标识异构解析系统,该系统对应于前述实施例中的第一体系或标识体系,通过本体知识模型的构建、实例映射以及语义查询等过程实现handle、ecode、oid不同标识体系之间的互联互通以及数据互认。基于语义技术的标识异构解析系统如图12所示。首先提供一种构建图12所示的标识异构解析系统的方法,包括:1.本体知识模型的构建本体知识模型的构建主要包括本体知识模型的构建以及属性库的构建两部分。下面以商品零售领域为例进行描述。(1)本体知识模型的构建首先对商品零售领域中涉及到的超市、零售商品以及他们之间的层次分类等进行概念层次的抽象,将其抽象为具体的概念,并建立这些概念之间的关系关联。如图8所示,将超市、零售商品、饮料等进行了概念抽象,抽象为了“超市”“零售商品”“饮料”等,并建立他们之间的关联关系,如“超市”利用语句“has”描述类型“超市”和“零售”商品之间的关联关系。图8零售商领域本体知识模型(部分)(2)属性库的建立该属性库包含公共属性库和专有属性库。公共属性库是对handle、ecode、oid等标识系统进行属性标识,所有物联网实体共用这些属性,用来标识物联网实体的编码标识类型。专有属性库是根据领域知识,由专家建立的,是某类物联网实体预定信息的标准库,用于对不同标识或不同用户对物体的预定信息进行标准化。如用“商品名称”对用户使用的“商品名”“产品名称”进行标准化。商品零售领域中的属性库如图3所示:图3零售商领域属性库举例。(3)将属性库与本体知识模型进行关联本体知识模型中的所有概念将共有公共属性库中的描述信息,因此本体知识模型中的所有概念将与公共属性库进行关联,关联关系是“has”,表示概念拥有该属性。通过本体知识模型与公共属性库的关联,实现了对handle、ecode、oid等不同解析系统的异构解析,解决了标识异构的问题。专有属性库将与专门拥有该类属性的概念进行关联,如超市属性库与“超市”概念使用“has”进行关联,因此,超市实体将会具有超市属性库中的描述信息。图4是零售商领域本体知识模型和属性库关联后的示意图图4零售商领域本体知识模型和属性库的关联示意图。2.实例映射(1)物联网实体实例化企业或用户生产了一个商品后,将会在handle、ecode、oid等标识平台进行编码注册以及预定信息填写,同时与本体知识模型进行关联。因此一个物联网实体的实例就产生了,如“统一绿茶”这一实例,注册时对其的预定信息如下表。统一绿茶实例预定信息表codingtype(编码类型)handlecode(标识信息)86.xxx.xx/xxx8商品名统一绿茶规格250ml企业名称统一企业(中国)有限公司…………属性库标准化映射由于不同企业或用户的认知或经验不同,他们在注册物联网实体时,会使用不同的预定信息来描述物联网实体,同时,不同标识体系之间,使用的物联网实体预定信息模板也可能不同,使得物联网实体之间对应的预定信息格式存在异构性。因此,需要使用标准的属性库来对这些预定信息进行标准化映射,实现不同标识体系之间以及不同企业之间的数据互认和互联互通。具体流程图13所示。s1:建立属性库词语矩阵和用户注册信息词语矩阵;这里的属性库词语矩阵对应于前述的标准词语矩阵;所述用户注册信息词语矩阵对应于前述待替换词语矩阵。分别对专有属性库以及用户注册的预定信息进行分词去停用词,形成属性库词语矩阵和用户注册信息词语矩阵。举例如下可参见前述表1和表2。s2:利用语义相似度算法计算词语的语义相似度,填充属性库矩阵。这里的属性库矩阵,赋值矩阵。利用语义相似度算法计算属性库词语矩阵与用户注册信息词语矩阵之间的语义相似度,此处的语义相似度算法可以任选。步骤如下:首先,将用户信息词语矩阵中的一行词分别与属性库词语矩阵中每一行中的词进行语义相似度计算,当对应的语义相似度大于一定阈值(我们设置的是0.8)时,人为这两个词语相似,将属性库此处的此词语位置设置1,低于阈值的位置设置为0,没有词语的位置设置为0.5。以此类推的将属性库词语矩阵填充完毕,如下四个表:用户注册信息词语矩阵中的第一行元素匹配后形成的属性词语矩阵如下表:110.5100.500.50.510000.50.5用户注册信息词语矩阵中的第二行元素匹配后形成的属性词语矩阵下表:000.5010.500.50.500000.50.5用户注册信息词语矩阵中的第三行元素匹配后形成的属性词语矩阵下表:100.5100.510.50.510000.50.5用户注册信息词语矩阵中的第四行元素匹配后形成的属性词语矩阵下表:s3:利用矩阵的形式实现模板最优匹配行;根据上述得到的属性库语义相似度值的矩阵,进行模板最优匹配。首先将矩阵中不包含1的行去掉,然后,对包含1的行进行求和,和最大的行即为最优匹配,即上述表格中标红的部分即为最优匹配。具体计算公式如下:且i行中的元素值至少一个为1。n为矩阵的行数,m为矩阵的列数,aij是矩阵中第i行第j列的元素值,该元素值可为匹配形成的第一取值、第二取值或第三取值。s4:根据专有属性库完成映射。根据s3,得到的模板最优匹配,映射到专有属性库,完成预定信息的标准化。映射结果举例如下:3.语义查询基于商品零售领域的语义知识模型,实现异构标识的统一解析和高级语义查询,进而完成更高层次的应用。通过sparql查询,可以查询到编码类型(codingtype),然后根据编码的codingtype分别去对应的解析系统去解析。还可以实现高级的查询,如可以查询到商品在哪些超市销售;不同品牌商品的销量;超市内各产品存量,同一种商品在不同地区的销售情况对比等等。语义查询可以智能的应用到购物机器人为顾客自动从货价提取商品,搬运机器人自动为断货商品进行补充等。查询举例如下:例1:查询所有“茶饮”的子类查询语言:prefixmarket:<http://www.semanticweb.org/cmcc/supermarket#>select?xwhere{?xrdfs:subclassofmarket:茶饮.}在该查询语句中用于查询的描述信息为“茶饮”。查询结果如下:“茶饮”的子类碳酸饮料水果汁茶饮奶制品……例2:查询所有“绿茶”的编码、商品名称以及数量查询语言:select?y?z?m?nwhere{?xrdf:typemarket:绿茶.?xmarket:code?y.?xmarket:codingtype?z.?xmarket:商品名称?m.?xmarket:数量?n.该查询语句中已知的属性为:“绿茶”。在本申请所提供的几个实施例中,应该理解到,所揭露的设备和方法,可以通过其它的方式实现。以上所描述的设备实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,如:多个单元或组件可以结合,或可以集成到另一个系统,或一些特征可以忽略,或不执行。另外,所显示或讨论的各组成部分相互之间的耦合、或直接耦合、或通信连接可以是通过一些接口,设备或单元的间接耦合或通信连接,可以是电性的、机械的或其它形式的。上述作为分离部件说明的单元可以是、或也可以不是物理上分开的,作为单元显示的部件可以是、或也可以不是物理单元,即可以位于一个地方,也可以分布到多个网络单元上;可以根据实际的需要选择其中的部分或全部单元来实现本实施例方案的目的。另外,在本发明各实施例中的各功能单元可以全部集成在一个处理模块中,也可以是各单元分别单独作为一个单元,也可以两个或两个以上单元集成在一个单元中;上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能单元的形式实现。本领域普通技术人员可以理解:实现上述方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成,前述的程序可以存储于一计算机可读取存储介质中,该程序在执行时,执行包括上述方法实施例的步骤。以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本
技术领域
的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以所述权利要求的保护范围为准。当前第1页12
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1