信息检测方法、装置、电子设备和计算机可读介质与流程

文档序号:21102160发布日期:2020-06-16 20:55阅读:153来源:国知局
信息检测方法、装置、电子设备和计算机可读介质与流程

本申请实施例涉及计算机技术领域,具体涉及信息检测方法、装置、电子设备和计算机可读介质。



背景技术:

随着计算机技术的发展,电子商务平台所提供的产品和服务越来越多。现有的电子商务平台通常可以支持酒店预订业务,可以为提供用户各类酒店中的房型信息,以供用户选择。随着信息量的增大,平台向消费者展示的信息中,通常存在一些错误信息或虚假信息。例如,某房型的文字介绍中指出床型为圆床,而图片中则为常规的方床。

现有的方式,通常是由用户、商家、业务经理等人员通过人工方式进行异常信息的查找和上报,在上报异常信息后,由运营人员人工核实并处理。这种异常信息的检测方式,通常会存在异常信息的遗漏,且检测效率较低。



技术实现要素:

本申请实施例提出了信息检测方法、装置、电子设备和计算机可读介质,以解决现有技术中由人工检测异常信息导致异常信息遗漏以及检测效率较低的技术问题。

第一方面,本申请实施例提供了一种信息检测方法,该方法包括:获取入驻目标平台的目标酒店中目标房型的第一房型信息和第二房型信息,其中,第一房型信息为目标酒店所维护的房型信息,第二房型信息为目标平台所维护的房型信息;分别从第一房型信息和第二房型信息中提取关键信息;对所提取的关键信息进行匹配;基于匹配结果,确定第一房型信息和/或第二房型信息中的异常信息

第二方面,本申请实施例提供了一种信息检测装置,该装置包括:获取单元,被配置成获取入驻目标平台的目标酒店中目标房型的第一房型信息和第二房型信息,其中,第一房型信息为目标酒店所维护的房型信息,第二房型信息为目标平台所维护的房型信息;提取单元,被配置成分别从第一房型信息和第二房型信息中提取关键信息;匹配单元,被配置成对所提取的关键信息进行匹配;确定单元,被配置成基于匹配结果,确定第一房型信息和/或第二房型信息中的异常信息。

第三方面,本申请实施例提供了一种电子设备,包括:一个或多个处理器;存储装置,其上存储有一个或多个程序,当一个或多个程序被一个或多个处理器执行,使得一个或多个处理器实现如上述第一方面中所描述的方法。

第四方面,本申请实施例提供了一种计算机可读介质,其上存储有计算机程序,该程序被处理器执行时实现如上述第一方面中所描述的方法。

本申请实施例提供的信息检测方法、装置、电子设备和计算机可读介质,通过获取入驻目标平台的目标酒店中目标房型的第一房型信息和第二房型信息,而后从第一房型信息和第二房型信息中分别提取关键信息,最后对所提取的关键信息进行匹配,从而可以基于匹配结果,确定第一房型信息和/或第二房型信息中的异常信息。由于第一房型信息、第二房型信息分别为目标酒店和目标平台所维护的房型信息,由此,本申请实施例可以通过关键信息匹配的方式,自动检测目标酒店和目标平台所维护的房型信息中的异常信息,不需要依赖用户、商家、业务经理等人员进行人工查找、上报和核实,减少了异常信息的漏检情况,提高了对异常信息的检测的效率。

附图说明

通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本申请的其它特征、目的和优点将会变得更明显:

图1是根据本申请的信息检测方法的一个实施例的流程图;

图2是根据本申请的信息检测方法的又一个实施例的流程图;

图3是根据本申请的信息检测装置的一个实施例的结构示意图;

图4是适于用来实现本申请实施例的电子设备的计算机系统的结构示意图。

具体实施方式

下面结合附图和实施例对本申请作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释相关发明,而非对该发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与有关发明相关的部分。

需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。

请参考图1,其示出了根据本申请的信息检测方法的一个实施例的流程100。该信息检测方法,包括以下步骤:

步骤101,获取入驻目标平台的目标酒店中目标房型的第一房型信息和第二房型信息。

在本实施例中,信息检测方法的执行主体(如服务器等电子设备)可以获取入驻目标平台的目标酒店中目标房型的第一房型信息和第二房型信息。

其中,上述目标平台可以是上述执行主体提供支持的电子商务平台。该电子商务平台可以提供多种产品和服务。其所提供的产品可以包括实体产品,如餐饮食品等。同时,也可以包括服务类产品,如提供酒店房间预订等服务。本申请实施例对上述目标平台所提供的产品和服务的种类不作限定。

上述目标酒店可以是入驻上述目标平台的任一酒店。上述目标酒店可以提供一种或多种房型,如大床房、标间、单间等等。上述目标房型可以是目标酒店所提供的任一待检测的房型。实践中,可以逐一将入驻目标平台的酒店作为目标酒店,并逐一将目标酒店中所提供的房型作为目标房型,从而逐一对各目标酒店的各目标房型进行检测,以实现全量信息的检测。

在本实施例中,第一房型信息可以为目标酒店所维护的房型信息。第二房型信息为目标平台所维护的房型信息。其中,各房型信息可以包括但不限于以下至少一项:房型名称、房型图片、房型介绍信息等。其中,上述房型介绍信息可以包括但不限于:可住人数、床型信息、是否有窗、是否具有独立卫浴、房间可用面积等。

需要说明的是,第一房型信息可以由商家或酒店代理商进行创建和修改。例如,商家可以设置第一房型信息中的房型名称、房型图片、房型介绍信息等。第二房型信息可以由目标平台中的相关工作人员(如负责对第二房型信息进行维护的运营人员)进行创建和修改,商家无法对其进行创建或修改。

实践中,第一房型信息和第二房型信息均可以存储在为目标平台提供数据支持的数据库中。在一种场景中,第一房型信息和第二房型信息可以以两个数据表的形式进行存储。

可以理解的是,对于入驻目标平台中的某一个酒店而言,该酒店通常存在多个房型(此处可称为酒店房型)。例如,可包含标准大床房(含早)、标准大床房(不含早)、标准特价大床房、豪华大床房(含早)、豪华大床房(不含早)、豪华特价大床房等。每一种房型,对应有一个第一房型信息,各房型对应的第一房型信息通常不同。而由目标平台所维护的第二房型信息,通常按照酒店中的各房型所属类别进行划分。例如,可划分为标准大床房、豪华大床房、标间、单间等。每一类房型对应一个第二房型信息。此处,可将按照类别划分的房型称为平台房型。由此,对于某一个酒店而言,该酒店可能涉及多个平台房型,如标准大床房、豪华大床房。该酒店所涉及的每一个平台房型,会关联多个酒店房型,如标准大床房关联的酒店房型包括标准大床房(含早)、标准大床房(不含早)、标准特价大床房等。

对于目标酒店中的目标房型(即酒店房型),该目标房型的第二房型信息,即为该目标房型所属平台房型的房型信息。作为一个示例,目标房型为标准大床房(含早),则目标房型的第二房型信息应为目标平台所维护的标准大床房的房型信息。作为又一示例,目标房型为豪华特价大床房,则目标房型的第二房型信息应为目标平台所维护的豪华大床房的房型信息。

需要说明的是,目标房型第一房型信息应与第二房型信息一致。例如,目标房型为标准大床房(含早),则该房型的第一房型信息中所包含的可住人数、床型信息等,应与第二房型信息中所包含的可住人数、床型信息等一致。若存在不一致的情况,则可以认为第一房型信息或者第二房型信息中存在异常信息。

需要指出的是,第一房型信息中各项信息自身应不存在矛盾。例如第一房型信息中,文字介绍中指出床型为双人床,而第一房型信息中的房型图片中显示有两张单人床,则可认为第一房型信息中存在异常信息。第二房型信息同理,此处不再赘述。

步骤102,从第一房型信息和第二房型信息中分别提取关键信息。

在本实施例中,上述执行主体可以分别从第一房型信息和第二房型信息中提取关键信息。其中,上述关键信息可以是与目标房型以及房间中的设施相关的信息。例如,可以包括但不限于可住人数、床型信息、用于表征房间是否含窗的窗户信息、用于表征房间是否带有独立卫浴的独立卫浴信息、房间可用面积等。

实践中,关键信息可以采用词语、字段、键值对等各种形式来表示,此处不作限定。

在本实施例的一些可选的实现方式中,对于上述第一房型信息、上述第二房型信息中的每一个房型信息,上述执行主体可以从该房型信息中,提取标准字段,并分别将各标准字段作为从该房型信息中提取的关键信息。

此处,标准字段可以是满足预设格式的字段。每一个标准字段中可以包括一个预设的关键项和该关键项对应的值。预设的关键项可以是预设的词语,例如,可以包括但不限于“可住人数”、“床型信息”、“是否有窗”、“独立卫浴”、“房间面积”等。实践中,可以根据房型信息的类型,选择从房型信息中提取标准字段的方式。例如,若房型信息为文本,则可以基于字符串匹配、正则表达式等方式,提取标准字段;若房型信息为图像,则可以通过对图像进行语义分析,提取标准字段。

在本实施例的一些可选的实现方式中,上述第一房型信息中可以包括第一描述信息。上述第二房型信息中包括第二描述信息。其中,上述第一描述信息、上述第二描述信息可以是用于描述目标房型的文字形式的信息。例如,可以包括但不限于目标房型的房型名称、介绍等信息。此时,上述执行主体可以分别从上述第一描述信息和上述第二描述信息中提取标准字段,进而将标准字段作为关键信息。

实践中,上述第一描述信息和第二描述信息可以分别包括用于描述上述目标房型的多个字段。此时,对于第一描述信息和第二描述信息中的每一描述信息,可以通过如下子步骤从该描述信息中提取标准字段:

子步骤s11,基于标准字段的格式,查找该描述信息中的标准字段。

标准字段可以具有统一格式。例如,可以是“a:b”的格式。其中,a为关键项,b为关键项的值。

作为示例,标准字段可以是“可住人数:2人”、“床型信息:圆床”、“是否有窗:是”、“独立卫浴:有”、“房间面积:20平米”等。

子步骤s12,将该描述信息中的其余各字段分别作为非标准字段,从各非标准字段中提取关键词。

此处,描述信息中除包含标准字段外,还可以包含未按照预设格式而自由编辑的字段,如房型名称、酒店简介等。上述执行主体可以将这些字段作为非标准字段,利用各种关键词提取方式,从该非标准字段中提取关键词。

作为示例,非标准字段为“豪华双人浪漫圆床房(落地窗有独卫)”。则所提取的关键词可以包括“圆床”、“落地窗”、“有独卫”。

子步骤s13,对各关键词进行解析,确定各关键词对应的关键项和关键项的值。

此处,上述执行主体可以采用自然语言处理技术,确定所提取的各关键词对应的关键项和关键项的值。例如,关键词“圆床”对应的关键项为“床型信息”,值为“圆床”;关键词“落地窗”对应的关键项为“是否有窗”,值为“是”;关键词“有独卫”对应的关键项为“独立卫浴”,值为“有”。

子步骤s14,分别将各关键词对应的关键项和关键项的值转换为标准字段。

通过从描述信息中查找和生成标准字段,并将描述信息中包含的标准字段以及所生成的标准字段,作为该描述信息中的关键信息。由此,该描述信息中可以包含多项关键信息。

需要说明的是,对于第一描述信息和第二描述信息,均可以通过上述步骤执行。由此,可以分别提取出第一描述信息中的多项关键信息和第二描述信息中的多项关键信息。

在本实施例的一些可选的实现方式中,上述第一房型信息中可以包括第一房型图片。上述第二房型信息中包括第二房型图片。此时,上述执行主体还可以从第一房型信息和第二房型信息中分别提取标准字段,进而将所提取的标准字段也作为关键信息。具体地,对于上述第一房型图片、上述第二房型图片中的每一个房型图片,上述执行主体可以通过如下子步骤提取该房型图片中的关键信息:

子步骤s21,将该房型图片输入至预先训练的一个或多个图像识别模型,得到各图像识别模型输出的识别结果。

此处,每一个图像识别模型可以用于识别一个预设的关键项的值。例如,上述执行主体中可以存储有预先训练的床型识别模型、窗户识别模型等。床型识别模型可以用于识别图像中的床以及该床的床型类别。窗户识别模型可以用于识别图像中的窗户。在将某一房型图像分别输入至床型识别模型和窗户识别模型后,即可得到该房型图像对应的床型识别结果和窗户识别结果。

子步骤s22,基于各图像识别模型输出的识别结果,生成各关键项对应的标准字段。

作为示例,与关键项“床型信息”对应的床型识别模型输出的床型识别结果为“圆床”,则可以生成标准字段“床型信息:圆床”。

需要说明的是,对于第一房型图片和第二房型图片,均可以通过上述步骤执行。由此,可以分别提取出第一房型图片中的多项关键信息和第二房型图片中的多项关键信息。

步骤103,对所提取的关键信息进行匹配。

在本实施例中,上述执行主体可以对所提取的关键信息进行匹配。

可以理解的是,第一房型信息应与第二房型信息一致,由此从第一房型信息中提取的关键信息(此处可称为第一关键信息)应与从第二房型信息中提取的关键信息(此处可称为第二关键信息)相匹配。因而,上述执行主体可以通过将第一关键信息中的各项信息与第二关键信息中相应的信息的匹配结果,确定出第一房型信息和第二房型信息中是否存在异常信息。

作为示例,关键信息可以包括可住人数、床型信息、是否有窗、是否有独立卫浴等。若第一关键信息中可住人数为“2人”,而第二关键信息中可住人数为“3人”,则可认为第一房型信息和第二房型信息中的可住人数信息不匹配。

作为又一示例,第一房型信息中的房型名称为“标准大床房(无窗)”,因而从第一房型信息中提取的关键信息可以包含“无窗”。从第二房型信息中提取的关键信息若包含“有窗”,则可以认为第一房型信息和第二房型信息中的与是否有窗相关的关键信息不匹配。

此外,由于第一房型信息中各项信息自身应不存在矛盾,以及,第二房型信息中的各项信息自身应不存在矛盾。因而,从第一房型信息中提取的第一关键信息应相互匹配,以及,从第二房型信息中提取的第二关键信息也应相互匹配。由此,上述执行主体可以将从同一房型信息中提取的关键信息进行相互匹配,从而基于匹配结果,确定该房型信息中是否存在异常信息。

作为示例,第一房型信息中的关键信息包括可住人数2人、一张单人床。由于一张单人床仅可提供一人空间,因而关键信息中存在矛盾。此时,可认为第一房型信息中的关键信息之间不匹配。

作为又一示例,第二房型信息中的关键信息包括房间面积5平米、两张1.5米×2米双人床。由于两张1.5米×2米的双人床的面积之和为6平米,房间面积。因而关键信息中存在矛盾。此时,可认为从第二房型信息中的关键信息之间不匹配。

在本实施例的一些可选的实现方式中,关键信息可以标准字段。标准字段中可以包括关键项和关键项的值。此时,上述执行主体可以分别将上述第一房型信息和上述第二房型信息作为提取来源,将从各提取来源提取的包含相同关键项的标准字段进行匹配。具体地,可以检测包含相同关键项的标准字段中的关键项的值是否相同。若相同,则可认为相匹配;若不相同,则可认为不匹配。作为示例,从第一房型信息中提取的一项标准字段为“是否有窗:无”,从第二房型信息中提取的一项标准字段为“是否有窗:无”,则第一房型信息中的此项标准字段与第二房型信息中的此项标准字段不匹配。

此外,上述执行主体可以将从同一个提取来源中提取的标准字段中的至少两项进行匹配。此处对于同一提取来源中的标准字段的匹配,可以是检测同一提取来源中的标准字段是否存在矛盾。若存在矛盾,则认为不匹配;若不存在矛盾,则可认为相匹配。作为示例,第一房型信息中的标准字段指示可住人数2人、一张单人床。由于一张单人床仅可提供一人空间,因而标准字段中存在矛盾。此时,可认为第一房型信息中的标准字段之间不匹配。

步骤104,基于匹配结果,确定第一房型信息和/或第二房型信息中的异常信息。

在本实施例中,上述执行主体可以通过将第一关键信息中的各项信息与第二关键信息中相应的信息的匹配结果,确定出第一房型信息和/或第二房型信息中是否存在异常信息。

作为示例,关键信息可以包括可住人数、床型信息、是否有窗、是否有独立卫浴等。若第一关键信息中可住人数为“2人”,而第二关键信息中可住人数为“3人”,则可认为第一房型信息和/或第二房型信息中,存在异常信息,且该异常信息为与可住人数相关的信息。

作为又一示例,第一房型信息中的房型名称为“标准大床房(无窗)”,因而从第一房型信息中提取的关键信息可以包含“无窗”。从第二房型信息中提取的关键信息若包含“有窗”,则可以认为第一房型信息和/或第二房型信息中,存在异常信息,且该异常信息为与是否有窗相关的信息。

此外,在本实施例中,上述执行主体还可以将从同一房型信息中提取的关键信息的匹配结果,确定该房型信息中是否存在异常信息。

作为示例,第一房型信息中的关键信息包括可住人数2人、一张单人床。由于一张单人床仅可提供一人空间,因而关键信息中存在矛盾。此时,可认为第一房型信息存在异常信息,该异常信息即为可住人数信息和/或床型信息。

作为又一示例,第二房型信息中的关键信息包括房间面积5平米、两张1.5米×2米双人床。由于两张1.5米×2米的双人床的面积之和为6平米,房间面积。因而关键信息中存在矛盾。此时,可认为第二房型信息存在异常信息,该异常信息即为可住房间面积和/或床型信息。

本申请的上述实施例提供的方法,通过获取入驻目标平台的目标酒店中目标房型的第一房型信息和第二房型信息,而后从第一房型信息和第二房型信息中分别提取关键信息,最后对所提取的关键信息进行匹配,从而可以基于匹配结果,确定第一房型信息和/或第二房型信息中的异常信息。由于第一房型信息、第二房型信息分别为目标酒店和目标平台所维护的房型信息,由此,本申请实施例可以通过关键信息匹配的方式,自动检测目标酒店和目标平台所维护的房型信息中的异常信息,不需要依赖用户、商家、业务经理等人员进行人工查找、上报和核实,减少了异常信息的漏检情况,提高了对异常信息的检测的效率。

进一步参考图2,其示出了信息检测方法的又一个实施例的流程200。该信息检测方法的流程200,包括以下步骤:

步骤201,获取入驻目标平台的目标酒店中目标房型的第一房型信息和第二房型信息。

在本实施例中,信息检测方法的执行主体(如服务器等电子设备)可以获取入驻目标平台的目标酒店中目标房型的第一房型信息和第二房型信息。其中,上述第一房型信息为上述目标酒店所维护的房型信息,上述第二房型信息为上述目标平台所维护的房型信息。

本实施例中的步骤201可参见图1对应实施例的步骤101,此处不再赘述。

步骤202,对于第一房型信息、第二房型信息中的每一个房型信息,从该房型信息中,提取标准字段,并分别将各标准字段作为关键信息。

在本实施例中,对于上述第一房型信息、上述第二房型信息中的每一个房型信息,上述执行主体可以从该房型信息中,提取标准字段,并分别将各标准字段作为从该房型信息中提取的关键信息。

此处,标准字段可以是满足预设格式的字段。每一个标准字段中可以包括一个预设的关键项和该关键项对应的值。预设的关键项可以是预设的词语,例如,可以包括但不限于“可住人数”、“床型信息”、“是否有窗”、“独立卫浴”、“房间面积”等。

实践中,可以根据房型信息的类型,选择从房型信息中提取标准字段的方式。例如,若房型信息为文本,则可以基于字符串匹配、正则表达式等方式,提取标准字段;若房型信息为图像,则可以通过对图像进行语义分析,提取标准字段。

在本实施例中,述第一房型信息中可以包括第一描述信息。上述第二房型信息中包括第二描述信息。上述第一描述信息和第二描述信息可以分别包括用于描述上述目标房型的多个字段。此时,对于第一描述信息和第二描述信息中的每一描述信息,可以通过如下步骤从该描述信息中提取标准字段:首先,基于标准字段的格式,查找该描述信息中的标准字段。而后,将该描述信息中的其余各字段分别作为非标准字段,从各非标准字段中提取关键词。之后,对各关键词进行解析,确定各关键词对应的关键项和关键项的值。最后,分别将各关键词对应的关键项和关键项的值转换为标准字段。

在本实施例中,上述第一房型信息中还可以包括第一房型图片。上述第二房型信息中还可以包括第二房型图片。此时,从第一房型信息和第二房型信息中分别提取标准字段,还可以包括从第一房型图片和上述第二房型图片中分别提取标准字段。具体地,对于上述第一房型图片、上述第二房型图片中的每一个房型图片,上述执行主体可以通过如下步骤提取该房型图片中的关键信息:首先,将该房型图片输入至预先训练的一个或多个图像识别模型,得到各图像识别模型输出的识别结果。而后,基于各图像识别模型输出的识别结果,生成各关键项对应的标准字段。

需要说明的是,从第一描述信息、第二描述信息、第一房型图片和上述第二房型图片中提取标准字段的方式可参见步骤102中的可选实现方式,此处不再赘述。

步骤203,分别将第一描述信息、第一房型图片、第二描述信息和第二房型图片作为提取来源,将从每两个提取来源提取的包含相同关键项的标准字段进行匹配。

在本实施例中,由于第一房型信息中包括第一描述信息和第一房型图片,第二房型信息中包括第二描述信息和第二房型图片,因而,从第一描述信息和第二描述信息中所提取的包含相同关键项的标准字段应相互匹配,从第一房型图片和第二房型图片中所提取的包含相同关键项的标准字段应相互匹配,从第一描述信息和第二房型图片中所提取的包含相同关键项的标准字段应相互匹配,从第一房型图片和第二描述信息中所提取的包含相同关键项的标准字段也应相互匹配。

此外,同一房型信息中的描述信息和房型图片中所提取的包含相同关键项的标准字段也应一致,由此,从第一描述信息和第一房型图片中所提取的包含相同关键项的标准字段应相互匹配,从第二描述信息和第二房型图片中所提取的包含相同关键项的标准字段也应相互匹配。

鉴于此,上述执行主体可以将第一描述信息、第一房型图片、第二描述信息和第二房型图片分别作为提取来源,将从每两个提取来源中提取的包含相同关键项的标准字段进行匹配。若上述所列举的某两项标准字段不匹配,则可以认为此两项标准字段的提取来源为异常信息。由此,上述执行主体可以基于上述所列举的匹配情况,确定出第一房型信息和上述第二房型信息中的异常信息。

在本实施例中,由于每一个标准字段中可以包括一个预设的关键项和该关键项对应的值。因而,上述执行主体可以首先将从每两个提取来源提取的包含相同关键项的标准字段作为一组目标标准字段。而后,分别确定每组目标标准字段中的关键项的值是否相同。若相同,则认为该组目标标准字段相匹配。反之,则可认为不匹配。

作为示例,从第一描述信息中提取的一项标准字段为“是否有窗:无”,从第二描述信息中提取的一项标准字段为“是否有窗:无”,则第一描述信息中的此项标准字段与第二描述信息中的此项标准字段不匹配。

作为又一示例,从第一描述信息中提取的一项标准字段为“床型信息:圆床”,从第一房型图片中提取的一项标准字段为“床型信息:方床”,则第一描述信息中的此项标准字段与第一房型图片中的此项标准字段不匹配。

步骤204,将从每一个提取来源中提取的标准字段中的至少两项进行匹配。

由于同一个提取来源中各项信息自身应不存在矛盾,因而,从同一提取来源所提取的标准字段应相互匹配,不存在矛盾。鉴于此,上述执行主体可以将从每一个提取来源中提取的标准字段中的至少两项进行匹配。

作为示例,第一房型信息中的标准字段指示可住人数2人、共有一张单人床。由于一张单人床仅可提供一人空间,因而标准字段中存在矛盾。此时,可认为第一房型信息中的标准字段之间不匹配。

作为又一示例,第二房型信息中的标准字段包括房间面积5平米、两张1.5米×2米双人床。由于两张1.5米×2米的双人床的面积之和为6平米,房间面积。因而标准字段中存在矛盾。此时,可认为从第二房型信息中的标准字段之间不匹配。

在本实施例中,对于每一个提取来源,上述执行主体可以检测从该提取来源提取的标准字段中的各关键项的值是否满足预设条件。

可选的,从每一个提取来源所提取的标准字段中的关键项可以包括床型信息、房型最大容纳人数和房间面积。此时,对于每一个提取来源,可以执行如下子步骤:

子步骤s31,基于上述床型信息,确定床型种类、每种床型的数量和每种床型的尺寸。

作为示例,若床型信息为“2张大床或1张单人床”,则可以确定出床型种类分别为“大床”和“单人床”。“大床”的数量为2,“单人床”的数量为1。若床型信息中包含每种床型的尺寸,则可以直接从床型信息中获取。若床型信息中不包含每种床型的尺寸,可以获取每种床型的默认尺寸。各种床型的默认尺寸可以预先设定并存储。

子步骤s32,基于上述床型种类、每种床型的数量和每种床型的尺寸,确定各种床型的最大可住人数和每种床型对应的床型面积。

继续上述示例,可以首先获取各种床型的单张默认可住人数和尺寸。例如,单张大床的默认可住人数为2人,尺寸为1.5米×2米;单张单人床的默认可住人数为1人,尺寸为1.2米×2米。而后,可以基于结合各种床型的数量和尺寸,计算出各种床型的最大可住人数和每种床型对应的床型面积。此处,2张大床的最大可住人数为4人,床型面积为6平米;1张单人床的最大可住人数为1人,床型面积为2.4平米。

子步骤s33,检测各种床型的最大可住人数是否相同。

由于同一房型中,若床型信息指示有至少两种床型供选择,则各床型的最大可住人数应相同。若不同,则可认为床型信息有误。

继续上述示例,床型信息为“2张大床或1张单人床”,2张大床的最大可住人数为4人,而1张单人床的最大可住人数为1人,由此,可认为床型信息有误。

子步骤s34,检测各种床型的最大可住人数是否大于或等于上述房型最大容纳人数。

由于同一房型中,若床型信息指示有至少两种床型供选择,每种床型的最大可住人数应大于或等于房型最大容纳人数。若最大可住人数小于房型最大容纳人数,则可认为床型信息或者房型最大容纳人数有误。

作为示例,若床型信息为“1张大床或2张单人床”,1张大床的最大可住人数为2人,2张单人床的最大可住人数为2人。此时,每种床型的最大可住人数均为两人。若标准字段指示房型最大容纳人数3人,则表示床型信息或者房型最大容纳人数有误。

需要说明的是,若房型中只有一种床型,则该床型的最大可住人数也应大于或等于上述房型最大容纳人数。例如,若床型信息为“1张大床”,1张大床的最大可住人数为2人。此时,若标准字段指示房型最大容纳人数3人,则表示床型信息或者房型最大容纳人数有误。

子步骤s35,检测各种床型的床型面积是否小于上述房间面积。

由于同一房型中,若床型信息指示有至少两种床型供选择,每种床型的床型面积应小于房间面积。否则,则可认为床型信息或者房型尺寸有误。

作为示例,若床型信息为“2张大床或3张单人床”,大床的尺寸为1.5米×2米,单人床的尺寸为1.2米×2米。此时,2张大床的床型面积为6平米,单张大床的床型面积为7.2平米。若此时房间面积为5平米,则表示床型信息或者上述房间面积有误。

步骤205,基于匹配结果,确定第一房型信息和/或第二房型信息中的异常信息。

在本实施例中,上述执行主体可以首先基于从每两个提取来源中提取的关键信息的匹配结果,确定第一房型信息和/或第二房型信息中的异常信息。实践中,对于步骤203中的每一组目标标准字段,若该组目标标准字段中的关键项的值不同,则可以确定该组目标标准字段中的至少一个目标标准字段的提取来源中,与该关键项相关的信息为异常信息。

作为示例,从第一描述信息中提取的一项关键信息为“是否有窗:无”,从第二描述信息中提取的一项关键信息为“是否有窗:无”,则第一描述信息中的此项关键信息与第二描述信息中的此项关键信息不匹配。此时,即可认为第一描述信息和/或第二描述信息为异常信息。进一步地,可以认为第一描述信息中与该关键项“是否有窗”相关的信息和/或第二描述信息中与该关键项“是否有窗”相关的信息为异常信息。

作为又一示例,从第一描述信息中提取的一项关键信息为“床型信息:圆床”,从第一房型图片中提取的一项关键信息为“床型信息:方床”,则第一描述信息中的此项关键信息与第一房型图片中的此项关键信息不匹配。此时,即可认为第一描述信息/或第一房型图片为异常信息。进一步地,可以认为第一描述信息中与该关键项“床型信息”相关的信息和/或第二房型图片为异常信息。

在本实施例中,上述执行主体还可以基于从每一个提取来源中提取的标准字段中的至少两项的匹配结果,确定第一房型信息和第二房型信息中的异常信息。

作为示例,第一房型信息中的关键信息包括可住人数2人、一张单人床。由于一张单人床仅可提供一人空间,因而关键信息中存在矛盾。此时,可认为第一房型信息存在异常信息,该异常信息即为可住人数信息和/或床型信息。

作为又一示例,第二房型信息中的关键信息包括房间面积5平米、两张1.5米×2米双人床。由于两张1.5米×2米的双人床的面积之和为6平米,房间面积。因而关键信息中存在矛盾。此时,可认为第二房型信息存在异常信息,该异常信息即为可住房间面积和/或床型信息。

从图2中可以看出,与图1对应的实施例相比,本实施例中的信息检测方法的流程200涉及了对分别从描述信息和房型图像中提取关键信息的步骤。由此,本实施例描述的方案可以从更多的提取来源处提取关键信息,提高了关键信息提取来源的丰富程度,由此进行关键信息的匹配,可提高异常信息的检测的准确性,并进一步减少了异常信息的漏检情况。

进一步参考图3,作为对上述各图所示方法的实现,本申请提供了一种信息检测装置的一个实施例,该装置实施例与图1所示的方法实施例相对应,该装置具体可以应用于各种电子设备中。

如图3所示,本实施例所述的信息检测装置300包括:获取单元301,被配置成获取入驻目标平台的目标酒店中目标房型的第一房型信息和第二房型信息,其中,上述第一房型信息为上述目标酒店所维护的房型信息,上述第二房型信息为上述目标平台所维护的房型信息;提取单元302,被配置成分别从上述第一房型信息和上述第二房型信息中提取关键信息;匹配单元303,被配置成对所提取的关键信息进行匹配;确定单元304,被配置成基于匹配结果,确定上述第一房型信息和/或上述第二房型信息中的异常信息。

在本实施例的一些可选的实现方式中,上述提取单元302,进一步被配置成:对于上述第一房型信息、上述第二房型信息中的每一个房型信息,从该房型信息中,提取标准字段,并分别将各标准字段作为从该房型信息中提取的关键信息,其中,每一个标准字段中包括一个预设的关键项和该关键项对应的值。

在本实施例的一些可选的实现方式中,上述匹配单元303,进一步被配置成:对于上述第一房型信息、上述第二房型信息中的每一个房型信息,从该房型信息中,提取标准字段,并分别将各标准字段作为关键信息,其中,每一个标准字段中包括一个预设的关键项和该关键项对应的值。

在本实施例的一些可选的实现方式中,上述第一房型信息中包括第一描述信息,上述第二房型信息中包括第二描述信息,上述第一描述信息和第二描述信息分别包括用于描述上述目标房型的多个字段;以及,上述提取单元302,进一步被配置成:对于上述第一描述信息、上述第二描述信息中的每一个描述信息,执行如下步骤:从该描述信息中,查找标准字段;将该描述信息中的其余各字段分别作为非标准字段,从各非标准字段中提取关键词;对各关键词进行解析,确定各关键词对应的关键项和关键项的值;分别将各关键词对应的关键项和关键项的值转换为标准字段。

在本实施例的一些可选的实现方式中,上述第一房型信息中包括第一房型图片,上述第二房型信息中包括第二房型图片;以及,上述提取单元302,进一步被配置成:对于上述第一房型图片、上述第二房型图片中的每一个房型图片,执行如下步骤:将该房型图片输入至预先训练的一个或多个图像识别模型,得到各图像识别模型输出的识别结果,其中,每一个图像识别模型用于识别一个预设的关键项的值;基于各图像识别模型输出的识别结果,生成各关键项对应的标准字段。

在本实施例的一些可选的实现方式中,上述第一房型信息中包括第一描述信息和第一房型图片,上述第二房型信息中包括第二描述信息和第二房型图片;以及,上述匹配单元303,进一步被配置成:分别将上述第一描述信息、上述第一房型图片、上述第二描述信息和上述第二房型图片作为提取来源,将从每两个提取来源提取的包含相同关键项的标准字段进行匹配;将从同一个提取来源中提取的标准字段中的至少两项进行匹配。

在本实施例的一些可选的实现方式中,上述匹配单元303,进一步被配置成:将从每两个提取来源提取的包含相同关键项的标准字段作为一组目标标准字段;分别确定每组目标标准字段中的关键项的值是否相同。

在本实施例的一些可选的实现方式中,从每一个提取来源所提取的标准字段中的关键项包括床型信息、房型最大容纳人数、房间面积;以及,上述匹配单元303,进一步被配置成:对于每一个提取来源,执行如下步骤:基于上述床型信息,确定床型种类、每种床型的数量和每种床型的尺寸;基于上述床型种类、每种床型的数量和每种床型的尺寸,确定各种床型的最大可住人数和每种床型对应的床型面积;检测各种床型的最大可住人数是否相同;检测各种床型的最大可住人数是否大于或等于上述房型最大容纳人数;检测各种床型的床型面积是否小于或等于上述房间面积。

本申请的上述实施例提供的装置,通过获取入驻目标平台的目标酒店中目标房型的第一房型信息和第二房型信息,而后从第一房型信息和第二房型信息中分别提取关键信息,最后对所提取的关键信息进行匹配,从而可以基于匹配结果,确定第一房型信息和第二房型信息中的异常信息。由于第一房型信息、第二房型信息分别为目标酒店和/或目标平台所维护的房型信息,由此,本申请实施例可以通过关键信息匹配的方式,自动检测目标酒店和目标平台所维护的房型信息中的异常信息,不需要依赖用户、商家、业务经理等人员进行人工查找、上报和核实,减少了异常信息的漏检情况,提高了对异常信息的检测的效率。

下面参考图4,其示出了适于用来实现本申请实施例的电子设备的计算机系统400的结构示意图。图4示出的电子设备仅仅是一个示例,不应对本申请实施例的功能和使用范围带来任何限制。

如图4所示,计算机系统400包括中央处理单元(cpu)401,其可以根据存储在只读存储器(rom)402中的程序或者从存储部分408加载到随机访问存储器(ram)403中的程序而执行各种适当的动作和处理。在ram403中,还存储有系统400操作所需的各种程序和数据。cpu401、rom402以及ram403通过总线404彼此相连。输入/输出(i/o)接口405也连接至总线404。

以下部件连接至i/o接口405:包括键盘、鼠标等的输入部分406;包括诸如液晶显示器(lcd)等以及扬声器等的输出部分407;包括硬盘等的存储部分408;以及包括诸如lan卡、调制解调器等的网络接口卡的通信部分409。通信部分409经由诸如因特网的网络执行通信处理。驱动器410也根据需要连接至i/o接口405。可拆卸介质411,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器410上,以便于从其上读出的计算机程序根据需要被安装入存储部分408。

特别地,根据本公开的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本公开的实施例包括一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信部分409从网络上被下载和安装,和/或从可拆卸介质411被安装。在该计算机程序被中央处理单元(cpu)401执行时,执行本申请的方法中限定的上述功能。需要说明的是,本申请所述的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(ram)、只读存储器(rom)、可擦式可编程只读存储器(eprom或闪存)、光纤、便携式紧凑磁盘只读存储器(cd-rom)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本申请中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本申请中,计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:无线、电线、光缆、rf等等,或者上述的任意合适的组合。

附图中的流程图和框图,图示了按照本申请各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,该模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。

描述于本申请实施例中所涉及到的单元可以通过软件的方式实现,也可以通过硬件的方式来实现。所描述的单元也可以设置在处理器中,其中,这些单元的名称在某种情况下并不构成对该单元本身的限定。

作为另一方面,本申请还提供了一种计算机可读介质,该计算机可读介质可以是上述实施例中描述的装置中所包含的;也可以是单独存在,而未装配入该装置中。上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被该装置执行时,使得该装置:获取入驻目标平台的目标酒店中目标房型的第一房型信息和第二房型信息,其中,第一房型信息为目标酒店所维护的房型信息,第二房型信息为目标平台所维护的房型信息;分别从第一房型信息和第二房型信息中提取关键信息;对所提取的关键信息进行匹配;基于匹配结果,确定第一房型信息和/或第二房型信息中的异常信息。

以上描述仅为本申请的较佳实施例以及对所运用技术原理的说明。本领域技术人员应当理解,本申请中所涉及的发明范围,并不限于上述技术特征的特定组合而成的技术方案,同时也应涵盖在不脱离上述发明构思的情况下,由上述技术特征或其等同特征进行任意组合而形成的其它技术方案。例如上述特征与本申请中公开的(但不限于)具有类似功能的技术特征进行互相替换而形成的技术方案。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1