基于分布式全文检索系统的卡口车辆搜索的方法及系统的制作方法
【专利摘要】本发明公开基于分布式全文检索系统的卡口车辆搜索的方法,包括:获取由卡口的过车图片解析后生成的过车图片的文本描述信息;根据过车图片的文本描述信息的主要字段设置分布式全文检索系统配置文件;按分布式全文检索系统配置文件将过车图片的文本描述信息解析索引到分布式全文检索系统数据库中,在分布式全文检索系统数据库中建立倒排索引并进行分布式存储;接收卡口车辆搜索请求,并解析出所要搜索的目标卡口车辆属性;根据目标卡口车辆属性从分布式全文检索系统数据库中查找到目标卡口车辆信息并进行反馈。本发明加快了卡口车辆搜索、查询的效率。
【专利说明】
基于分布式全文检索系统的卡口车辆搜索的方法及系统
技术领域
[0001 ]本发明涉及卡口车辆信息搜索的技术领域,具体地,涉及一种基于分布式全文检索系统的卡口车辆搜索的方法及系统。【背景技术】
[0002]近年来,随着互联网技术及信息处理技术的发展,各种信息的智能化分析及处理成为业内的热门研究内容。加上现今各地的交通设备的大量增加,交通信息工程的建设,为人们的日常生活提供了丰富的信息资源的同时,也增加了交通信息数据的分析处理量。车辆已经成为了人们生活中必不可少的交通工具,每天在各地都会有大量的车辆信息,通过对各地的这些车辆信息数据进行分析可以获取许多重要的信息、情报。
[0003]在现今的交通管理系统中,卡口系统用于采用光电技术、图像处理技术、模式识别技术等技术拍下过往各个卡口的每一辆车辆的图像,识别出车辆的牌照等信息,并将所采集到的车辆信息数据保存在服务器数据库中。卡口系统通过上述各种技术手段最终生成简单的过车信息,包括:车牌号、车型、车身颜色、车牌颜色、过车时间、行驶速度、卡口编号等。 但是,随着各地智能交通信息系统工程的持续建设和投入,交通设备设施的大量增加,以及人们对车辆的依赖性增强,导致卡口系统产生的过车数据迅速膨胀。现有技术将这些过车数据存储在关系型数据库中,日积月累这些数据可能有千万条,甚至几亿、几十亿条数据。
[0004]关系型数据库以行和列形成交叉二维表的形式存储数据,在交叉二维表中,每一行定义实体集的一个实体;每一列定义实体集的一个属性特征。在卡口系统产生过车信息的速度快,且各个卡口产生的过车信息集合起来数据量大,按照二维表的实体即属性特征进行存储,会因为存储数据量大增加存储成本,还会因为较大存储数据的二维表中不能快速查询到数据的存储定位而不能实时地进行数据存储。并且关系型数据库的二维表中不能体现各个数据之间的联系,会造成后续管理不方便的问题。再者,由于庞大的数据存储量, 后续对数据库的应用中,从庞大的数据中快速地查找到目标数据就显得更为重要,而按照现有技术的存储方式,每次查找数据都需要遍历整个二维表中存储的庞大数据,造成查询效率低下。
[0005]因此,提供一种高效易实施的卡口车辆信息搜索的方法是本领域亟待解决的问题。
【发明内容】
[0006]有鉴于此,本发明提供了一种基于分布式全文检索系统的卡口车辆搜索的方法及系统,解决了在卡口车辆信息存储数据库中进行卡口车辆搜索效率低下的问题。
[0007]为了解决上述技术问题,本发明提出一种基于分布式全文检索系统的卡口车辆搜索的方法,包括:
[0008]获取由卡口的过车图片解析后生成的过车图片的文本描述信息,所述过车图片的文本描述信息至少包括:车牌号、车型、车身颜色、车牌颜色、卡口信息及过车时间,其中,所述过车图片的文本描述信息通过分布式发布订阅消息系统进行缓存;
[0009]根据所述过车图片的文本描述信息的主要字段设置分布式全文检索系统配置文件;
[0010]按所述分布式全文检索系统配置文件将所述过车图片的文本描述信息解析索引到分布式全文检索系统数据库中,在所述分布式全文检索系统数据库中建立倒排索引并进行分布式存储;
[0011]接收卡口车辆搜索请求,并解析出所要搜索的目标卡口车辆属性;
[0012]根据所述目标卡口车辆属性从所述分布式全文检索系统数据库中查找到目标卡口车辆信息并进行反馈。
[0013]进一步地,其中,所述主要字段至少包括:车牌号、车型、车身颜色、车牌颜色。
[0014]进一步地,其中,所述在所述分布式全文检索系统数据库中建立倒排索引,包括:
[0015]根据所述过车图片的文本描述信息的主要字段设置关键词索引,并以所述过车图片的文本描述信息的分布式全文检索系统数据的文档编号为索引内容建立倒排索引。
[0016]进一步地,其中,所述根据所述目标卡口车辆属性从所述分布式全文检索系统数据库中查找到目标卡口车辆信息并进行反馈,包括:
[0017]根据所述目标卡口车辆属性设置索引;
[0018]基于该索引从所述分布式全文检索系统数据库中查找到相应的目标卡口车辆信息的文档编号;
[0019]再通过查找到的文档编号获取目标卡口车辆信息并进行反馈。
[0020]进一步地,其中,所述分布式存储由至少两台物理机进行存储,并通过分布式服务框架管理各个存储节点。
[0021]另外,本发明还提供一种基于分布式全文检索系统的卡口车辆搜索的系统,所述系统包括:获取模块、配置模块、存储模块、接收模块及处理模块,其中,
[0022]所述获取模块,用于获取由卡口的过车图片解析后生成的过车图片的文本描述信息,所述过车图片的文本描述信息至少包括:车牌号、车型、车身颜色、车牌颜色、卡口信息及过车时间,其中,所述过车图片的文本描述信息通过分布式发布订阅消息系统进行缓存;
[0023]所述配置模块,用于根据所述过车图片的文本描述信息的主要字段设置分布式全文检索系统配置文件;
[0024]所述存储模块,用于按所述分布式全文检索系统配置文件将所述过车图片的文本描述信息解析索引到分布式全文检索系统数据库中,在所述分布式全文检索系统数据库中建立倒排索引并进行分布式存储;
[0025]所述接收模块,用于接收卡口车辆搜索请求,并解析出所要搜索的目标卡口车辆属性;
[0026]所述处理模块,用于根据所述目标卡口车辆属性从所述分布式全文检索系统数据库中查找到目标卡口车辆信息并进行反馈。
[0027]进一步地,其中,所述主要字段至少包括:车牌号、车型、车身颜色、车牌颜色。
[0028]进一步地,其中,所述存储模块,用于根据所述过车图片的文本描述信息的主要字段设置关键词索引,并以所述过车图片的文本描述信息的分布式全文检索系统数据的文档编号为索引内容建立倒排索引。
[0029]进一步地,其中,所述处理模块,用于:
[0030]根据所述目标卡口车辆属性设置索引;[0031 ]基于该索引从所述分布式全文检索系统数据库中查找到相应的目标卡口车辆信息的文档编号;
[0032]再通过查找到的文档编号获取目标卡口车辆信息并进行反馈。
[0033]进一步地,其中,所述分布式存储由至少两台物理机进行存储,并通过分布式服务框架管理各个存储节点。
[0034]与现有技术相比,本发明的基于分布式全文检索系统的卡口车辆搜索的方法及系统,实现了如下的有益效果:
[0035](1)本发明所述的基于分布式全文检索系统的卡口车辆搜索的方法及系统,基于分布式全文检索系统采用分布式存储卡口的过车图片的文本描述信息,可以通过设置多台廉价的物理机进行数据存储,再利用一台物理机统一管理,数据存储量增加时还可以增加物理机,降低了庞大的卡口过车图片的文本描述信息数据的存储成本。
[0036](2)本发明所述的基于分布式全文检索系统的卡口车辆搜索的方法及系统,基于分布式全文检索系统建立倒排索引,方便通过用户的卡口车辆搜索请求中的关键词进行快速查找,同时,还可以基于分布式存储采用并行式的查找,大大加快了卡口车辆搜索、查询的效率。
[0037]当然,实施本发明的任一产品必不一定需要同时达到以上所述的所有技术效果。【附图说明】
[0038]此处所说明的附图用来提供对本发明的进一步理解,构成本发明的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
[0039]图1为本发明的基于分布式全文检索系统的卡口车辆搜索的方法的一个可选实施例的流程示意图;
[0040]图2为本发明实施例1所述基于分布式全文检索系统的卡口车辆搜索的方法中,倒排索引的索引词与相应文档的结构示意图;
[0041]图3为本发明实施例2所述基于分布式全文检索系统的卡口车辆搜索的方法的一个可选实施例的流程示意图;
[0042]图4为本实施例2中应用基于分布式全文检索系统的卡口车辆搜索的方法的系统设备结构示意图;
[0043]图5为本实施例3中所述基于分布式全文检索系统的卡口车辆搜索的方法的流程示意图;
[0044]图6为本实施例4中公开的基于分布式全文检索系统的卡口车辆搜索的系统的一个可选实施例的结构示意图。【具体实施方式】
[0045]如在说明书及权利要求当中使用了某些词汇来指称特定组件。本领域技术人员应可理解,硬件制造商可能会用不同名词来称呼同一个组件。本说明书及权利要求并不以名称的差异来作为区分组件的方式,而是以组件在功能上的差异来作为区分的准则。如在通篇说明书及权利要求当中所提及的“包含”为一开放式用语,故应解释成“包含但不限定于”。“大致”是指在可接收的误差范围内,本领域技术人员能够在一定误差范围内解决所述技术问题,基本达到所述技术效果。说明书后续描述为实施本发明的较佳实施方式,然所述描述乃以说明本发明的一般原则为目的,并非用以限定本发明的范围。本发明的保护范围当视所附权利要求所界定者为准。
[0046]实施例1
[0047]如图1所示,为本发明的基于分布式全文检索系统的卡口车辆搜索的方法的一个可选实施例的流程示意图,本发明基于分布式全文检索系统设计卡口过车信息的倒排索引并进行分布式存储,加快了卡口车辆搜索的效率。本实施例中所述分布式全文检索系统的卡口车辆搜索的方法包括以下步骤:
[0048]步骤101、获取由卡口的过车图片解析后生成的过车图片的文本描述信息,所述过车图片的文本描述信息至少包括:车牌号、车型、车身颜色、车牌颜色、卡口信息及过车时间,其中,所述过车图片的文本描述信息通过分布式发布订阅消息系统(kafka)进行缓存。
[0049]过车图片的文本描述信息(VSD过车信息)是由缓存卡口或电警等前端设备产生的过车图片后进过解析后生成的,VSD过车信息包含:车牌号、车型、颜色、过车时间、卡口信息等信息。
[0050]优选地,所述过车图片的文本描述信息通过分布式发布订阅消息系统缓存在消息服务器中,本步骤从消息服务器中获取过车图片的文本描述信息,而分布式发布订阅消息系统是一种高吞吐量的分布式发布订阅消息系统,它可以处理消费者规模的网站中的所有动作流数据。分布式发布订阅消息系统具有如下特性:(1)通过磁盘数据结构提供消息的持久化,这种结构对于即使数以TB的消息存储也能够保持长时间的稳定性能;(2)高吞吐量; (3)支持通过分布式发布订阅消息系统服务器和消费机集群来分区消息;(4)支持分布式计算(Hadoop)并行数据加载,可以加快数据的加载传输;(5)产生和消费消息时自动负载均衡。在本步骤中,只要检测到分布式发布订阅消息系统中有数据就会读取出来进行解析索引。
[0051]步骤102、根据所述过车图片的文本描述信息的主要字段设置分布式全文检索系统的配置文件。[〇〇52]分布式全文检索系统(S0LRCL0UD)是基于全文搜索服务器(solr)和分布式服务框架(zookeeper)的分布式搜索方案,solr是一个独立的企业级搜索应用服务器,它对外提供接口,用户可以通过发送请求,向搜索引擎服务器提交一定格式(例如XML格式)的文件生成索弓丨;也可以通过相关的获取操作提出查找请求,并得到返回结果。分布式服务框架 (zookeeper)是Hadoop的开源子项目,在分布式系统架构中大量的被运用,从而减少分布式架构的复杂度。分布式全文检索系统(S0LRCL0UD)是使用zookeeper作为集群的配置信息中心,通过分布式服务框架(zookeeper)进行全文搜索服务器(so 1 r)各节点之间的信息同步。 而分布式全文检索系统(S0LRCL0UD)采用分布式的存储方式,对索引进行分片,并对每个分片创建多个数据复制(Rep li cat 1n)。每个Replica t 1n都可以对外提供服务,一个 Replicat1n故障不会影响索引服务,更强大的是,它还能自动的在其它机器上帮你把失败机器上的索引Replicat1n重建并投入使用。
[0053]分布式全文检索系统有如下几个特色:(1)集中式的配置信息;(2)自动容错;(3)近实时搜索:(4)查询时自动负载均衡。用户只需要在配置文件中配置好要索引的过车信息字段(如:车牌号、车型、类别、车身颜色、车牌颜色、过车时间、卡口编号等),并将此配置文件和分布式全文检索系统中其它配置文件一起上传到zookeeper中,然后利用此配置文件创建好类聚框架(col lect1n ),在创建col lect1n时还可以设置副本数以存储要索引的过车数据,启动分布式全文检索系统集群,即可提供对车辆的索引和搜索功能。[〇〇54]优选地,在本步骤中,消息消费者从上述的消息服务器中读取已缓存的过车图片的文本描述信息,并把这些过车信息按分布式全文检索系统配置文件中配置好的字段解析索引到分布式全文检索系统数据库里。其中,所述配置文件是根据所述过车图片的文本描述信息的主要字段预先设置的,例如,在配置文件中,设置名称字段对应过车信息字段的英文名:carPlateNo对应车牌号、carColor对应车身颜色。
[0055]步骤103、按所述分布式全文检索系统配置文件将所述过车图片的文本描述信息解析索引到分布式全文检索系统数据库中,在所述分布式全文检索系统数据库中建立倒排索引并进行分布式存储。
[0056]优选地,在本步骤中,采用分布式全文检索系统集群索引并存储过车图片的文本描述信息,过车图片的文本描述信息是以配置文件中配置的字段进行倒排索引,倒排索引与正排索引的区别是:正排索引是由文档编号找词,而倒排索引是由词找文档编号,倒排索引的形式如图2所示。[〇〇57]步骤104、接收卡口车辆搜索请求,并解析出所要搜索的目标卡口车辆属性。[〇〇58]用户通过分布式全文检索系统提供的接口发送卡口车辆搜索请求,分布式全文检索系统接收到该请求后提取其中的目标卡口车辆属性以生成查询的关键词。
[0059]步骤105、根据所述目标卡口车辆属性从所述分布式全文检索系统数据库中查找到目标卡口车辆信息并进行反馈。
[0060]本实施例的基于分布式全文检索系统的卡口车辆搜索的方法,基于分布式全文检索系统采用分布式存储卡口的过车图片的文本描述信息,可以通过设置多台廉价的物理机进行数据存储,降低了庞大的卡口过车图片的文本描述信息数据的存储成本。还通过建立倒排索引,方便通过用户的卡口车辆搜索请求中的关键词进行快速查找,以及基于分布式存储采用并行式的查找方式,大大加快了卡口车辆搜索、查询的效率,实现了实时查询的目的。[0061 ] 实施例2
[0062]如图3所示,为本发明实施例2的基于分布式全文检索系统的卡口车辆搜索的方法。在本实施例中,设置了基于分布式全文检索系统建立过车图片的文本描述信息倒排索引以及查找目标卡口车辆信息的具体方法。本实施例中基于分布式全文检索系统的卡口车辆搜索的方法包括以下步骤:
[0063]步骤201、获取由卡口的过车图片解析后生成的过车图片的文本描述信息,所述过车图片的文本描述信息至少包括:车牌号、车型、车身颜色、车牌颜色、卡口信息及过车时间,其中,所述过车图片的文本描述信息通过分布式发布订阅消息系统进行缓存。
[0064]步骤202、根据所述过车图片的文本描述信息的主要字段设置分布式全文检索系统配置文件。所述主要字段至少包括:车牌号、车型、车身颜色、车牌颜色。
[0065]步骤203、按所述分布式全文检索系统配置文件将所述过车图片的文本描述信息解析索引到分布式全文检索系统数据库中,根据所述过车图片的文本描述信息的主要字段设置关键词索引,并以所述过车图片的文本描述信息的分布式全文检索系统数据的文档编号为索引内容建立倒排索引并进行分布式存储。所述分布式存储由至少两台物理机进行存储,并通过分布式服务框架管理各个存储节点。
[0066]步骤204、接收卡口车辆搜索请求,并解析出所要搜索的目标卡口车辆属性。[〇〇67]步骤205、根据所述目标卡口车辆属性设置分布式全文检索系统索引。
[0068]步骤206、基于该索引从所述分布式全文检索系统数据库中查找到相应的目标卡口车辆信息的文档编号。[〇〇69]步骤207、再通过查找到的文档编号获取目标卡口车辆信息并进行反馈。
[0070]当根据用户的关键词对卡口车辆进行搜索时,会找到该词出现过的所有文档编号,然后再通过该文档编号寻找文档的具体内容,不用遍历所有文档的具体内容,以达到高效搜索的目的。
[0071]在本实施例中,该基于分布式全文检索系统的卡口车辆搜索的方法可应用在系统设备中,如图4所示,为应用本实施例基于分布式全文检索系统的卡口车辆搜索的方法的系统设备结构示意图。在图4中,卡口或电警等前端设备001采集过车图片,传送至消息服务器 002;所述消息服务器缓存卡口或电警等前端设备产生的过车图片解析生成的过车图片的文本描述信息;消费者003从所述消息服务器002读取已缓存的过车信息,并把这些过车信息按分布式全文检索系统配置文件中配置好的字段解析索引到分布式全文检索系统搜索引擎004的分布式全文检索系统数据库里,所述分布式全文检索系统搜索引擎004根据所述过车图片的文本描述信息的主要字段设置关键词索引,并以所述过车图片的文本描述信息的分布式全文检索系统数据的文档编号为索引内容建立倒排索引并进行分布式存储到分布式全文检索系统数据库中;当用户通过终端005发送卡口车辆搜索请求时,终端的卡口车辆搜索应用程序将该卡口车辆搜索请求传输至所述分布式全文检索系统搜索引擎004,按照请求中设置的关键词在分布式全文检索系统搜索引擎004中进行卡口车辆搜索并反馈搜索结果。[〇〇72] 实施例3
[0073]如图5所示,为本发明实施例3所述基于分布式全文检索系统的卡口车辆搜索的方法的一个可选实施例。在本实施例,具体设置了基于分布式全文检索系统存储各个卡口的过车图片的文本描述信息以及进行卡口车辆搜索的方法。本实施例的步骤如下:[〇〇74]步骤301、在消息服务器上安装分布式发布订阅消息系统并配置环境变量,缓存卡口或电警等前端设备产生的过车图片解析生成的过车图片的文本描述信息(VSD过车信息hVSD过车信息包含车牌号、车型、颜色、过车时间等信息。[〇〇75]步骤302、基于2n+l (n> = 1)台服务器搭建分布式全文检索系统集群,创建这些服务器两两之间无密码登陆进行连接并在各个服务器上安装好软件开发工具包。[0〇76]步骤303、在所述分布式全文检索系统集群下安装分布式服务框架(zookeeper)。
[0077]步骤304、在所述分布式全文检索系统配置文件中添加要索引的字段,并上传到分布式服务框架中。
[0078]步骤305、使用分布式全文检索系统命令指定分布式全文检索系统配置文件创建类聚框架(collect1n),用于存放索引的过车信息。
[0079]步骤306、启动分布式全文检索系统集群。[〇〇8〇]步骤307、获取由卡口的过车图片解析后生成的过车图片的文本描述信息。
[0081]步骤308、按所述分布式全文检索系统配置文件将所述过车图片的文本描述信息解析索引到分布式全文检索系统数据库中,在所述分布式全文检索系统数据库中建立倒排索引并进行分布式存储。[〇〇82]步骤309、接收卡口车辆搜索请求,并解析出所要搜索的目标卡口车辆属性。[〇〇83]步骤310、根据所述目标卡口车辆属性从所述分布式全文检索系统数据库中查找到目标卡口车辆信息并进行反馈。
[0084]实施例4
[0085]如图6所示,为本实施例中公开的基于分布式全文检索系统的卡口车辆搜索的系统的一个可选实施例的结构示意图。本实施例中所述的基于分布式全文检索系统的卡口车辆搜索的系统包括:获取模块401、配置模块402、存储模块403、接收模块404及处理模块 405,其中,[〇〇86]所述获取模块401,与所述配置模块402相藕接,用于获取由卡口的过车图片解析后生成的过车图片的文本描述信息,所述过车图片的文本描述信息至少包括:车牌号、车型、车身颜色、车牌颜色、卡口信息及过车时间,其中,所述过车图片的文本描述信息通过分布式发布订阅消息系统进行缓存。[〇〇87]所述配置模块402,与所述获取模块401及存储模块403相藕接,用于根据所述过车图片的文本描述信息的主要字段设置分布式全文检索系统配置文件。其中,所述主要字段至少包括:车牌号、车型、车身颜色、车牌颜色。[〇〇88]所述存储模块403,与所述配置模块402、接收模块404及处理模块相藕接,用于按所述分布式全文检索系统配置文件将所述过车图片的文本描述信息解析索引到分布式全文检索系统数据库中,在所述分布式全文检索系统数据库中建立倒排索引并进行分布式存储。[〇〇89]所述接收模块404,与所述存储模块403相藕接,用于接收卡口车辆搜索请求,并解析出所要搜索的目标卡口车辆属性。
[0090]所述处理模块405,与所述存储模块403相藕接,用于根据所述目标卡口车辆属性从所述分布式全文检索系统数据库中查找到目标卡口车辆信息并进行反馈。
[0091]上述的存储模块403,进一步用于根据所述过车图片的文本描述信息的主要字段设置关键词索引,并以所述过车图片的文本描述信息的分布式全文检索系统数据的文档编号为索引内容建立倒排索引。[〇〇92]所述处理模块405,进一步用于根据所述目标卡口车辆属性设置索引;
[0093]基于该索引从所述分布式全文检索系统数据库中查找到相应的目标卡口车辆信息的文档编号;
[0094]再通过查找到的文档编号获取目标卡口车辆信息并进行反馈。
[0095]在本实施例的基于分布式全文检索系统的卡口车辆搜索的系统中,所述分布式存储由至少两台物理机进行存储,并通过分布式服务框架(zookeeper)管理各个存储节点。
[0096]在本发明中,过车数据的存储与查询均基于分布式全文检索系统建立在分布式系统架构上,利用大数据平台技术将过车数据保存到分布式存储系统中,按照倒排索引建立索引机制,且在存储的过程中已经按照需求进行了基础统计工作,用户终端通过请求可快速地从数据库中查询并获取到所需的过车数据。且在本实施例中,数据库采用分布式存储的方式,用户终端可以在分布式存储服务器上并行地进行查询,提高了查询的效率。
[0097]通过以上各个实施例可知,本发明的基于分布式全文检索系统的卡口车辆搜索的方法及系统存在的有益效果是:
[0098](1)本发明所述的基于分布式全文检索系统的卡口车辆搜索的方法及系统,基于分布式全文检索系统采用分布式存储卡口的过车图片的文本描述信息,可以通过设置多台廉价的物理机进行数据存储,再利用一台物理机统一管理,数据存储量增加时还可以增加物理机,降低了庞大的卡口过车图片的文本描述信息数据的存储成本。
[0099](2)本发明所述的基于分布式全文检索系统的卡口车辆搜索的方法及系统,基于分布式全文检索系统建立倒排索引,方便通过用户的卡口车辆搜索请求中的关键词进行快速查找,同时,还可以基于分布式存储采用并行式的查找,大大加快了卡口车辆搜索、查询的效率。
[0100]本领域内的技术人员应明白,本发明的实施例可提供为方法、装置、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
[0101]上述说明示出并描述了本发明的若干可选实施例,但如前所述,应当理解本发明并非局限于本文所披露的形式,不应看作是对其他实施例的排除,而可用于各种其他组合、 修改和环境,并能够在本文所述发明构想范围内,通过上述教导或相关领域的技术或知识进行改动。而本领域人员所进行的改动和变化不脱离本发明的精神和范围,则都应在本发明所附权利要求的保护范围内。
【主权项】
1.一种基于分布式全文检索系统的卡口车辆搜索的方法,其特征在于,包括:获取由卡口的过车图片解析后生成的过车图片的文本描述信息,所述过车图片的文本 描述信息至少包括:车牌号、车型、车身颜色、车牌颜色、卡口信息及过车时间,其中,所述过 车图片的文本描述信息通过分布式发布订阅消息系统进行缓存;根据所述过车图片的文本描述信息的主要字段设置分布式全文检索系统配置文件;按所述分布式全文检索系统配置文件将所述过车图片的文本描述信息解析索引到分 布式全文检索系统数据库中,在所述分布式全文检索系统数据库中建立倒排索引并进行分 布式存储;接收卡口车辆搜索请求,并解析出所要搜索的目标卡口车辆属性;根据所述目标卡口车辆属性从所述分布式全文检索系统数据库中查找到目标卡口车 辆信息并进行反馈。2.根据权利要求1所述的基于分布式全文检索系统的卡口车辆搜索的方法,其特征在 于,所述主要字段至少包括:车牌号、车型、车身颜色、车牌颜色。3.根据权利要求1所述的基于分布式全文检索系统的卡口车辆搜索的方法,其特征在 于,所述在所述分布式全文检索系统数据库中建立倒排索引,包括:根据所述过车图片的文本描述信息的主要字段设置关键词索引,并以所述过车图片的 文本描述信息的分布式全文检索系统数据的文档编号为索引内容建立倒排索引。4.根据权利要求3所述的基于分布式全文检索系统的卡口车辆搜索的方法,其特征在 于,所述根据所述目标卡口车辆属性从所述分布式全文检索系统数据库中查找到目标卡口 车辆信息并进行反馈,包括:根据所述目标卡口车辆属性设置索引;基于该索引从所述分布式全文检索系统数据库中查找到相应的目标卡口车辆信息的 文档编号;再通过查找到的文档编号获取目标卡口车辆信息并进行反馈。5.根据权利要求1-4中任一项所述的基于分布式全文检索系统的卡口车辆搜索的方 法,其特征在于,所述分布式存储由至少两台物理机进行存储,并通过分布式服务框架管理 各个存储节点。6.—种基于分布式全文检索系统的卡口车辆搜索的系统,其特征在于,所述系统包括: 获取模块、配置模块、存储模块、接收模块及处理模块,其中,所述获取模块,用于获取由卡口的过车图片解析后生成的过车图片的文本描述信息, 所述过车图片的文本描述信息至少包括:车牌号、车型、车身颜色、车牌颜色、卡口信息及过 车时间,其中,所述过车图片的文本描述信息通过分布式发布订阅消息系统进行缓存;所述配置模块,用于根据所述过车图片的文本描述信息的主要字段设置分布式全文检 索系统配置文件;所述存储模块,用于按所述分布式全文检索系统配置文件将所述过车图片的文本描述 信息解析索引到分布式全文检索系统数据库中,在所述分布式全文检索系统数据库中建立 倒排索引并进行分布式存储;所述接收模块,用于接收卡口车辆搜索请求,并解析出所要搜索的目标卡口车辆属性;所述处理模块,用于根据所述目标卡口车辆属性从所述分布式全文检索系统数据库中查找到目标卡口车辆信息并进行反馈。7.根据权利要求6所述的基于分布式全文检索系统的卡口车辆搜索的系统,其特征在 于,所述主要字段至少包括:车牌号、车型、车身颜色、车牌颜色。8.根据权利要求6所述的基于分布式全文检索系统的卡口车辆搜索的系统,其特征在 于,所述存储模块,用于根据所述过车图片的文本描述信息的主要字段设置关键词索引,并 以所述过车图片的文本描述信息的分布式全文检索系统数据的文档编号为索引内容建立 倒排索引。9.根据权利要求8所述的基于分布式全文检索系统的卡口车辆搜索的系统,其特征在 于,所述处理模块,用于:根据所述目标卡口车辆属性设置索引;基于该索引从所述分布式全文检索系统数据库中查找到相应的目标卡口车辆信息的 文档编号;再通过查找到的文档编号获取目标卡口车辆信息并进行反馈。10.根据权利要求6-9中任一项所述的基于分布式全文检索系统的卡口车辆搜索的系 统,其特征在于,所述分布式存储由至少两台物理机进行存储,并通过分布式服务框架管理 各个存储节点。
【文档编号】G06F17/30GK106021276SQ201610274064
【公开日】2016年10月12日
【申请日】2016年4月28日
【发明人】李庆功, 辛国茂, 马述杰
【申请人】泰华智慧产业集团股份有限公司