一种数据聚类方法、装置、计算机设备及存储介质与流程

文档序号:30750428发布日期:2022-07-13 08:49阅读:来源:国知局

技术特征:
1.一种数据聚类方法,其特征在于,包括:获取各个第一聚类结果,其中,所述各个第一聚类结果是基于在预设时间段内产生的各个目标车辆行驶数据各自包含的车辆行驶图像中,位于车辆内部的人脸所在的人脸图像区域,对所述各个目标车辆行驶数据进行初始聚类处理获得的,每个第一聚类结果包含至少一个目标车辆行驶数据;基于预设的关联关系挖掘策略,对所述各个目标车辆行驶数据,以及在所述预设时间段内产生的各个参考车辆行驶数据进行挖掘处理,获得目标车辆行驶数据与参考车辆行驶数据之间的多个关联关系,其中,所述各个参考车辆行驶数据各自包含的车牌数据,与所述各个目标车辆行驶数据各自包含的车牌数据匹配;基于所述多个关联关系和所述各个第一聚类结果,对所述目标车辆行驶数据进行目标聚类处理,获得至少一个目标聚类结果。2.根据权利要求1所述的方法,其特征在于,在基于预设的关联关系挖掘策略,对所述各个目标车辆行驶数据,以及在所述预设时间段内产生的各个参考车辆行驶数据进行挖掘处理,获得目标车辆行驶数据与参考车辆行驶数据之间的多个关联关系之前,还包括:获取所述各个目标车辆行驶数据各自包含的车辆行驶图像中,包含人脸的车辆图像区域对应的车牌数据;针对所述各个目标车辆行驶数据各自包含的车牌数据,分别在所述预设时间段内产生的各个实时车辆行驶数据中,选取包含的车辆行驶图像中车辆图像区域对应的车牌数据,与相应目标车辆行驶数据包含的车牌数据相同的实时车辆行驶数据,作为参考车辆行驶数据。3.根据权利要求1所述的方法,其特征在于,所述目标车辆行驶数据和所述参考车辆行驶数据分别还包括数据产生时刻和数据产生地址;所述基于预设的关联关系挖掘策略,对所述各个目标车辆行驶数据,以及在所述预设时间段内产生的各个参考车辆行驶数据进行挖掘处理,获得目标车辆行驶数据与参考车辆行驶数据之间的多个关联关系,包括:将所述各个目标车辆行驶数据和所述各个参考车辆行驶数据,分别作为综合车辆行驶数据,并基于包含的车牌数据和数据产生时刻所属时间区间,对各个综合车辆行驶数据进行分组处理,针对每个车牌数据,获得多个车辆行驶数据序列,其中,每个车辆行驶数据序列包含的各综合车辆行驶数据按照数据产生时刻排列;针对每个车牌数据对应的多个车辆行驶数据序列,执行以下操作:采用所述关联关系挖掘策略,基于每个车辆行驶数据序列包含的综合车辆行驶数据的数据产生地址,分别对相应的多个车辆行驶数据序列进行挖掘处理,确定至少一个频繁项,以及每个频繁项包含的综合车辆行驶数据的数据产生地址,在相应的多个车辆行驶数据组中出现的频数,其中,所述频繁项包含至少一个综合车辆行驶数据;将获得的至少一个频繁项和相应的频数,作为相应车牌数据对应的关联关系。4.根据权利要求1~3任一项所述的方法,其特征在于,基于所述多个关联关系和所述各个第一聚类结果,对所述各个目标车辆行驶数据进行目标聚类处理,获得至少一个目标聚类结果,包括:基于所述各个目标车辆行驶数据各自的车牌数据,对所述各个第一聚类结果进行重新
整合处理,获得多个第二聚类结果,其中,每个第二聚类结果中的各目标车辆行驶数据的车牌数据相同,且车辆行驶图像中位于车辆内部的人脸匹配;基于所述多个关联关系和所述各个第二聚类结果,对所述各个目标车辆行驶数据进行目标聚类处理,获得至少一个目标聚类结果。5.根据权利要求4所述的方法,其特征在于,基于所述多个关联关系和所述各个第二聚类结果,对所述各个目标车辆行驶数据进行目标聚类处理,获得至少一个目标聚类结果,包括:针对所述各个第二聚类结果,分别从第二聚类结果包含的目标车辆行驶数据中,选取与相应第二聚类结果的聚类质心之间的相似度最大的目标车辆行驶数据,作为相应第二聚类结果对应的质心车辆行驶数据;基于所述多个关联关系,确定每两个质心车辆行驶数据之间的目标相似度;针对目标相似度大于预设相似度条件的每两个质心车辆行驶数据各自对应的第二聚类结果进行合并处理,获得至少一个目标聚类结果。6.根据权利要求5所述的方法,其特征在于,所述目标车辆行驶数据还包括驾驶标识,所述驾驶标识用于表征所述目标车辆行驶数据包含的车辆行驶图像中,包含位于车辆内部的人脸的人脸图像区域与车辆图像区域之间的相对位置关系,所述驾驶标识包括主驾驶标识和副驾驶标识;所述针对所述各个第二聚类结果,分别从第二聚类结果包含的目标车辆行驶数据中,选取与相应第二聚类结果的聚类质心之间的相似度最大的目标车辆行驶数据,作为相应第二聚类结果对应的质心车辆行驶数据,包括:针对所述各个第二聚类结果,分别执行以下操作:从第二聚类结果包含的各目标车辆行驶数据中,分别确定包含的驾驶标识为主驾驶标识的目标车辆行驶数据,以及包含的驾驶标识为副驾驶标识的目标车辆行驶数据;从包含主驾驶标识的目标车辆行驶数据中,选取与相应第二聚类结果的聚类质心之间的相似度最大的目标车辆行驶数据,作为主质心车辆行驶数据;从包含副驾驶标识的目标车辆行驶数据中,选取与相应第二聚类结果的聚类质心之间的相似度最大的目标车辆行驶数据,作为副质心车辆行驶数据;基于获得的主质心车辆行驶数据和副质心车辆行驶数据,获得所述第二聚类结果对应的质心车辆行驶数据。7.根据权利要求5所述的方法,其特征在于,每个关联关系对应一个车牌数据,每个关联关系包括至少一个频繁项,每个频繁项包含至少一个目标车辆行驶数据或参考车辆行驶数据,所述频繁项具有频数,所述频数表征所述频繁项对应的数据产生地址,在相同车牌数据和数据产生时刻属于相同时间区间的目标车辆行驶数据和参考车辆行驶数据中的出现次数;所述基于所述多个关联关系,确定每两个质心车辆行驶数据之间的目标相似度,包括:针对每两个执行车辆行驶数据,执行以下操作:基于两个质心车辆行驶数据各自包含的目标车辆行驶图像中,包含位于车辆内部的人脸的人脸图像区域之间的相似度,确定两个质心车辆行驶数据之间的初始相似度;基于所述两个质心车辆行驶数据各自包含的数据生成时刻是否属于相同的时间区间,
以及所述两个质心车辆行驶数据各自所在频繁项的频数,确定所述两个质心车辆行驶数据对应的拉伸系数;基于所述拉伸系数,对所述初始相似度进行拉伸处理,获得所述两个质心车辆行驶数据之间的目标相似度。8.根据权利要求7所述的方法,其特征在于,所述频繁项包括频繁一项和频繁二项,所述频繁一项包含的目标车辆行驶数据和参考车辆行驶数据具有相同的数据产生地址,所述频繁二项包含的目标车辆行驶数据和参考车辆行驶数据统计有不同的两个数据产生地址;所述基于所述两个质心车辆行驶数据各自包含的数据生成时刻是否属于相同的时间区间,以及所述两个质心车辆行驶数据各自所在频繁项的频数,确定所述两个质心车辆行驶数据对应的拉伸系数,包括:若所述两个质心车辆行驶数据各自数据产生时刻属于相同的时间区间,且所述两个质心车辆行驶数据属于相同的频繁二项,则以所述两个质心车辆行驶数据同在的频繁二项的频数,与每个质心车辆行驶数据所在频繁二项的频数和之比,作为所述两个质心车辆行驶数据对应的拉伸系数;若所述两个质心车辆行驶数据各自生成时间不属于相同的时间区间,且所述两个质心车辆行驶数据属于相同的频繁一项,则以所述两个质心车辆行驶数据同在的频繁一项的频数,与每个质心车辆行驶数据所在频繁二项包含的目标车辆行驶数据和参考车辆行驶数据分别所在的频繁一项的频数和之间的比值,作为所述两个质心车辆行驶数据对应的拉伸系数;若所述两个质心车辆行驶数据各自生成时间不属于相同的时间区间,且所述两个质心车辆行驶数据不属于相同的频繁一项或相同的频繁二项,则将预设的指定数值作为所述两个质心车辆行驶数据对应的拉伸系数。9.一种数据聚类装置,其特征在于,包括:获取模块:用于获取各个第一聚类结果,其中,所述各个第一聚类结果是基于在预设时间段内产生的各个目标车辆行驶数据各自包含的车辆行驶图像中,位于车辆内部的人脸所在的人脸图像区域,对所述各个目标车辆行驶数据进行初始聚类处理获得的,每个第一聚类结果包含至少一个目标车辆行驶数据;处理模块:用于基于预设的关联关系挖掘策略,对所述各个目标车辆行驶数据,以及在所述预设时间段内产生的各个参考车辆行驶数据进行挖掘处理,获得目标车辆行驶数据与参考车辆行驶数据之间的多个关联关系,其中,所述各个参考车辆行驶数据各自包含的车牌数据,与所述各个目标车辆行驶数据各自包含的车牌数据匹配;所述处理模块还用于:基于所述多个关联关系和所述各个第一聚类结果,对所述目标车辆行驶数据进行目标聚类处理,获得至少一个目标聚类结果。10.一种计算机程序产品,包括计算机程序,其特征在于,该计算机程序被处理器执行时实现如权利要求1~8中任一项所述方法。11.一种计算机设备,其特征在于,包括:存储器,用于存储程序指令;处理器,用于调用所述存储器中存储的程序指令,按照获得的程序指令执行如权利要求1~8中任一项所述的方法。
12.一种计算机可读存储介质,其特征在于,所述存储介质存储有计算机可执行指令,所述计算机可执行指令用于使计算机执行如权利要求1~8中任一项所述的方法。

技术总结
本申请提供一种数据聚类方法、装置、计算机设备及存储介质,用于解决数据聚类的准确性较低的问题。该方法包括:获取各个第一聚类结果;基于预设的关联关系挖掘策略,对所述各个目标车辆行驶数据,以及在所述预设时间段内产生的各个参考车辆行驶数据进行挖掘处理,获得目标车辆行驶数据与参考车辆行驶数据之间的多个关联关系,其中,所述各个参考车辆行驶数据各自包含的车牌数据,与所述各个目标车辆行驶数据各自包含的车牌数据匹配;基于所述多个关联关系和所述各个第一聚类结果,对所述目标车辆行驶数据进行目标聚类处理,获得至少一个目标聚类结果。目标聚类结果。目标聚类结果。


技术研发人员:江中毅 刘备 张宏 陈立力 周明伟
受保护的技术使用者:浙江大华技术股份有限公司
技术研发日:2022.04.12
技术公布日:2022/7/12
当前第2页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1