一种对象匹配方法和电子设备、存储介质与流程

文档序号:33647552发布日期:2023-03-29 05:18阅读:38来源:国知局
一种对象匹配方法和电子设备、存储介质与流程

1.本技术涉及数据处理领域,特别是涉及一种对象匹配方法和电子设备、存储介质。


背景技术:

2.现有的匹配模型较多采用规则式匹配算法,在利用规则式匹配算法对样本进行两两匹配时,对样本中的属性按顺序进行逐一比较。例如,对于对象a和b,其属性分别是(a1,a2,

,an)和(b1,b2,

,bn),在对这2个对象进行比较时,先比较属性a1与b1,若比较通过,则进一步比较属性a2与b2,依次类推,直至an与bn,当且仅当全部属性匹配一致后,该规则式匹配算法才会得出对象a与对象b是相匹配的结果;若在匹配过程中,某一对属性ax与bx(x《n)是不相匹配,则直接放弃对象a与b的匹配过程,并视为这2个对象是不匹配的,从而开始下一组对象(如a与c)的匹配过程,直至从样本集中找出与对象a相匹配的一个或多个对象。该匹配算法在遇到某一对属性不匹配时,则直接放弃剩余属性的比较,并视这2个对象为不匹配,容易导致错失潜在相适合的匹配对象,导致结果错配。


技术实现要素:

3.本技术至少提供一种对象匹配方法和电子设备、存储介质,能够提升匹配准确度。
4.本技术第一方面提供了一种对象匹配方法,包括:获取目标对象的第一关键属性集和第一非关键属性集,以及,获取各待匹配对象的第二关键属性集和第二非关键属性集,其中,第一关键属性集和第二关键属性集均对应若干关键属性,第一非关键属性集和第二非关键属性集均对应若干非关键属性,关键属性为明确重要性的属性,非关键属性为非明确重要性的属性;利用第一关键属性集和各第二关键属性集,分别获取目标对象与各待匹配对象的第一匹配度;选出第一匹配度满足第一匹配要求的待匹配对象,作为目标对象的候选匹配对象;利用第一非关键属性集和各候选匹配对象的第二非关键属性集,获得目标对象与各候选匹配对象的第二匹配度;选出第二匹配度满足第二匹配要求的候选匹配对象,作为目标对象的预测匹配对象。
5.其中,在利用第一非关键属性集和各候选匹配对象的第二非关键属性集,获得目标对象与各候选匹配对象的第二匹配度之前,还包括:将第一非关键属性集和各候选匹配对象的第二非关键属性集中的各属性值进行归一化处理。
6.其中,第一非关键属性集包含若干非关键属性分别对应的第一属性值;将第一非关键属性集中的各属性值进行归一化处理,包括:分别将各非关键属性的第一属性值除以自身第一属性值,将各非关键属性的相除结果,对应作为经归一化的各非关键属性的第一属性值;和/或,第二非关键属性集中包含若干非关键属性分别对应的第二属性值;将各候选匹配对象的第二非关键属性集中的各属性值进行归一化处理,包括:基于目标对象的各非关键属性的第一属性值和各候选匹配对象的各非关键属性的第二属性值之间的差值,得到归一化分母;以及,从目标对象的各非关键属性的第一属性值和各候选匹配对象的各非关键属性的第二属性值中选出参考属性值;对于各候选匹配对象的各非关键属性,将参考
属性值与非关键属性的第二属性值之间的差值与归一化分母之间的比值,作为经归一化后的非关键属性的第二属性值。
7.其中,基于目标对象的各非关键属性的第一属性值和各候选匹配对象的各非关键属性的第二属性值之间的差值,得到归一化分母,包括:从目标对象的各非关键属性的第一属性值和各候选匹配对象的各非关键属性的第二属性值中查找出最大属性值和最小属性值,将最大属性值与最小属性值之间的差值作为归一化分母;从目标对象的各非关键属性的第一属性值和各候选匹配对象的各非关键属性的第二属性值中选出参考属性值,包括:从目标对象的各非关键属性的第一属性值和各候选匹配对象的各非关键属性的第二属性值中,选出最大属性值作为参考属性值。
8.其中,第一非关键属性集包含若干非关键属性分别对应的第一属性值,第二非关键属性集中包含若干非关键属性分别对应的第二属性值;利用第一非关键属性集和各候选匹配对象的第二非关键属性集,获得目标对象与各候选匹配对象的第二匹配度,包括:对于各候选匹配对象,获取目标对象的各非关键属性的第一属性值与候选匹配对象的各非关键属性的第二属性值之间的属性距离;综合候选匹配对象的各非关键属性对应的属性距离,得到候选匹配对象对应的对象距离;利用候选匹配对象对应的对象距离,得到候选匹配对象与目标对象的第二匹配度,其中,候选匹配对象与目标对象的第二匹配度与候选匹配对象对应的对象距离成反比。
9.其中,第一关键属性集包含若干关键属性分别对应的第一属性值,第二关键属性集包含若干关键属性分别对应的第二属性值;利用第一关键属性集和各第二关键属性集,分别获取目标对象与各待匹配对象的第一匹配度,包括:对于各待匹配对象,检测目标对象的各关键属性的第一属性值与待匹配对象的各关键属性的第二属性值之间的匹配结果,匹配结果用于表示关键属性的第一属性值与第二属性值是否匹配;基于待匹配对象的第二属性值与第一属性值匹配的关键属性的数量,确定目标对象与待匹配对象的第一匹配度,其中,待匹配对象的第一匹配度与待匹配对象的数量成正相关。
10.其中,第一匹配要求为第一匹配度达到匹配阈值;第二匹配要求为第二匹配度最高;和/或,利用第一关键属性集和各第二关键属性集,分别获取目标对象与各待匹配对象的第一匹配度的步骤至选出第二匹配度满足第二匹配要求的候选匹配对象,作为目标对象的预测匹配对象的步骤由匹配模型执行。
11.其中,选出第二匹配度满足第二匹配要求的候选匹配对象,作为目标对象的预测匹配对象之后,还包括:获取反馈的目标对象的实际匹配对象;基于实际匹配对象与预测匹配对象的对比结果,调整匹配模型参数。
12.本技术第二方面提供了一种电子设备,包括相互耦接的存储器和处理器,处理器用于执行存储器中存储的程序指令,以实现第一方面的对象匹配方法。
13.本技术第三方面提供了一种计算机可读存储介质,其上存储有程序指令,程序指令被处理器执行时实现上述第一方面中的对象匹配方法。
14.上述方案,利用匹配模型计算待匹配对象中与目标对象最匹配的预测匹配对象,首先,将目标对象和待匹配对象中的属性分为明确重要性的属性集和未明确重要性的属性集,其次,在匹配模型的第一层,利用明确重要性的属性集对待匹配对象进行筛选,从待匹配对象中选出符合第一匹配要求的对象作为目标对象的候选匹配对象;在匹配模型的第二
层,利用未明确重要性的属性集从候选匹配对象中选出符合第二匹配要求的对象,作为目标对象的预测匹配对象。由此,本技术的对象匹配方法将各属性对待匹配对象匹配结果的重要性程度纳入考量,先基于重要属性进行首层匹配,在重要属性符合匹配要求的情况下继续对其余属性进行第二层匹配,以最终得到对象之间的匹配结果,由此可以避免一开始因非重要性的属性不满足匹配要求,而直接将本该与目标对象匹配的对象判断为不匹配的情况,从错失潜在相适合的匹配对象的问题,故提升了匹配的准确度。
15.进一步地,先基于重要属性进行首层匹配,若重要属性不满足匹配要求,则可以直接确定为对象不匹配,故在保证匹配准确度的同时,也可以提升匹配效率。
16.应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,而非限制本技术。
附图说明
17.此处的附图被并入说明书中并构成本说明书的一部分,这些附图示出了符合本技术的实施例,并与说明书一起用于说明本技术的技术方案。
18.图1是本技术对象匹配方法一实施例的流程示意图;
19.图2是本技术对象匹配方法另一实施例中步骤s120的流程示意图;
20.图3是本技术再一实施例中对目标对象的非关键属性的属性值进行归一化处理的流程示意图;
21.图4是本技术再一实施例中对待匹配对象的非关键属性的属性值进行归一化处理的流程示意图;
22.图5是本技术对象匹配方法再一实施例中步骤s140的流程示意图;
23.图6是本技术对象匹配方法另一实施例的流程示意图;
24.图7是本技术对象匹配方法又一实施例中步骤s640的流程示意图;
25.图8是本技术电子设备一实施例的框架示意图;
26.图9是本技术算机可读存储介质一实施例的框架示意图。
具体实施方式
27.下面结合说明书附图,对本技术实施例的方案进行详细说明。
28.以下描述中,为了说明而不是为了限定,提出了诸如特定系统结构、接口、技术之类的具体细节,以便透彻理解本技术。
29.本文中术语“和/或”,仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,a和/或b,可以表示:单独存在a,同时存在a和b,单独存在b这三种情况。另外,本文中字符“/”,一般表示前后关联对象是一种“或”的关系。此外,本文中的“多”表示两个或者多于两个。
30.现有的规则式匹配算法在对目标对象和待匹配对象进行匹配时,通常是对目标对象和待匹配对象的属性进行逐一匹配。而目标对象和待匹配对象是具有重要性属性和非重要性属性,当匹配到目标对象的非重要性属性和待匹配对象的非重要性属性不匹配时,则放弃对目标对象和待匹配对象的匹配,这就引发了不具有重要性的属性导致的“一票否决”的问题,从而导致结果错配或是错失潜在相适合的匹配对象的问题。为解决上述问题,本申
请提出了一种对象匹配方法,在该对象匹配方法中,将不同重要性属性进行重新组织并形成属性集,之后利用匹配模型依据属性集对目标对象和各待匹配对象进行双层匹配,利用这种方法,使得匹配模型可以在目标对象和各待匹配对象的匹配过程中把资源都集中在属性空间分布上,这样可避免不具有重要性的属性造成的匹配结果错配问题,也可以避免算力浪费,从而获得一个具有匹配偏差较低以及更为经济的匹配模型,实现1+1》2的优化效果。
31.在一些实施例中,该对象匹配方法还可以基于knn(k-nearestneighbor,邻近算法)和boosting(提升算法)方法,设计一种用于本技术匹配方法的匹配模型,以实现下述实施例中的双层匹配过程。
32.请参阅图1,图1是本技术对象匹配方法一实施例的流程示意图。
33.具体而言,可以包括如下步骤:
34.步骤s110:获取目标对象的第一关键属性集和第一非关键属性集,以及,获取各待匹配对象的第二关键属性集和第二非关键属性集。
35.其中,第一关键属性集和第二关键属性集均对应若干关键属性,第一非关键属性集和第二非关键属性集均对应若干非关键属性,关键属性为明确重要性的属性,非关键属性为非明确重要性的属性。
36.本文中的对象匹配方法,可利用匹配模型从待匹配对象中选出与目标对象相似度或是匹配度最高的一个对象。其中,关于关键属性集和非关键属性集其不仅包括属性,也包括各属性对应的属性值,对于目标对象和待匹配对象其在同一属性下的属性值是可以不相同的。此外,该对象匹配方法可以应用于问答检索系统,利用该对象匹配方法检索出与问题相匹配的答案;或者,该对象匹配方法也可以应用于图片识别,利用该对象匹配方法对图片进行识别归类;又或者,该对象匹配方法也可应用于项目、工程的招标或是对业务数据进行匹配等。因此,关于本技术的对象匹配方法的应用场景和应用领域,在此不作具体的限定。
37.其中,在本实施例中,利用第一关键属性集和各第二关键属性集,分别获取目标对象与各待匹配对象的第一匹配度的步骤至选出第二匹配度满足第二匹配要求的候选匹配对象,作为目标对象的预测匹配对象的步骤由匹配模型执行。
38.在一些实施例中,目标对象的第一关键属性集中的关键属性与各待匹配对象的第二关键属性集中的关键属性是相同的,第一关键属性集和第二关键属性集中分别包含若干相同关键属性分别对应的属性值,即第一关键属性集包含若干关键属性分别对应的第一属性值,第二关键属性集中包含上述若干关键属性分别对应的第二属性值。同理地,目标对象的第一非关键属性集中的非关键属性与各待匹配对象的第二非关键属性集中的非关键属性也是相同的,第一非关键属性集和第二非关键属性集中分别包含若干相同非关键属性分别对应的属性值,即第一非关键属性集包含若干非关键属性分别对应的第一属性值,第二非关键属性集中包含上述若干非关键属性分别对应的第二属性值。例如,目标对象a对应的属性集包含k各属性的属性值,待匹配对象b对应的属性集同样包含该k个属性的属性值。通过从该k个属性中确定关键属性和非关键属性,从而将各对象的属性集均划分为关键属性集和非关键属性集。具体如,k个属性中包含n个关键属性和m个非关键属性,目标对象a的第一关键属性集包含n个关键属性的第一属性值如第一属性值如待匹配对象b
的第二关键属性集包含前述n个关键属性的第二属性值如其中,p表示关键属性。目标对象a的第一非关键属性集包含m个非关键属性的第一属性值如中,p表示关键属性。目标对象a的第一非关键属性集包含m个非关键属性的第一属性值如待匹配对象b的第二关键属性集包含前述m个非关键属性的第二属性值如其中,up表示非关键属性。
39.步骤s120:利用第一关键属性集和各第二关键属性集,分别获取目标对象与各待匹配对象的第一匹配度。
40.该步骤处于匹配模型的第一层,利用关键属性集确定目标对象与待匹配对象的初始匹配度,进而基于该初始匹配度可以查找出匹配可能性更高的待匹配对象,另外,也可以过滤与目标对象不相匹配的待匹配对象,从而解决了未对各属性对匹配结果的重要性程度纳入考量,而导致的错配问题。具体地,可以将该初始匹配度满足第一匹配要求的待匹配对象确定为匹配可能性更高的待匹配对象,也可以将该初始匹配度不满足第一匹配要求的待匹配对象直接舍弃,也即过滤掉与目标对象不相匹配的待匹配对象。
41.在一些实施例中,可将目标对象的第一关键属性集中的每个关键属性的属性值逐一与各待匹配对象第二关键属性集对应的关键属性的属性值进行匹配,并计算匹配成功的关键属性数量占关键属性集的百分比,并将该百分比设为第一匹配度。
42.在另一些实施例中,则可以待匹配对象中的匹配成功的关键属性数量为第一匹配度。请参考图2,图2是本技术对象匹配方法另一实施例中步骤s120的流程示意图。具体步骤如下:
43.步骤s121:对于各待匹配对象,检测目标对象的各关键属性的第一属性值与待匹配对象的各关键属性的第二属性值之间的匹配结果,匹配结果用于表示关键属性的第一属性值与第二属性值是否匹配。
44.步骤s122:基于待匹配对象的第二属性值与第一属性值匹配的关键属性的数量,确定目标对象与待匹配对象的第一匹配度。
45.其中,待匹配对象的第一匹配度与待匹配对象的数量成正相关。
46.在一些实施例中,一待匹配对象的第二属性值与第一属性值相匹配,则该待匹配对象的第二属性值对应的关键属性与目标对象对应的关键属性是相匹配的。以此,统计待匹配对象的中关键属性匹配成功的数量,作为待匹配对象的第一匹配度。
47.可以理解的是,第一匹配度是基于第一关键属性集和第二关键属性集计算的,其计算方法在此处不做具体的限定。
48.步骤s130:选出第一匹配度满足第一匹配要求的待匹配对象,作为目标对象的候选匹配对象。
49.在一些实施例中,可将第一匹配要求可设置为第一匹配度达到匹配阈值。若待匹配对象的统计的关键属性匹配成功的数量符合匹配阈值,则该匹配对象可视为与目标对象匹配度更高的对象,并且该待匹配对象可进入匹配模型的第二层。若待匹配对象的统计的关键属性匹配成功的数量与匹配阈值不符合,则该匹配对象不能进入匹配模型的第二层,并且将其第一匹配度进行清零。
50.步骤s140:利用第一非关键属性集和各候选匹配对象的第二非关键属性集,获得目标对象与各候选匹配对象的第二匹配度。
51.在一些实施例中,可以获取目标对象的第一非关键属性集中的每个非关键属性的属性值分别与各候选匹配对象的第二关键属性集的对应非关键属性的属性值之间的差异,基于每个非关键属性对应的属性值差异得到第二匹配度。
52.请结合参阅图5,图5是本技术对象匹配方法再一实施例中步骤s140的流程示意图。关于第二匹配度计算的具体步骤包括:
53.步骤s141:对于各候选匹配对象,获取目标对象的各非关键属性的第一属性值与候选匹配对象的各非关键属性的第二属性值之间的属性距离。
54.本实施例中,可以利用欧式距离计算方法计算该属性距离,例如,对于每个非关键属性,计算该候选匹配对象中关于该非关键属性的第二属性值与目标对象关于非关键属性的第一属性值之间的欧式距离,作为该候选匹配对象与目标对象关于非关键属性的属性距离。
55.步骤s142:综合候选匹配对象的各非关键属性对应的属性距离,得到候选匹配对象对应的对象距离。
56.例如,可以将该候选匹配对象的各非关键属性对应的属性距离进行预设统计处理,将预设统计处理结果作为该候选匹配对象对应的对象距离。其中,该预设统计处理例如为求和、加权求和、加权平均等。
57.在一些实施例中,可以利用欧式距离计算方法计算各候选匹配对象的每个非关键属性与目标对象对应的非关键属性的属性距离。对于每个候选匹配对象,再利用曼哈顿距离计算方法将该候选匹配对象的每个非关键属性的属性距离进行累加,得到该候选匹配对象对应的对象距离。
58.在另一些实施例中,可将目标对象的各非关键属性的第一属性值集中的第一属性值集合成一坐标集,将各候选匹配对象的各非关键属性的第二属性值也集合成一坐标集。利用欧式距离计算各候选匹配对象的坐标集与目标对象的坐标集之间的距离,且该距离为各候选匹配对象与目标对象的对象距离。对于对象距离的计算方法可以是欧氏距离计算方法,也可以是切比雪夫距离计算方法,在此不作具体限定。
59.步骤s143:利用候选匹配对象对应的对象距离,得到候选匹配对象与目标对象的第二匹配度。
60.其中,候选匹配对象与目标对象的第二匹配度与候选匹配对象对应的对象距离成反比,即候选匹配对应的对象距离越大,则与目标对象的第二匹配度则越小。在一具体应用中,可以将候选匹配对象对应的对象距离进行预设运算,将预设运算结果作为该候选匹配对象与目标对象的第二匹配度,该预设运算例如为求倒数。
61.步骤s150:选出第二匹配度满足第二匹配要求的候选匹配对象,作为目标对象的预测匹配对象。
62.在一些实施例中,第二匹配要求为在第二匹配度从高到低排序,第二匹配度位于前i位,该i可以根据实际情况进行设置,例如为1或大于1的整数为匹配模型输出结果。
63.在一些实施例中,在前述步骤s130之后且步骤s140之前,为了便于后续第二匹配度的计算,将目标对象和候选匹配对象的非关键属性的属性值进行归一化处理。
64.请结合图3,图3是本技术再一实施例中对目标对象的非关键属性的属性值进行归一化处理的流程示意图。对目标对象的归一化处理步骤如下:
65.步骤s1311:将第一非关键属性集和各候选匹配对象的第二非关键属性集中的各属性值进行归一化处理。
66.步骤s1312:分别将各非关键属性的第一属性值除以自身第一属性值,将各非关键属性的相除结果,对应作为经归一化的各非关键属性的第一属性值。
67.在匹配模型的第二层,对目标对象的第一非关键属性集进行归一化处理。将目标对象的第一非关键属性集的第一属性值除以其自身对应的第一属性值,则经归一化处理后目标对象的第一非关键属性集的第一属性值都为1。其中,也可对目标对象的整体属性集进行归一化处理,并从经归一化处理的整体属性集中选取第一非关键属性集部分。
68.在对目标对象进行归一化处理后,也可对进入匹配模型第二层的候选匹配对象进行归一化处理。请参阅图4,图4是本技术再一实施例中对待匹配对象的非关键属性的属性值进行归一化处理的流程示意图。对候选匹配对象进行归一化处理的步骤如下:
69.步骤s1321:基于目标对象的各非关键属性的第一属性值和各候选匹配对象的各非关键属性的第二属性值之间的差值,得到归一化分母。
70.在一些实施例中,从目标对象的各非关键属性的第一属性值和各候选匹配对象的各非关键属性的第二属性值中查找出最大属性值和最小属性值,将最大属性值与最小属性值之间的差值作为归一化分母。
71.在另一些实施例中,也可从各候选匹配对象的各非关键属性的第二属性值中查找出最大属性值和最小属性值,将最大属性值与最小属性值之间的差值作为归一化分母。
72.步骤s1322:从目标对象的各非关键属性的第一属性值和各候选匹配对象的各非关键属性的第二属性值中选出参考属性值。
73.在一些实施例中,从目标对象的各非关键属性的第一属性值和各候选匹配对象的各非关键属性的第二属性值中,选出最大属性值作为参考属性值。
74.在另一些实施例中,也可从各候选匹配对象的各非关键属性的第二属性值中,选出最大属性值作为参考属性值。
75.步骤s1323:对于各候选匹配对象的各非关键属性,将参考属性值与非关键属性的第二属性值之间的差值与归一化分母之间的比值,作为经归一化后的非关键属性的第二属性值。
76.在完成待匹配对象的非关键属性的第二属性值归一化处理后,再对进入匹配模型第二层的其他待匹配对象的同一非关键属性下的第二属性值进行归一化处理。
77.在完成所有进入匹配模型第二层的待匹配对象的同一非关键属性的第二属性值的归一化处理后,重复上述步骤,对所有进入匹配模型第二层的待匹配对象的其他各非关键属性的第二属性值都进行归一化处理。
78.可以理解的是,对目标对象和各候选匹配对象的非关键属性的属性值进行归一化处理后,步骤s140可以利用经过归一化处理后的非关键属性的属性值计算上述第二匹配度。
79.在一具体应用场景中,在问答检索系统中输入问题“中国一线城市有哪些”,即“中国一线城市”为目标对象。根据目标对象“中国一线城市”所具备的属性中可知,关键属性为常住人口、地区全年生产总值,非关键属性为城市占地面积、拥有的高楼数量。则目标对象“中国一线城市”的第一关键属性集包含:对应常住人口的第一属性值为2000万以上,对应
地区全年生产总值的第一属性值为:100亿以上;该“中国一线城市”的第一非关键属性集包含:对应城市占地面积的第一属性值为1000平方公里以上、对应拥有的高楼数量的第一属性值为100以上。待匹配对象为数据库中的各待选城市,其中各待选城市的第二关键属性集与第一关键属性集的关键属性相同,各待选城市的第二非关键属性集与第一非关键属性集的非关键属性相同。
80.数据库中的待选城市有10个,以待选城市a为例,待选城市a第二关键属性集包含:对应常住人口的第二属性值为2200万,对应地区全年生产总值的第二属性值为:120亿;第二非关键属性集包含:对应城市占地面积的第二属性值为1200平方公里、对应拥有的高楼数量的第二属性值为120。
81.将这10个待选城市输入匹配模型的第一层中,在匹配模型的第一层的第一匹配要求为关键属性匹配成功的数量阈值为2。首先,对待选城市a进行计算,将待选城市a的第二关键属性集常住人口的第二属性值2200万与目标对象“中国一线城市”对应的第一属性值为2000万以上相匹配,待选城市a第二关键属性集应常住人口的第二属性值与目标对象“中国一线城市”对应的第一属性值是相匹配的,故在待选城市a的第一匹配度上加1。之后对待选城市a第二关键属性集对应地区全年生产总值的第二属性值120亿与目标对象“中国一线城市”对应的第一属性值为100亿以上相匹配,结果为待选城市a的关键属性地区全年生产总值匹配成功,并对待选城市a的第一匹配度再加上1。统计待选城市a在匹配模型第一层的第一匹配度为2,符合第一匹配要求,则将待选城市a进入匹配模型第二层。同理,对剩余的9个待选城市进行与待选城市a相同的处理。其中,上述关键属性、非关键属性和阈值可以由用户设置、或者由设备是根据经验设置或者是其他方法设置的,在此不作具体限定。
82.经过匹配模型第一层的处理,进入匹配模型第二层待选城市为待选城市a、待选城市b和待选城市c。其中,待选城市b的第二非关键属性集包含:对应城市占地面积的第二属性值为1000平方公里、对应拥有的高楼数量的第二属性值为90;待选城市c的第二非关键属性集包含:对应城市占地面积的第二属性值为900平方公里、对应拥有的高楼数量的第二属性值为110。
83.在匹配模型第二层,第二匹配要求为排名前两位的城市,先对目标对象、待选城市a、待选城市b和待选城市c关于非关键属性进行归一化处理。首先对于,目标对象的第一非关键属性集包含:对应城市占地面积的第一属性值为1000平方公里以上、对应拥有的高楼数量的第一属性值为100以上,除以其自身的属性值,则目标对象经归一化处理后城市占地面积的第一属性值为1,拥有的高楼数量的第一属性值为1。其次,对待选城市a、待选城市b和待选城市c进行归一化处理。首先,将目标对象、待选城市a、待选城市b和待选城市c在非关键属性城市占地面积的属性值集合成集合f1(1000,1200,1000,900)。从集合f1选取最大值和最小值之差为归一化分母,则归一化分母为300;将的待选城市a城市占地面积的第一属性值与集合f1中的最大值之差为归一化分子,则分子为0。得出待选城市a城市占地面积的第二属性值归一化后为0,同理,待选城市b城市占地面积的第二属性值归一化后为2/3,待选城市c城市占地面积的第二属性值归一化后为1。此外,再对待选城市a、待选城市b和待选城市c的非关键属性拥有的高楼数量的第二属性值进行归一化处理。得到待选城市a非关键属性拥有的高楼数量的第二属性值归一化后为0,待选城市b非关键属性拥有的高楼数量的第二属性值归一化后为1,待选城市c非关键属性拥有的高楼数量的第二属性值归一化后
为1/3。
84.对经归一化后的目标对象、待选城市a、待选城市b和待选城市c的非关键属性整理为坐标集,则目标对象的坐标集为(1,1),选城市a的坐标集为(0,0),待选城市b的坐标集为(2/3,1),待选城市c的坐标集为(1,1/3)。利用欧式距离计算待选城市a、待选城市b和待选城市c坐标集到目标对象的坐标集的对象距离,待选城市a到目标对象的对象距离为待选城市b到目标对象的对象距离为1/3,待选城市c到目标对象的对象距离为2/3。其中,根据对象距离对进行待选城市a、待选城市b和待选城市c进行递增排序,待选城市b<待选城市c<待选城市a。根据第二匹配要求,待选城市b和待选城市c入选中国一线城市。
85.请参阅图6,图6是本技术对象匹配方法另一实施例的流程示意图。
86.护体步骤如下:
87.步骤s610:获取目标对象和各待匹配对象的关键属性集和非关键属性集。
88.其中,目标对象和各待匹配对象具有相同属性集合,关键属性集对应若干关键属性,非关键属性集均对应若干非关键属性,关键属性为明确重要性的属性,非关键属性为非明确重要性的属性。
89.该步骤与上述步骤s110相同,在此处不再作过多赘述。
90.步骤s620:基于关键属性集,利用匹配模型分别获取目标对象与各待匹配对象的第一匹配度,并利用第一匹配度满足第二匹配要求,选出目标对象的候选匹配对象。
91.该步骤与上述步骤s120和s130相同,在此处不再作过多赘述。
92.步骤s630:基于非关键属性集,利用匹配模型获得目标对象与各候选匹配对象的第二匹配度,并利用第二匹配度满足第二匹配要求,选出目标对象的预测匹配对象。
93.该步骤与上述步骤s140和s150相同,在此处不再作过多赘述。
94.步骤s640:对预测匹配对象进行分析,并将分析结果反馈至匹配模型。
95.请参阅图7,图7是本技术对象匹配方法又一实施例中步骤s640的流程示意图。具体步骤如下:
96.步骤s641:获取反馈的目标对象的实际匹配对象。
97.步骤s642:基于实际匹配对象与预测匹配对象的对比结果,调整匹配模型参数。
98.在一些实施例中,业务人员使用该匹配模型的得到业务数据的匹配结果后,对该匹配结果进行分析。若该匹配结果并不是目标对象最匹配的待匹配对象,则根据分析结果对该匹配模型的参数进行调整。具体地,可根据分析结果增大步骤s620和步骤s630中属性的权重,或是根据分析结果在关键属性集或非关键属性即增加新的属性。
99.在一具体应用场景中,目标对象a可以为一资产方的一个项目,目标对象a需要招标,投标公司集合成待匹配对象b(b1,b2,

,bn)。利用本技术的对象匹配方法,第一步骤:将目标对象a的招标要求中的重要要求集合成明确重要性属性的属性集合c(例如,企业注册资本、企业固定资本等),将目标对象a的招标要求中未明确重要性的要求集合成无法给出明确重要性属性的属性集合d,其中,待匹配对象b中的每个投标公司都具有属性集合c和属性集合d中的所有属性。其中,属性集合c和属性集合d中的属性可以根据经验设置。
100.第二步骤:利用对象匹配方法中的第一层匹配模型基于属性集合c,初步筛选不相适合的投标公司。通过目标对象a与待匹配对象b中每个属性按照一一匹配原则。若目标对象a中要求企业注册资本为一百万以上(其中,一百万为属性值),待匹配对象b中一投标公
司b1的企业注册资本为二百万(其中,二百万为属性值),则投标公司b1企业注册资的属性值符合目标对象a企业注册资本的属性值的要求,则投标公司b1的企业注册资属性与目标对象a的企业注册资本属性相匹配,并在投标公司b1的第一匹配度上加1,再对投标公司b1关于属性集合c中的另一个明确重要性的属性与目标对象a进行匹配;若在投标公司b1的一个明确重要性的属性与目标对象a没匹配上,则投标公司b1的第一匹配度上加0,完成投标公司b1关于属性集合c中所有属性与目标对象a的匹配计算。对投标公司b1的第一匹配度进行统计,最后统计为6,在第一层匹配模型中预设第一匹配要求为匹配阈值大于或等于5,则投标公司b1的第一匹配度为6达到匹配阈值,则可进入第二层匹配模型;若没有达到匹配阈值,则不能进入第二层匹配模型,并且将其第一匹配度清零。以此计算待匹配对象b中所有的投标公司是否符合第一匹配要求。其中,属性匹配阈值的选取也可以根据业务经验设置。
101.第三步骤:将待匹配对象b中进入第二层匹配模型的投标公司集合成集合e(e1,e2,

,ek),k≤n。先对目标对象a进行归一化处理,将目标对象a关于属性集合d的属性值除以目标对象a自身关于属性集合d的属性值,得到目标对象a关于属性集合d的属性值全为1。再对集合e归一化处理,先取集合e和目标对象a在属性集合d中同一属性下的所有属性值集合成集合f,将集合f中最大值和最小值之间的差值作为归一化分母,将集合f中最大值与投标公司e1在属性集合d该属性下的属性值之间差值为归一化分子,将归一化分子除以归一化分母,得到投标公司e1在该属性下的归一化后的第二属性值。再利用相同的方法计算投标公司e1在属性集合d另一属性下的归一化后的第二属性值。之后求得投标公司e1在属性集合d下的所有归一化值,得到投标公司e1关于属性集合d的属性值全0与1之间的小数。
102.第四步骤:可利用欧式距离计算集合e中每个经过归一化处理的投标公司的第二属性值与目标对象a归一化后的第一属性值之间的对象距离,并将该对象距离作为第二匹配度,其中,对象距离越小第二匹配度越高。
103.第五步骤:重复第三步骤和第四步骤,直至集合e中每个投标公司都与目标对象a对应进行欧式距离计算。这样就获得了目标对象a与待匹配对象b之间的匹配度集合,对该集合中数据进行递增排序,第二匹配度最小的排第一位,第二匹配度最大的排最后一位。
104.第六步骤:待业务人员使用匹配模型的输出结果后,可以将实际的匹配结果与匹配模型的输出结果进行对比,并将对比结果作为反馈信息反馈给匹配模型,根据反馈信息可以调整在第三步骤和第四步骤中计算过程的属性集合d中某些属性的权重,或者是根据反馈信息在属性集合d中增加新的属性。
105.本实施例中,通过引入双层匹配模型,并结合实务中的业务经验,使得改进后的匹配算法更有的放矢地去优先匹配具有明确重要性的属性。并且在本方法中,匹配模型的建立后便可直接进行使用,无需进行训练和验证,从而摆脱了原有匹配算法中训练集和验证集的无差别逐个属性匹配导致的匹配效率低、偏差大的问题。
106.此外,改进后的匹配模型增加了反馈调优机制,匹配模型在使用的过程中,若匹配模型输出的匹配结果与实际的业务数据不相符合,则可通过反馈调优机制对匹配模型直接进行调整。也可以通过建立业务实务数据反哺模型,让匹配模型不断进行自我修正,不断提升匹配准确度。
107.本技术中,双层匹配思想的引入有效的解决业务经验在匹配模型计算过程中由于非重要性对匹配模型的影响问题,并且该方法还解决了knn算法中需要划分训练集和验证
集,将业务录入的待匹配对象b作为业务经验训练出带有类别标签的已知类别对象。通过双层匹配模型克服了原先匹配模型通过属性一一匹配导致的属性值顺序对模型的影响。并且通过归一化实现第二层匹配模型的匹配值评价维度统一性。更重要的是增加了反馈机制,实现业务使用匹配模型的匹配结果后能够有有效的反馈,以及这些反馈信息可直接用于匹配模型的调优。
108.本领域技术人员可以理解,在具体实施方式的上述方法中,各步骤的撰写顺序并不意味着严格的执行顺序而对实施过程构成任何限定,各步骤的具体执行顺序应当以其功能和可能的内在逻辑确定。
109.请参阅图8,图8是本技术电子设备80一实施例的框架示意图。电子设备80包括相互耦接的存储器81和处理器82,处理器82用于执行存储器81中存储的程序指令,以实现上述任一对象匹配方法实施例的步骤。在一个具体的实施场景中,电子设备80可以包括但不限于:微型计算机、服务器,此外,电子设备80还可以包括笔记本电脑、平板电脑等移动设备,在此不做限定。
110.具体而言,处理器82用于控制其自身以及存储器81以实现上述任一对象匹配方法实施例的步骤。处理器82还可以称为cpu(central processing unit,中央处理单元)。处理器82可能是一种集成电路芯片,具有信号的处理能力。处理器82还可以是通用处理器、数字信号处理器(digital signal processor,dsp)、专用集成电路(application specific integrated circuit,asic)、现场可编程门阵列(field-programmable gate array,fpga)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。另外,处理器82可以由集成电路芯片共同实现。
111.请参阅图9,图9为本技术计算机可读存储介质90一实施例的框架示意图。计算机可读存储介质90存储有能够被处理器运行的程序指令901,程序指令901用于实现上述任一对象匹配方法实施例的步骤。
112.在一些实施例中,本公开实施例提供的装置具有的功能或包含的模块可以用于执行上文方法实施例描述的方法,其具体实现可以参照上文方法实施例的描述,为了简洁,这里不再赘述。
113.上文对各个实施例的描述倾向于强调各个实施例之间的不同之处,其相同或相似之处可以互相参考,为了简洁,本文不再赘述。
114.在本技术所提供的几个实施例中,应该理解到,所揭露的方法和装置,可以通过其它的方式实现。例如,以上所描述的装置实施方式仅仅是示意性的,例如,模块或单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性、机械或其它的形式。
115.另外,在本技术各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
116.集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可
以存储在一个计算机可读取存储介质中。基于这样的理解,本技术的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)或处理器(processor)执行本技术各个实施方式方法的全部或部分步骤。而前述的存储介质包括:u盘、移动硬盘、只读存储器(rom,read-only memory)、随机存取存储器(ram,random access memory)、磁碟或者光盘等各种可以存储程序代码的介质。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1